第 51 节 大数据定义:大数据到底有多大?(第1页)

大数据定义:大数据到底有多大?

大家好,我是姚余梁,欢迎来到我的生活中的管理学节目。

今天我给大家讲一讲,大数据到底有多大?

我做了一辈子的数据分析方面的研究。我记得我在做博士论文的时候拿到了一批数据,当时的数据拷在了一张 CD 盘上,有 600 多兆。我那个时候愁得我简直是没有办法,因为找不到一台计算机能够处理 600 多兆的数据。而今天,我分析的数据经常都是几个 G 甚至几十个 G,很轻松,计算机上来就可以分析。

大家都在说大数据时代已经降临了,到底怎么定义大数据呢?是 600 兆就是大数据了呢?还是几个 G 或者几十个 G 才算大数据呢?

在我具体讲大数据的定义之前,我给大家举几个统计数字,看一看现在的大数据到底有多大。

我这个数据是 2017 年、2018 年左右的数据。全球互联网用户有 37 亿人,平均每秒钟谷歌就要提供 4 万个搜索,算下来一天有 35 亿次的搜索量。再看一看社交网络上面,美国 step chat 用户每分钟就会分享超过 50 万张照片,YouTube 上面用户每分钟会看超过 400 万次的视频录像,在推特上面每分钟大概也有将近 50 万的推特发出来。这些说明每分钟、每一小时都有海量的数据在生成。

回到我们前面说的怎么样定义大数据,一般来说,在业界里头我们把大数据定义为四个 V。

第一个 V 就是 Volume,就是它的量。

但是业界也没有给出一个准确的数字,比如 4G 以上就是大数据 4G 以下就是小数据。但大数据一定要够量,就说大数据这个量一定大到了一定程度,我们在做各种各样的数据分析的时候都不会因为数据少而做不了这个数据分析。

这就是一个大数据的一个标准的特征之一。

大数据的第二个 V 就叫 Variety。

Variety 就是指大数据包括不光光是传统意义上面的 123456 的数字,也包括文字、图像、录像、声音等等。

也就是说大数据是多样性的。

大数据的第三个 V 叫 Velocity,就是大数据的速度。

这个速度是指数据的生成和处理的速度,一般来说,我们认为大数据都是实时的数据,随时生成的数据随时都可以分析处理。
(本章节未完结,点击下一页翻页继续阅读)