好主意不是好营销:用好数据,卖货给力
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

一、“火爆”的大数据

说起数据类型,你可能脑海中第一个蹦出的词就是“大数据”。几年前,你可能会因为没有听说过这个词而被鄙视“落伍”,今天就不会了。一个原因是没听过的人越来越少,另一个原因是大家太熟悉这个词了,就不再觉得了解大数据是什么了不起的事情。

打开百度指数(一个反映网民在网络上搜索关键词的搜索量趋势的免费工具)搜索关键词“大数据”,可以清晰地看到它在国内的热度趋势(见图1-4)。自2012年起,这个词以燎原之势火遍全国。到2018年,这个趋势开始放缓,除偶尔因为特殊新闻事件导致的搜索量激增外,慢慢成为一个常态化的搜索量级。

图1-4 百度指数搜索关键词:大数据

这个概念最早在国内火起来,是因为美剧《纸牌屋》。有人甚至用“巫术一般的精准”来形容在这个剧的创作过程中,大数据起到的作用。

据说,《纸牌屋》的数据库拥有超过3000万用户的收视选择数据,还有几百万条评论和主题搜索数据等。节目拍什么、谁来拍、谁来演、怎么播,都是基于对这些数据的分析统计来决定的。无论是用户研究、内容偏好,还是内容转化,都有数据的引导,从而实现了内容创造的C2B(Customer to Business),也就是“由用户需求决定内容生产”。

这个在当时看来神奇、神秘又带着高科技光环的故事瞬间点燃了这个概念的热度。那段时间,打开知乎(一家网络问答社区和内容创作平台),大数据的问题俯拾皆是。很多不同行业的人士都纷纷提出了类似的问题:

游戏行业,大数据该如何应用?

大数据在金融行业有哪些应用前景?

大数据在石油行业可以干什么?

大数据在电信行业的应用目前的状况如何?

大数据会如何改变管理咨询行业?

大数据在铁路行业的应用是什么?

大数据会对审计行业形成冲击吗?审计行业是否会因此而消失?

大数据对财务行业会产生什么样的影响?

传统行业如何搭建大数据团队?

…………

不是“怎么用”,就是“未来会怎样”,或者“如何搭建团队”。

由于关注度居高不下,便出现了很多“蹭热度”的行为。比如披着大数据的外衣来吸引眼球,其实只是用了“大量的数据”,东拼西凑了一些信息,推出一些似是而非的结论。或者打着大数据的旗号,其实只是为了宣传自身的产品或品牌。

大数据之所以叫大数据,是因为它有五大特性,由IBM公司提出。这五大特性也称为5V理论,是由五个以字母V开头的单词组成的,分别是:

• 大量(Volume),指数据量巨大。

• 高速(Velocity),指时效性很好。不像部分数据类型的获取周期比较长,有的时候昨天产生的大数据,今天就能够拿到。

• 多样(Variety),指维度很多。有的数据类型只有单一维度或少量的分析维度,但大数据不仅数据量巨大,其中包含的维度也很多,方便大家进行多角度的分析思考。

• 价值(Value),指数据背后的分析价值和研究意义。

• 真实(Veracity),大数据都是基于自然产生的事实数据,这些数据原始不虚,没有经过二次加工。

当数据同时具备这5个特性的时候,就可以称之为大数据。比如说我们耳熟能详的很多平台,像阿里、腾讯、百度等,都是拥有大数据的。

以每年“双十一”的淘宝数据为例,“双十一”前后的平台数据量是非常巨大的,绝对是“大量”的数据。它的时效性也很强,当天的数据,平台很快就可以进行整体分析了,很“高速”。数据的维度也很多元,有销量数据、热门购买时间分布、价格趋势、收藏趋势、退货数据等,是“多样”的。数据的商业价值也毋庸置疑,你可以从中看到国人消费重点的变化,看到不同企业的产品兴衰,看到不同品类的特点等,是有“价值”的。最后,这些都是源自用户真实行为产生的数据,也就是事实数据,是“真实”的。

大数据本身固然价值非凡,但基于企业的需求和成本考虑,以及我看到的一些大数据“神话”的现象,我在这里想泼一点“冷水”。

以前面说到的《纸牌屋》为例。更准确一点的说法也许是:大数据分析是《纸牌屋》成功的必要条件,而非充分必要条件。与其说是大数据成就了《纸牌屋》,不如说是《纸牌屋》大大提高了“大数据”的影响力。

原因有以下三点。

首先,数据确实能帮助制作方了解用户的过往内容偏好。但是用户曾经喜欢不代表未来也会喜欢。未来有无数种可能性,人们未来的口味太难预估。到底拍什么样的故事、选什么演员会火,依然需要制片方和导演的经验、直觉,以及赌徒式的决断。

其次,数据能够帮助制作方实时了解用户对已播剧集的喜好,从而优化未来的剧集内容。但是数据无法完全代替创意,再好的故事梗概如果遇上不好的内容编辑,依然会被埋没。

最后,数据是“死”的,通过数据得出什么结论要靠人。同样的数据,不同的人可能会得出完全不同的结论。因此,客观存放在那里的数据,背后的价值能否被挖掘,以及能被挖掘出多少,也有很大的不确定性。

有的人会误以为掌握海量数据就等于拥有了数据分析的能力,这是不对的。其实,就连《纸牌屋》的编剧约翰·曼凯维奇对中国用户热议的“纸牌屋通过大数据大获成功”的观点也觉得莫名其妙,并坚决否认。他曾在接受《北京青年报》采访时明确表示:“一部剧的走红,关乎导演、演员,更关乎有创意有深度的故事与讲述故事的手法,但市场本身充满了偶然性,并非数据能够算出的。”

数据都是要靠“人”来分析的,就算是前面谈到的蚂蚁金服集团的“数据驱动业务”案例,前期的建模和迭代也依然要靠“人”来打好基础。

大数据确实有用,但可能并没有你想象中的“那么”有用。