微瑞思创CTO周像金专访:大数据需求方、供给方及从业者走过的2016

20
1月

本文为大数据媒体年关策划活动《大数据的2016,我的2016》系列稿件。敬请期待春节后的2月16日,由数据猿与中欧商学院、腾讯视频共同举办的高端领袖线下演讲栏目中欧微论坛之《超声波》

很多人都知道,Gartner每年都会发表一个著名的技术成熟度曲线图,大数据行业从2011开始出现,到2013年达到顶峰,然后自2014年之后的2015年和2016年,就再也没有出现在Gartner的技术成熟度曲线图上。大数据自2015年从曲线上消失了。

这一改变表明了,对大数据概念的炒作已经进入了尾声,大数据已经融入到了各行各业中,企业不仅仅关注概念,而是更加关注数据如何结合应用场景产生实际价值,这个也是目前大数据行业的共识。

图为:2014年Garnter技术成熟度曲线图

图为:2016年Garnter技术成熟度曲线图

笔者认为,这个共识更多的说明了大数据行业的“供给侧改革”。在2016年,从数据消费需求端传导至数据生产端,用需求落地如何安全及合法地供给都有着比较明显的体现。总结起来,在2016年大数据行业“供给侧改革”中,作为改革浪潮中大数据的需求方、供给方以及从业者,在这一年有些什么变化呢?


大数据需求方

大数据的需求方在很多业内人士看来,是一个很大的命题,因为大数据本身可服务的范围就很广。目前有较成熟应用场景的行业有政府、医疗、金融、交通等行业。

一方面,在2016年有更多的行业客户,开始投入尝试使用大数据技术,结合到之前的工作流程中去。例如笔者所接触的地产行业,作为信息化相对较弱的行业,从2016年起都开始成立专门的客户数据研究、市场数据研究、运营数据研究等数据相关部门,将大数据技术融入到企业的重要决策流程中。

另一方面,也要认识到现实的情况是,在2016年很多行业的大数据买单者,其实还在较为明显的“头部”效应,真正在大数据应用中持续投入,探索数据价值的,更多的还是行业内排名前10%,甚至不到10%的机构和企业。虽然有些公司成立了客户数据研究部门,但很大比例上还在使用传统的数据采集及调研方式,并没有真正开始较大规模的使用大数据技术。

同时,真正开始利用大数据的需求方,也从之前的只是一两个项目,临时用一下部分的数据,开始更加关心数据从哪里来(是否正规渠道),数据的覆盖范围是多少(是否足够全面),数据的准确度是多少(是否达到可以使用的标准)。他们更加关心数据的质量,以及在数据质量和场景都满足的情况下,是否可以稳定、合法、安全的做成一个长期可使用的产品。

总结而言,2016年大数据需求方,也处在大数据价值的探索期。在还不清楚大数据如何使用的情况下,更愿意尝试多种技术和方法,更加注重大数据在应用中产生的实际价值。


大数据供给方

大数据供给方在目前看来有几个共识,就是海量大数据相对集中在几个核心企业,比如突出的除了政府,就是BAT和电信运营商。

BAT:中国互联网三巨头各自的大数据早已是重中之重的核心部门,但是对外输出的能力和开发的层级,却有不同的特征。

阿里是在2015年开始尝试推动大数据价值输出,也在2016年1月的云栖大会上海峰会中正式宣布开放大数据能力,发布“数加”大数据平台。但在“数加”平台发布之后,阿里的大数据价值输出政策却180度大转向,开始逐步限制使用阿里内部大数据。

与阿里相反,百度的大数据政策从2015年的相对封闭,到2016年开始更加的开放,即提供有关的商业数据程序接口合作,也可以进行数据互换等相关合作。

腾讯则是三巨头中最稳定的,一直没有很好的大数据价值输出平台,2016年略有进步,但是仍然是大数据上最不开放的一个。

同时,BAT在大数据方面有一个共同特征:合作政策变动频繁。可能BAT对大数据如何利用和开放也没有想得很清楚,也就造成很多的商务规则临时调整的概率都非常大。


运营商:如果说在2015年,想要使用运营商数据,基本上还没有任何合法的出口。2016年开始,最早从各个省分公司,到后半年的集团公司,均已经将大数据提升到了另外一个战略高度。目前电信运营商已经将大数据作为核心业务的一个部分来开张。电信,联通早已经在数年前就开始布局集团数据集约化,相关的大数据服务公司和部门,在2016年的业绩均已达到亿元级别。

笔者认为在运营商的数据层面上,移动互联网数据由于受到HTTPS的冲击,信令位置数据将是运营商大数据的一个“杀手锏”。在案例上,上海踩踏事件后,对于特殊时间和区域的实时人群流量监测成为很多城市的共同需求。利用运营商大规模信令数据的离线或者准实时采集,来实现区域人群准实时洞察分析,在2016年已经在各大旅游区、交通枢纽、城市防控区域等进行了广泛的应用。

总结而言,大数据供给方在2016年,相比之前有了跟多的开明开放心态,在保证数据安全和隐私保护的前提下,更加注重数据长期稳定合法的利用和输出。


大数据从业者

笔者接触的行业客户大都是大数据相关负责人,开始接触时很明显感觉有不信任心理,了解一下后抱怨说自己已经见过数十个“大数据”公司,每个人都说自己的技术超强,数据超多,谈到任何问题都可以做,你们的差异到底在哪里?

要回答上面的问题,笔者作为目前大数据行业的从业者,认为大数据企业可以大致分为以下几类:

1、基础平台类:从底层存储DB(关系型数据库、NoSQL数据库),到离线及内存实时数据处理(流式计算、Spark内存运算等),提供私有云或混合云解决方案平台。

2、工具模型类:提供数据可视化展示工具,网站运营数据采集及分析工具,移动营销管理分析工具(Social CRM),数据挖掘模型分析工具等。

3、垂直应用类:以上两种类型的特征是不分行业,垂直应用类则是紧密服务于某一行业的应用产品。目前相对比较成熟的,大数据能够产生现实价值的行业场景,包括金融征信、精准营销、商业地产、影视娱乐等。

4、不知所云类:大数据开源技术经过几年的发展,到2016年已经变的门槛并不是特别高,导致很多的传统软件公司,搭几个人的小团队根据开源技术换一套界面就可以说是自主研发的大数据平台,纷纷把大数据当做转型升级的未来方向。这类公司的特征就是无所不能,涵盖以上一二三点各种业务。

前三种类型的企业,笔者都是非常认可的,也结识和认识了很多优秀的同行。但是针对第四类的公司,要更加清醒认识自己,聚焦到自己所擅长的技术和领域,不只是单纯做项目外包的工作,而是深度参与行业的大数据应用,切实带来实际价值和利益,才能真正的成为有价值的大数据公司。

总结而言,真正在深入从事大数据行业的从业者,2016年是一个从“项目开发”向“产品运营”的一年。未来,只要坚持聚焦到自己擅长的领域持续深入挖掘,才就会有持续获得提升,保持团队及公司的长久发展。