大数据可以投资吗?
首先,从个人角度来讲,我对“数据”的定义可能更倾向于狭义,即“数据的积累”。 所以,这里讨论的数据,其实已经包含了广义大数据的概念(虽然我的题目叫作“大数据的误区”)——因为如果你不收集数据,就没法形成大数据。 但是,广义的“大数据”是一个更为宽泛的领域,在这里我们可能更多关注的是“如何用数据分析问题和解决问题”,因此这里的“大数据分析”可能更多的指的是计算机科学和数据科学领域。 当然,我这样区分也并不是为了咬文嚼字,而是基于我对这个领域的长期观察和了解。
目前,在狭义的数据领域,也就是传统的信息技术和信息系统领域,其核心技术的发展早已进入了瓶颈期;而在广义的大数据技术领域,其各种新技术却如火如荼。但是,正如 @林深时见鹿深 所讲,当前很多对于大数据的技术创新实际上并没有突破2006年的技术视野。 也就是说,至少在技术层面,我们对大数据的理解至今并没有突破十几年前的水平。这让我们对于大数据的价值和机会产生了各种各样的误解和迷思。这些误解和迷思有以下几个方面:
1、因为没有突破信息技术的瓶颈,所以在狭义的数据领域,不管是做应用还是系统架构,都很难出现颠覆性的技术创新。于是我们发现在互联网+的时代,无数的企业都打着“大数据”的旗号来做一些简单的事儿——这其实是很让人失望的。
2、正因为没有突破信息技术本身的瓶颈,所以很难通过大规模提高算力或者存储能力的方式来压缩成本,从而实现规模经济。于是我们看到对于大数据的各种炒作中,除了云的概念以外,另外就是各种各样的新数据挖掘工具、算法和应用,而很少谈及新技术在降低成本方面的潜力了。
3、因为无法突破信息技术瓶颈,所以很难出现像互联网一样对既有传统行业进行彻底重构的新业态。但我们看到了诸如打车软件、购物比价这样的业务,他们利用移动互联网的特性,对既有行业进行渗透,带来一定行业震荡和新商业模式的出现。
4、因为在传统的信息技术领域,系统建设通常都是从功能性需求入手,然后通过功能点分解、分配模块来完成设计的。在这种模式下来设计大数据系统的架构,必然会受到传统的制约。于是我们会看到各种各样“大数据平台”“大数据工具”的奇奇怪怪的产品形态。
5、因为以上种种,所以我们看到越来越多的企业和创业者把大数据当成了一个宣扬噱头或是圈钱的工具。毕竟,在技术没有根本性革命的情况下,能够打着大数据旗号的都很容易得到市场的关注和资本的青睐。这种环境和氛围,无疑会让真正做基础科学研究的人感到心凉。 不过,正如 @周炜 所说,我们仍然处在一个数据爆炸的时期。每一天,都有大量的数据被产生、被采集、被处理。无论我们是愿意接受还是不愿意接受,事实就是如此。