机房360首页
当前位置:首页 » 大数据 » 大数据热潮的分析与审视

大数据热潮的分析与审视

来源:文章摘自《自然辩证法研究》2015年9期 作者:清华大学孙辰朔、万剑锋、刘山松 更新时间:2015/10/8 14:28:14

摘要:大数据热潮方兴未艾,但若要探究何谓大数据的问题以及大数据现象何以如此兴盛的原因,我们的眼光就不仅仅只停留在它时下的具体表征上,还要对产生它的理论根源做深入分析。大数据,冠之大于数据也。从造词法的角度看,它必然与数和数据有关。因此,如果要将大数据的历史脉络梳理清晰,可以以数和数据为线索。

  此外,“通过让数据发声,提出了科学始于数据的知识生产新模式,增添了科学发现的逻辑新通道”〔9〕83,这些方面使得大数据被视作一种新的方法论。

  3. 社会进步助推大数据形成热潮

  科学技术发展是推动人类社会前进的革命性力量,特别是最近几个世纪,科学技术发展为社会带来的变革与进展给人们留下了非常深刻的印象。始于十九世纪后半叶的第二次工业革命,带来了电力的大规模应用,使电灯、电话走进日常生活。二十世纪中叶以来,以电子计算机、原子能、合成材料技术的应用为代表的第三次工业革命,促进了各个领域的现代化建设。2014年,工业强国德国正式推出“工业4.0”概念,这被认为是未来十年至二十年内将要发生的第四次工业革命,旨在“提升制造业的智能化水平,建立具有适应性、资源效率及人因工程学的智慧工厂,在商业流程及价值流程中整合客户及商业伙伴”〔10〕。大数据将于其中发挥十分重要的作用,就如同大脑是人类智慧和意识产生的基础一样,大数据认知论和方法论将是未来工业革命的智慧源泉。尽管大数据还面世未久,但却很快应用于各个领域,直接推动了社会进步。在宏观经济方面,IBM公司从互联网中搜索影响制造业的480项经济数据,建立了经济指标预测系统;在医疗卫生领域,据麦肯锡公司估计,“如果把大数据用于美国的医疗保健,将产生年均三千亿美元的潜在价值”;在公共安全领域,利用媒体和通讯数据,可以实现实时的舆情发掘和犯罪预测〔11〕48。以上例证只是一些缩影,在这些典型案例的背后,还存在着诸多大数据广泛应用的事例。由此可见,大数据对社会进步有着巨大的推动作用,后者是前者的根本目的。

  马克思曾指出,“人类奋斗所争取的一切,都同他们的利益有关”〔12〕82。科学技术是第一生产力,大数据作为科学技术的产物,提供了一种新的认知世界的方法。它使决策更加科学化、市场更加透明化,同时带来新产品新产业,其创造价值财富、推动社会进步的成效显著。因此可以说,正是因为在价值创造与社会进步方面为大多数人谋求了广泛的利益,使得政产学研等社会各界都对其有所推动,大数据才最终形成了一股热潮。

  以上全面系统地归纳了大数据诞生并形成热潮的原因,即信息科学是质料、新方法论是形式、政产学研是动力、社会进步是目的,恰好集成了古希腊自然哲学家亚里士多德的“四因说”思想。

  三、对大数据热潮的再审视

  2012年是世界公认的大数据元年,自那以后,大数据的概念仿佛一匹健壮的黑马,以一日千里之势迅速占据了学术界、产业界的思想阵地,甚至政府层面也逐渐将其视作战略资源。以上归纳出了大数据热潮的形成原因,即回答了为什么大数据能够如此蒸蒸日上、热火朝天地流行和发展起来的问题。那么,大数据如火如荼的背后究竟还有什么值得我们思考?

  根据高德纳咨询公司关于技术演变路线的理论,“新兴技术往往要经过萌芽期、膨胀期、低谷期和爬升期,才能进入实质生产的稳定期;大数据时下正处在期望膨胀的高峰期,预计还需要五至十年才会达到稳定期”〔13〕。时下,当大数据已经成为一股席卷各个领域的热潮,当人人都热衷于提起大数据,甚至抛出“大数据万能论”的观点,但对它的概念、技术和应用都不求甚解时,我们对其赋予的魅力和价值理性与相对合理的范围比起来,显然是有过之而无不及了。如此过度地热炒,将不利于人们全面客观地认识大数据,反而会加速概念泡沫的形成。相反地,如果我们能做到在冷静透视热潮成因的基础上,缕清大数据现象和本质,既利用其优点与长处,也反思其不足与局限,大数据才能进入真正的稳定期,进而才能永久地为人类造福。因此,站在唯物辩证法的角度对大数据热潮作重新审视,是有必要也是有价值的。

  1. 反思:数据本体论与应用局限

  关于数的本体论思想,即“一切事物的性质都可以被归结为数的规定,数的规定性比物理属性更加普遍”〔14〕15,从古希腊毕达哥拉斯学派将数视为万物本原开始绵延千年,对后世有着很大影响。作为数的延伸,数据在现代科学中也被用于诠释宇宙万物的本原,比如以恒定数据表示的物理常数,似乎自然规律就是数据。继承了这种思想,大数据也被人解读为“万物源于数”本体思想的回归〔1〕120,即数据不再是用于表征客观世界的方式,而变成了世界的本体。这种观点其实就是在说,“大数据使得万物皆可被数据化,世界就是一个数据化的世界,世界的本质就是数据”〔15〕。

  诚然,数据化可以让很多事物变得既清晰又精确。但是,数据真的可以囊括一切吗?即使它的确能囊括一切,真的就应该让它囊括一切吗?这个问题若从自然科学的角度回答,予以肯定尚显合情合理,但如果说人类的精神世界也要被数据化才能被更好地开垦,恐怕多数人不会同意。以书法审美哲学为例,所谓雄浑大气、劲峭险绝的风格特征,所谓阴阳平衡、刚柔相济的文化内涵,都是与人类主观世界相符的精神境界与艺术追求,都是人的感受与客观规律的统一。即便数据化可以让书法作品被更方便地拓印和传播,但终究不能替代情理交融、知行合一的审美情趣,更难以囊括广袤无垠的人类精神世界。

  2. 反思:数据之客观性与确定性

  大数据是以数据为基础的方法论,只有建立在数据是正确的基础上,大数据方法才有可能产出有价值的结论。然而,数的概念毕竟是人类思维的产物,“数据的客观性仍然受到人类主观因素的影响,这一特性从数的产生就一直存在;数据是事物客观性和人类主观性的纽带,也是人类认识世界的桥梁”〔2〕39。从这个意义上讲,数据非但不是客观世界的本体,而且其客观性还要受人类主观意志左右。所以,人们基于大数据挖掘出的知识,其客观性并不是毫无疑问的。譬如,社会学研究常用的调查研究方法,虽然在大规模量化分析方面很有优势,但由于个体主观可能存在偏差,有些甚至出于利益目的伪造数据,由此带来的是数据本身客观性的缺失,进而使它的上层建筑,即通过大数据分析产出结果的客观性遭到质疑。

  关于数据的另一个重要命题是它的确定性。量子力学中的海森堡不确定性原理表明,微观粒子的位置与动量、能量与时间等物理量在同时测量时具有不确定性。事实上,“客观世界中的绝大部分现象都是不确定的,所谓确定的、规则的现象,只会在一定的前提和特定的边界条件下发生,只会在局部或者较短的时间内存在”〔16〕1584。故而,不仅人类的主观认知会让数据“出问题”,客观世界中的现象所具有的不确定性,也使测量数据在表征客观世界时总存在误差。所以,要想通过大数据得到尽可能正确的结果,数据的客观性与确定性问题仍是热潮下亟待冷静面对和解决的问题。

本文地址:http://www.jifang360.com/news/2015108/n034573025.html 网友评论: 阅读次数:
版权声明:凡本站原创文章,未经授权,禁止转载,否则追究法律责任。
相关评论
正在加载评论列表...
评论表单加载中...
  • 我要分享
推荐图片