摘要:“两会”期间,中国政府网制作了“大数据看两会”专题,通过大数据对网上舆情进行分析解读;在央视《新闻联播》“两会”报道中,引用百度新闻关于“政府工作报告”前十名的热搜词,用大数据清晰呈现出了人们对政府工作报告的关注点; |
在国家信息中心网络政府研究中心发布的数据中,包含了新浪微博700多万条相关信息、2000项百度指数数据,以及新浪、搜狐、新华网、人民网等117家网站的进一年共52.5万篇新闻报道。这次史无前例的“数字两会”,都让“大数据”这个关键词进入到了寻常百姓的视野。
(大数据看两会热点词汇分析-来自中国政府网)
其实,大数据技术早在“两会”大放光彩之前,就已成为互联网企业业务创新、各级政府部门瞭望民意的最佳工具。许多企业对大数据应用的关注程度在几年前,就已经得到了具体应用,很多企业也随之设立了首席数据官(CDO)这样的职位,而许多分析机构早就经营起了"数据买卖"。
许多人也许不知道,在使用大数据对此次两会“政府工作报告”热点词汇分析以及“环境治理”、“三公公开”、“互联网金融”等过去一年中的搜索热词加工、解释的背后,一套强大的IT基础设施正在飞速运转。而这套强大的IT基础设施提供方正是曙光公司,其大数据处理平台通过强大的采集、存储、分析和提炼能力,为各大门户网站提供底层数据支撑。
作为为本次大数据看“两会”提供盛宴的“厨师长”,曙光公司大数据首席技术工程师宋怀明博士表示:“从舆情产品服务的角度看,浓缩海量信息、抵抗‘数据爆炸’,已成舆情分析平台最基本的需求。为此,曙光大数据解决方案采用了社会化行为分析技术,通对海量文本、图片、视音频等数字化内容进行集中存储和智能检索,实现互联网热点数据的深层次挖掘,。用户可以利用大数据技术的碰撞比对、频率分析、语义分析、多维融合、深度挖掘等创新特性,改变传统情报分析中的逻辑推理、综合统计、比较联系、特征解释等相对落后的技术手段,进而实现各要素之间的深度关联和智能判断。”
“继模拟仿真被认为是‘人类认识世界的第三只眼’后,大数据分析将成为‘人类感知世界的另一个大脑”,历军表示。