郭华东
“大数据已成为信息主权的一种表现形式,将是继边防、海防、空防之后大国博弈的另一个空间。”近日,中科院院士郭华东在接受《中国科学报》记者采访时表示,大数据正在开启一次重大的时代转型,“它将改变人类的生活以及理解世界的方式”。
第二次工业革命的爆发,导致以文字为载体的数据量约每十年翻一番。从工业化时代进入信息化时代后,数据量以每三年翻一番的速度持续增长。而随着计算机技术和互联网的快速发展,半结构化、非结构化数据大量涌现,数据的产生已不受时间和空间限制。
郭华东介绍说,根据2012年国际数据公司(IDC)发布的《数字宇宙2020》报告,2011年全球数据总量已达到1.87ZB(1ZB=十万亿亿字节),并且以每两年翻一番的速度飞快增长。预计到2020年,全球数据总量将达到35~40ZB,10年间将增长20倍以上。
“1.87ZB的数据在数量上是什么概念?将这些数据刻成DVD,排起来的长度相当于从地球到月亮之间一个来回的距离。”郭华东告诉记者。
他进一步表示,作为一种技术创新,大数据符合一般的技术创新、发展、成熟规律。根据美国一家公司发布的技术分析报告,现阶段大数据处于“膨胀的高峰期”,要达到“实质生产的高峰期”至少需要2~5年。
“大数据在政府层面已得到高度重视。”郭华东说,2012年美国政府启动大数据研究与发展计划,投资2亿美元设立了若干项目。欧盟于2011年提出“开放数据战略”,以促进经济增长。2013年,欧盟还召开了欧盟数据论坛和大数据论坛。澳大利亚则在2013年发布了《大数据战略报告》,将“促进数据开放和大数据发展”列为重大领域之一。在我国,政府部门也相继启动不同的大数据项目。
郭华东认为,大数据时代以及大数据计算的本质特征在于从模型驱动到数据驱动范式的转变,以及数据密集型科学方法的确立。
“大数据促进了科学范式的转化。”郭华东表示,几千年前,科学以实验为主要手段描述自然现象;过去数百年里,科学出现了理论研究分支,利用模型和归纳方法进行论证;过去数十年,科学出现了计算分支,对复杂现象进行仿真模拟。“今天,大数据时代的到来将理论、实验和计算仿真等统一起来,从而形成了新的科学范式——数据密集型科学。”