数据分析与知识发现
    主页 > 综合新闻 >

翟明国、杨树锋院士:大数据时代--地质学的挑战

地质学是研究地球如何演化的自然科学,以固体岩石圈为主要研究对象,探讨地球各圈层的物质组成、内部构造、外部特征、各层圈之间的相互作用和演变历史。

地质学的产生源于人类社会对石油、煤炭、金属、非金属等矿产资源的需求,随着社会生产力的发展,人类活动对地球的影响越来越大,地质环境对人类的制约作用也越来越明显。

如何合理有效地利用地球资源、维护人类生存的环境,已成为当今世界所共同关注的问题。因此,地质学研究领域进一步拓展到研究地球资源的合理利用、资源与环境和人-地和谐的可持续性发展。

地质学是通过对自然现象的观察,发现观测数据中内在的规律性,其本质上是一门信息学科,是典型的数据密集型科学。21世纪以来,随着地球信息探测技术的日新月异,获取数据的能力不断提高,积累的地球观测数据呈指数级增长,预计到2020年全球数据总量将达到40 ZB。

多元、多维、多源、异构、时空性、方向性、相关性、随机性、模糊性、时空不均匀性和过程的非线性是地质大数据的特点。

地质大数据与一般大数据有相似之处,但也存在显著差别,大数据给地质学带来了前所未有的机遇与挑战。

当前,大数据正在影响着人类生活,改变着人类认识和研究世界的思维方式。大数据时代,数据密集型知识发现成为继理论科学、实验科学和计算科学后科学研究的第四范式。

2008年、2011年Nature和Science分别出版了大数据研究的专刊。大数据研究成为各国关注和优先发展的国家战略性技术。作为国家大数据战略的重要组成部分,地质大数据的应用研究方兴未艾。

《国土资源“十三五”科技创新发展规划》指出,要强化地学基础研究,开展地球深部过程与动力学、地球环境演化与生命过程、矿产资源和化石能源形成机理研究,加强地球关键带过程与功能、全球环境变化与地球圈层相互作用、人类活动对环境影响、重大灾害形成机理研究,深化地学大数据与地球系统知识发现研究。

云计算、物联网、人工智能等技术的兴起,使信息技术渗透方式与处理方法及应用模式发生变革、地质研究中多系统联合与结合成为可能。

利用地质学与大数据的结合,开展对地质数据的综合研究和应用,拓展了地质学的认知空间,提升了获取地质学新知识的能力。

相比大气科学、海洋科学、遥感科学以及全球变化等地学大数据的研究,地质学大数据的研究起步较晚,由于缺乏顶层设计和基本规划,地质大数据中心建设薄弱。

本文着眼于我国未来地质学发展,在分析地质大数据特点及国内地质大数据研究现状的基础上,阐述地质大数据拟研究的前沿科学问题,提出了未来中国地质大数据发展战略目标,探讨了地质学大数据发展的主要内容和解决途径。

1地质大数据的特点

地质大数据是通过露头地质观测、勘查工程、地球物理探测、地球化学探测、遥感和物理测试、化学分析等手段采集到的一种科学大数据,涉及地球从内到外的各个圈层,涉及地球形成与演化的历史,涉及地球的物质组成及其变化,涉及矿产资源的形成、勘查与开发利用,涉及人类环境的破坏与修复等。

地质大数据具有传统大数据的“ 4V”特性,即:

数据量大(volume)类型繁多(variety)速度快时效高(velocity)价值密度低(value)

同时还具有科学大数据的“三高”特点,即:

高维度(high dimension)高计算复杂性(high complexity)高不确定性(high uncertainty)

且由于地质对象的发展演化时空范围庞大、地质作用影响因素众多,这种高维度、高计算复杂性和高不确定性特点则更加显著。地质大数据的特点主要表现在以下4个方面。

1.1 多源(元)异构性

地质数据的采集平台和手段繁多,不同手段获取的数据也具有不同的数据组织管理形式。

例如:野外露头描述数据、钻孔岩芯描述数据、各种地质报告文档数据,以及大量野外填图、素描和照片,遥感获取的影像数据,地质灾害监测获得实时点位数据等。