大數據助力地球系統科學步入數字孿生
發布時間:2023-05-26 16:27
作者:漢鑫科技辦公室
來源: 漢鑫科技
地球大數據的爆炸式增長推動著地球系統科學向數據密集型范式(Data-intensive paradigm)轉變,并為破譯和解析復雜的地球系統奠定了基礎。如何從海量、多源、異構、泛在的地球大數據中汲取所需的信息和知識,實現數據-信息-知識-決策鏈條的貫通,亟需更加行之有效的解決方案。
近日,中國科學院青藏高原研究所研究員李新、馮敏與專項首席、可持續發展大數據國際研究中心郭華東,聯合西北生態環境資源研究院研究員冉有華、博士蘇陽、副研究員劉豐、研究員黃春林,武漢大學教授沈煥鋒,空天信息創新研究院研究員肖青,以及三極觀測與大數據研究團隊博士蘇建賓和原世偉,在《自然綜述:地球與環境》(Nature Reviews Earth & Environment)上,以Big Data in Earth System Science and Progress Towards a Digital Twin為題,系統地總結了大數據在地球系統科學領域的進展和挑戰。該論文分析了遙感、原位觀測和實驗分析、社會感知、模擬和再分析四類地球大數據的特征,提出了能夠將自然-社會大數據納入地球系統模型的大數據同化方法框架,探討了通過深度學習、物理知會的機器學習、因果推斷、深度強化學習解決地球系統科學中高維數、復雜性和非線性難題的關鍵。以上大數據分析方法彌補了傳統方法在可預測性、可遷移性、可解釋性和決策支持方面的不足,為推動智能化數字孿生地球(Digital Twin of Earth)建設提供了先進的解決方案(圖1)。
圖1.地球大數據推動數字孿生地球發展
論文提出,大數據同化(Big Data Assimilation)是融合地球大數據和地球系統模型的重要方法。大數據同化可以利用先進計算資源,實現機器學習與數據同化方法的共生集成,完成超高分辨率地球系統模型和多源地球觀測(如遙感、臺站、社會感知等)的相互融合,實現地球系統在洲際乃至全球時空尺度和物理意義上的一致表達,進而為數字孿生地球提供物理驅動層(圖2)。
圖2.大數據同化方法與應用
同時,文章從數據密集型地球系統科學的角度,分析了四種前沿大數據分析方法——深度學習、物理知會的機器學習、因果推理和深度強化學習的具體應用場景和方案;文章提出:科學大數據分析方法將助力數據驅動新地學的發展,其中,深度學習在解決地球系統高維度、復雜的非線性問題中表現出潛力;深度學習與物理知會的機器學習和因果推理相結合,可以增強在地球系統科學研究中的可遷移性、可解釋性和可預測性;深度學習與強化學習和多智能體建模相結合,則能夠為解決復雜的決策問題提供有效方法(圖3)。
圖3.機器學習方法助力數字孿生地球建設
論文提出,數字孿生地球的建設需要全面的包容性,需要深時、深地、深空的全面數據支撐。隨著地球步入“人類世”時代,數字孿生地球的實現需要自然系統“硬”數據與社會系統“軟”數據的無縫集成,從而捕捉自然系統和社會系統的復雜交互,而科學、開放、共享的大數據科學環境和基礎設施建設則正是數字孿生地球的關鍵保障。實現數字孿生地球將是一個漫長而艱難的旅程,更加廣泛的跨學科合作和更加開放的科學環境將有助于克服這些挑戰,推動實現面向地球系統科學的人工智能工具(AI for Earth System Science)(圖4)
圖4.地球系統科學的機遇與挑戰
研究工作得到中國科學院戰略性先導科技專項“地球大數據科學工程”項目和國家自然科學基金的支持。