8月29日,在2024数博会上,中国科学院地球化学研究所与阿里云联合发布国际首个“月球科学多模态专业大模型”(简称“月球专业大模型”)。该大模型以视觉、多模态及自然语言等通义系列模型为基模,结合RAG检索增强等技术,于阿里云百炼专属版进行微调及训练。目前在月球撞击坑年代和形态判别上,月球专业大模型的准确率已达到80%以上。
中国科学院院士、中国月球探测工程首任首席科学家欧阳自远表示,随着人类深空探测活动的快速推进,探测数据呈井喷式增长。科学大数据已然成为推动科技创新的强大引擎。目前在数据管理方面,我国已经取得先发优势。在数据应用方面,我国必须充分发挥现有的人工智能技术优势。基于阿里云通义模型构建的月球专业大模型将大大加速海量数据的处理,帮助科研工作者挖掘新的科学发现。
据介绍,目前月球专业大模型的最佳落地场景是月球撞击坑识别。人类对月球地质演化的研究除了探测返回的样品,主要依靠撞击坑识别等月球地质对象的研究。撞击坑的大小、深浅、形状等特征,是研究月球地质演化的重要依据。据统计,目前月球上直径一公里以上的月球撞击坑数量已超100万个,直径一公里以下的撞击坑数量至今无法确定。如果完全依赖人工,完成所有月球撞击坑的识别是“几乎无法实现的”。
月球专业大模型的应用极大提高科研效率。科研工作者只需输入月球撞击坑图像和相关问题,月球专业大模型即可调用通义视觉、多模态模型,从17种多模态数据中(包括光谱、高程、重力等数据)判定该图像对应的模态类型;通过检索知识库、调用通义语言模型,月球专业大模型可回答该撞击坑的形态、大小、年代等相关问题,并给出推理过程。
中国科学院地化所研究员刘建忠介绍,在月球撞击坑识别上,月球专业大模型的准确率已达到80%以上。“通过对海量数据的准确把握,大模型不仅可以对撞击坑进行分类,还可以解决一些目前仍未解决的科学问题。”
接下来,月球专业大模型将嵌入“数字月球云平台”,推动“月球云平台”智慧化升级。“数字月球云平台”由中国科学院地化所牵头建设完成,是国际上月球探测数据最全,集科学研究、工程应用以及科普教育为一体的云平台,它将与FAST等大科学装置一同成为科研基础设施的重要组成部分,助力我国月球与行星科研创新加速。
文/北京青年报记者 温婧
编辑/樊宏伟