近日,欧洲科学院公布2020年院士增选结果,清华大学计算机系教授孙茂松当选欧洲科学院外籍院士。孙茂松的研究方向为自然语言理解、中文信息处理、Web智能和社会计算,他率领团队研制出一个集自动分词、词性标注、专名识别和新词识别于一体的汉语分析软件,应用于清华与欧盟近10个国家合作的研究项目“超对等语义搜索引擎”中。
欧洲科学院,全称欧洲人文和自然科学院,成立于1988年,其总部位于英国伦敦,是由欧洲各国科学部长倡导创立、并由英国皇家学会等代表欧洲国家最高学术水平的国家科学院共同发起成立的国际科学组织;科学院分20个学部,其学科领域涵盖人文科学、社会科学、自然科学和科学技术等,是国际上跨地域和学术领域最广泛、学术地位最高、影响最大的科学组织之一 。
欧洲科学院院士主要从欧洲各国科学院院士中选出,代表欧洲人文和自然科学界最优秀的科学精英和学术权威,其中包括74位诺贝尔奖获得者、7位图灵奖获得者、15位菲尔兹奖获得者等;院士候选人选拔过程严格,首先由来自不同国家的院士推荐到科学部,经学部初审后推荐到提名委员会进行通讯评审,最后由欧洲科学院的专门委员会审核通过。
孙茂松现任清华大学计算机科学与技术系教授,清华大学学位委员会委员兼计算机学位评定分委员会主席,清华大学人工智能研究院常务副院长。
他长期以来从事自然语言处理、人工智能以及社会人文计算等方面的研究工作,同团队青年教师一起,指导学生在顶级国际学术会议和一流期刊上发表了一系列高水平论文,Google Scholar引用超过13000次;2012年领导完成并正式发布了文本信息处理领域两个国际标准。
孙茂松的研究重点之一是中文信息处理最为基础性的课题:汉语自动分词。他提出了若干重要概念,如“最大交集型歧义切分字段”、“真切分歧义与伪切分歧义”、“全局统计量与局部统计量”,并在大规模汉语语料库上对“最大交集型歧义切分字段”进行了穷尽式考察,给出了有效的处理策略,并以此为基础,研制出一个集自动分词、词性标注、专名识别和新词识别于一体的汉语分析软件CSegTag,应用于清华与欧盟近10个国家合作的欧盟第六框架计划(FP6)项目“超对等语义搜索引擎”中。
2013年根据学校部署,孙茂松率领团队设计并实现了我国第一个中文大规模开放在线课程平台“学堂在线”,目前已发展成为具有世界影响力的慕课平台,注册学习者约6000万人,注册人次约1.83亿;2015年领衔研制了人工智能中国古典诗词写作系统“九歌”,已为广大网民写作逾1000万首诗词。基于上述研究成果的软件工具包在GitHub上被组织成三个系列开源,共获约3.8万星标,受到了学界和业界的关注。
文/记者 任敏
编辑/谭卫平