9月26日,2021世界互联网领先科技成果在乌镇揭晓,全球共14个技术项目获奖。其中,蚂蚁集团联合清华大学自主研发的“大规模图计算系统GeaGraph”项目获奖。据了解,GeaGraph的综合性能通过全球第三方检测,领先世界第二名7.6倍。
蚂蚁集团计算存储首席架构师何昌华对北青-北京头条记者在内的多家媒体详细介绍了这一专业系统的技术原理和基本应用。
图计算是什么?
图计算是专门针对图结构数据的处理图是用于表示对象之间关联关系的一种抽象数据结构,使用顶点和边进行描述:顶点表示对象,边表示对象之间的关系。可抽象成用图描述的数据即为图数据。图计算,便是以图作为数据模型来表达问题并予以解决的这一过程。以高效解决图计算问题为目标的系统软件称为图计算系统。
大规模图计算系统GeaGraph由蚂蚁集团联合清华大学共同研发,是基于图模型的新型数据分析系统。系统解决了图数据分析面临的大数据量、高吞吐率和低延迟等重大挑战,实现了对复杂金融场景下海量交易数据的高效分析,能够快速识别和防范日益隐蔽多样的欺诈、洗钱等恶意金融行为。
图计算的发展是什么?
图论起源于18世纪欧拉对哥尼斯堡七桥问题的研究,并经由众多数学家乃至计算机科学家不遗余力的发展成为了我们解决很多实际问题的强力武器。
蚂蚁从2015年初开始组建图数据库团队,2016年初发布第一个图数据库版本GeaBase。
2016年6月,新版支付宝上线,GeaBase迎来了第一笔流量。接着几年,从支付宝大改版到新春红包再到双11,GeaBase迎来了业务的绽放期,到2019年双11,GeaBase双11主链路上单集群规模突破万亿边,点边查询突破800万QPS,平均时延小于10毫秒,成为支付宝核心链路上非常重要的一环。
图计算能做什么?
据悉,该系统在金融、电信、公共卫生等领域具有广泛应用前景,对于降低人民财产损失、防范金融风险具有重要作用和社会意义。
蚂蚁集团联合清华大学自主研发的大规模图计算系统GeaStack,使用图数据模型实现了对海量交易数据的高效分析,可快速识别和防范日益多样的欺诈、洗钱等恶意金融行为。GeaStack解决了图数据分析面临的大数据量、高吞吐率和低延迟等重大挑战。成果已经在金融、搜索引擎等领域实现应用,在蚂蚁集团增加反欺诈稽核金额6%,反洗钱风险审理分析效率提升90%,有效地降低了用户财产损失,维护了金融稳定,成果在金融、电信、医疗领域应用前景广阔。
比如,GeaStack支撑了蚂蚁集团支付、数金等众多关键应用场景,单集群达到百亿个节点、万亿条边的海量数据规模,为蚂蚁集团的风险控制、反洗钱、反套现、金融案件审理、信用分数等业务提供稳定的决策能力。
2020年起,GeaStack应用于蚂蚁集团支付业务,在已有策略模型的基础上,通过引入图模型,反欺诈稽核资金额增加了6%;
2021年,GeaStack应用于蚂蚁集团反洗钱分析,覆盖支付宝全部资金交易,每天计算8亿客户过去180天大约200亿左右边关系,将客户资金流向和关系可视化,对疑似团伙类犯罪风险识别能力提高94倍多,风险审理分析效率提升90%。
文/北京青年报记者 温婧
编辑/樊宏伟