档案真相
“欢迎来到科大讯飞人工智能体验中心……”随着大屏开启,传来甜美的声音,美丽的虚拟主播分别用不同国家的语言向观众进行播报,她的一颦一笑,动作、表情吸引着现场观众探究的目光。
3月19日下午,“触摸科大讯飞,感受新质高科技生产力”主题参观讲座在科大讯飞北京总部举行,这是北京市档案学会与北京青年报社共同主办的“档案见证北京”系列活动。此次活动,北京市档案馆馆长程勇专程到场,北京市档案学会理事长李立军和副理事长王海燕,以及部分档案工作者与热心读者共30多人参加。
新落成的北京科大讯飞总部基地,彰显出科技感与未来感。在科大讯飞北京大区总经理朱鹏陪同下,全体人员参观了人工智能体验馆,共同体验了讯飞最先进的技术和产品,了解了人工智能技术最新发展和应用等情况。徜徉在展厅中,新技术成果和应用场景,令人目不暇接,大家纷纷驻足聆听、交流分享。
科大讯飞每年将营业收入的20%左右用于研发
春天的阳光照进现代时尚建筑,大厅中央装饰着科大讯飞的logo,满满科技感。伴随阵阵咖啡的香气,东侧廊下是讯飞全线产品的展示区域,人们安静地浏览着商品。
参观活动由虚拟主播开启,一番演示之后,工作人员介绍了这个虚拟主播集合的三大核心技术。“第一是语音合成,只要前期输入文字即可完成快速音频、视频内容的播报。第二,讯飞主播是世界上首位多语种主播,可以实现六十多种语言和方言的播报。第三就是音画同步,大家看到她的嘴型、表情、动作和她的语言在视频中都是相匹配的,而且,我们看到的这个人物形象是‘真人’,她刚才说话的表情、神态、动作都是根据我们公司的同事实时呈现的。”
随后,他向大家介绍了科大讯飞的发展历程。1998年年底,科大讯飞在安徽合肥的西苑新村民宅起步。1999年,科大讯飞股份有限公司正式成立,不到十年时间,就在深交所成功上市,是亚太地区知名的智能语音和人工智能上市企业。作为中国在校大学生创业的首家上市公司,自成立以来,科大讯飞积极推动人工智能源头核心技术研发和产业化落地,致力于“让机器能听会说,能理解会思考,用人工智能建设美好世界”。现在,讯飞北京总部也被称为第二总部。
回溯科大发展史,科大始终把核心源头技术自主创新放在战略高度,每年将营业收入的20%左右用于研发,在人工智能的发展历史上建立了很多里程碑事件。比如2008年,首次让语音合成达到专业播音员水平;2012年,首次让机器的语音评测超过人类专家水平;2015年,首次让机器的语音转写准确率超过人类速记员水平。工作人员介绍,前期主要在感知方面让机器能听会说,现在做得更多的是让机器能理解,会思考,且基本上都超过了人类的水平。比如在2017年,讯飞基因助理机器人通过了国家医师资格考试,“满分600分。基因助理机器人考了456分,超过了96.3%的考生。现在已经相当于三甲医院副主任医师级别,可以帮助医生复诊看病。”再如,2018年,首次让机器翻译通过了国家翻译师资格考试并在大学六级考试中超过99%的大学生;2019年,首次在国际权威的机器阅读理解SQuAD2.0比赛中超过人类平均水平;2022年,首次在OpenBookQA常识推理挑战赛单模型中超过人类平均水平。
作为中国人工智能“国家队”,2023年,科大讯飞建设启用首个万卡国产算力平台“飞星一号”,发布基于该平台训练的全民开放大模型“讯飞星火”,达到国际领先水平。“讯飞星火”具备七大核心能力:当前训练效率已经达到英伟达A100同等规模集群的90%;测评显示,讯飞星火V3.5的语言理解、数学能力、语音交互能力已超过GPT-4 Turbo,综合能力逼近GPT-4 Turbo,持续赋能千行百业;在权威机构的评测中,讯飞星火的综合能力在国内排名第一。目前对标GPT-4当前能力的讯飞星火V4.0正在训练中,预计在2024年6月发布。”可以说,讯飞完全在国产的效率平台上实现了训练,基于人工智能核心技术,科大讯飞多年来持续赋能教育、医疗、金融、汽车、城市、运营商、工业等行业赛道,持续助力民生和产业高质量发展。
智能办公本可以实现八国语言同步翻译
在科技飞速发展的今天,人工智能已经逐渐渗透到人们生活的方方面面。在工作人员的引导下,大家逐一参观人工智能展示区,深入体验实时展示的科大讯飞最新技术成果和应用场景。令人惊叹的是,目前在各个行业都有广泛的人工智能应用,已经覆盖到司法、工业、教育、医疗等各个场景。
“这个智能办公本可以实现在我们说话的同时进行快速语言转写,记录会议。它有八国语言同步翻译的功能,满足通常需求,而且具备离线转写功能。”
有人提问,“正确率能达到多少?”“大家看,它识别的同时会进行校正,中文正确率能达到98%。英文在95%左右,其他语种在92%左右。它还具备AI助手的功能,比如开会做了几个小时的记录,它可以把全部文档经过大模型理解之后,帮您做会议纪要,像这样全文1000字的作出一个194字的摘要,非常高效。除了会议场景,它还可以实现阅读、听书、看书、看文件材料、看邮件等日常需要。”方言也能有这个正确率吗?令人意外的是,工作人员表示这款智能办公本对一些方言的识别率还挺高,“2017年,讯飞参加‘国家方言保护计划’的时候,就把全国20多种方言纳入建构,和用户共建中国方言库。讯飞输入法可以支持26种方言、5种民族语言的语音输入和2种方言的翻译。”
不少人对翻译产品感兴趣,工作人员演示道,“现在讯飞的翻译产品可以任意选择,比如拿着它去国外,按住屏幕上的红点,对方说外语,就会同步在屏幕上呈现翻译了。它还具备方言的识别能力,比如广东话、四川话、东北话、河南话都可以实现自动语言检测,有的地方网络不好,它还可以离线对16种、在线对85种语种自动识别、反应,包括在冬奥会上实现了无障碍沟通的场景。”
“河水破冰,大雁飞来。细雨润无声,到了雨水时节……”随着一段精美音画的呈现,一段机器合成的视频效果令人吃惊,它的配音配乐、画面的流畅度和舒适度已经非常接近人工,仅仅从视听上很难区分出机器合成与人工创作的效果。
令人惊叹的是,“讯飞星火”认知大模型能听说,能理解,甚至还能思考。它是怎么训练的?“简单来说就是由专家出题,机器阅读文章,进行学习训练,学习之后,它对这些开放式的题目作出回答。有了这个技术,它就可以阅读大量的卷宗或者是案件、书籍等来帮我们做事。”工作人员介绍道,随着算力的发展,文字识别、语音识别、语音合成方面的相关技术已经非常成熟,对中文的理解非常深入,像冬天能穿多少?夏天能穿多少?这样的语言以前机器可能听不懂,但现在已经毫无难度了。
脸盆里面漂浮着一块冰,这块冰融化之后,水平面是上升还是下降?一个人出门散步,前进20米,右转60度,再前进20米再右转60度。请问如此反复下去他能不能回到原点?对于上面的两道题目,人工智能进行逻辑推理,也可以实现自然语言理解,最终给出了正确答案,“厉害了!”有人感叹。
“快要到清明节了,非常适合踏青,想邀请朋友来北京玩耍,去颐和园、故宫看一看,帮我生成一段视频吧。”很快,“讯飞星火”生成了一段虚拟视频。随后,工作人员演示了儿童绘本即兴使用场景,“家里孩子上小学,经常要求做手工报,以后孩子有很多想法都可以通过人工智能去实现啦。”
医疗、教育、金融、汽车……用人工智能建设美好世界
“用人工智能建设美好世界”的标语映入眼帘,随后,大家深入了解了A+家庭、教育、医疗、城市、服务等应用情况。在基层医疗方面,科大讯飞“智医助理”帮助全国基层医护人员提供了7.4亿+次AI辅助诊疗建议,规范了2.8亿+份电子病历,纠正了130万+诊断案例,帮助基层医生降低漏诊误诊和不合理用药的风险。“这就是医生所使用的智医助理的界面,它会帮医生进行病例监测,监督医生改正,然后进一步问诊,包括推荐常见用药和检查,医生会根据这些信息最终判断确诊。最终保存时它还会弹窗提醒,要不要再判断一下?整个病例数据在后台还有更加专业的人工智能再来复诊一遍,从而减少误诊和漏诊。”
看看现在的小孩都是怎么学习的?步入讯飞教育场景赛道的展示,“首先看到的这个场景是一些机器帮我们的老师改试卷、分析孩子的学习过程。目前机器的水平达到了‘老师能看懂的机器都能看懂’,它是根据前期专家评标维度来进行批改的,所以是权威的。除了语文,英语、数学也可以批改,尤其是像数学的公式,它不仅可以准确识别,还能进行分步骤给分,目前这项批改技术已经覆盖全国14个省的高考阅卷,及30多个地市的中考阅卷。包括大学四六级、托福、雅思相关的评测和批改都应用到了。”
有读者询问,人工智能可以帮助学生总结错题吗?“它可以帮学生抽取知识,根据知识点的分析,推送给相应薄弱的学生,这样的训练在学习机上都是完全可以复制实践的。”随后,工作人员演示了“智能白板”的使用场景,上课时,先通过识别老师的声纹,然后登录账号,打开白板。它可以在不改变老师原有笔迹以及书写习惯的情况下,同步呈献在黑板上。作为配屏,这些手写的内容还可以智能识别成标准的印刷体,还可以推荐一些智能化的题型或者课程内容视频让学生观看。它也可以识别几何图形,以前我们自己动手去叠小纸盒,现在直接通过它就能进行多维展开,从三维变成二维展示。”
有人提问它能从最高点到最低点立体切割对角线吗?演示之后,人工智能大脑没有识别出来,“它没有这个逻辑,这是它下一次的学习课题。”随后,工作人员介绍,“这个智慧助手可以实时帮助老师们去做文件,做PPT,大大减轻老师的前期备课工作。它还可以通过一些量表软件了解孩子的心理健康状况,给予心理干预和疗愈。”据介绍,在教育领域,科大讯飞为全国32个省级行政区、5万余所学校、1.3亿师生提供“因材施教”的解决方案;在基础教育方面,2022年以来,科大讯飞携手“学习强国”,将装满AI知识和应用的“科技大篷车”开进全国15个省、72个站点,跨越2.5万公里,为全国52万中小学生送去一个个“移动的AI科普课堂”。
此外,在医疗领域,科大讯飞“智医助理”为全国30多个省400多个区县提供了7.4亿次辅诊服务,为每个医生打造AI诊疗助理、为每个居民打造AI健康助手。在金融领域,科大讯飞为包括6大国有银行在内的全国两百多家金融机构提供智能客服、智慧营销、软件开发等AI服务,触达用户超过5亿人,用AI为客户提升服务效率和运营效能。在汽车领域,科大讯飞为奇瑞、广汽、长安、长城等数十家车企提供了累计5360万前装搭载,覆盖24个语种助力国内车企出海,平均月活用户超过2500万,年在线交互次数突破100亿,用AI为用户带来智能音效、智能座舱、智能驾驶等智能车载解决方案。在城市领域,科大讯飞为全国30多个省330多个城市提供城市超脑、智慧政务等智慧城市解决方案,服务了全国超4900家政企单位,助力城市实现数字化转型。在运营商领域、在工业领域,科大讯飞都提供了诸多解决方案,陆续打造出行业示范应用。
更多地结合政企服务、民生服务开发出档案的更多价值
北京市档案馆馆长程勇饶有兴致地与讯飞公司有关领导及讲解员交流互动,详细了解人工智能技术最新发展和应用等情况。座谈开始,讯飞知喻科技有限公司总裁张海剑做了《人工智能技术赋能档案数智化升级》的专题报告,分享了讯飞人工智能技术在档案领域的研究心得和经验,与档案专家进行了交流。
他提到,在档案领域的应用与研究,人工智能技术第一方面需要解决的是档案资源的开发问题,也就是说,档案资源从数字化到数据化,再到知识化过程中,首先要解决的还是资源的开发。档案馆里面有大量的古字、繁体字等,这些都是档案行业智能化过程中面对的挑战。“档案世界极其丰富,要检测‘真四性’(真实性、完整性、可用性、安全性),我们支持查看检测报告,对每条检测结果,未通过的检测项目都可以点击查看未通过原因;支持便捷的检测方案配置功能;支持逐项参数设置、方案启停,做到‘真四性’。在档案的文字、图像、音频档案等领域,以人工智能技术揭开文物看答案,可以重现历史的记忆。除了构建档案的知识化体系,还要更多地结合政企服务、民生服务开发出档案的更多价值。”在张海剑的详细介绍中,大家对科大讯飞人工智能技术在档案方面的领先应用有了更深入的了解。
随后的交流环节中,与会人员围绕人工智能技术在档案展陈、编研、开放鉴定和音视频档案保存、“四性检测”等方面的应用进行了深入研讨,现场气氛热烈,学术氛围浓厚。生成式人工智能技术,可以创造什么样的新内容?档案的开放鉴定,需要什么样的硬件资源配置?智慧档案的语料库能不能实现高校平台共享?展厅中的虚拟人陪伴观众参观答疑,这种自动模拟的交互感应技术如何做更有吸引力?元宇宙技术怎样应用到展陈?大家讨论得十分热烈。
程勇表示,此次参观交流收获很大,一是开阔视野,对人工智能技术的新进展和发展前沿有了进一步了解,掌握了不少新信息;二是探讨应用。他指出,建设数字档案馆、文件级目录著录提速是目前北京市档案馆需要尽快解决的问题,此次交流对形成人工智能赋能档案工作方案很有帮助,有助于深入探讨人工智能技术在档案收、管、用各环节的应用;三是寻求合作。他邀请科大讯飞公司人员到馆进行深度调研,探讨双方进行深度合作的方向,以助力北京市档案馆应用人工智能技术,推动信息化工作提质增效。
文/北京青年报记者 李喆
摄影/北京青年报记者 李娜
编辑/王静