商汤发布粤语大模型 定价30港元/百万tokens
第一财经 2024-06-01 15:56

作为一家在香港诞生的公司,商汤有意在大模型的浪潮下进一步发展香港市场。

基于5.0大模型,商汤推出了商量(SenseChat)粤语版大模型,并于5月29日正式对外。商汤在同日宣布旗下应用产品商量粤语版网页及APP将于7月1日向粤语用户开放并永久免费。商量粤语API(应用程序编程接口)现已开放,最大支持128K窗口,根据模型输入和输出量计费,每100万tokens收费30港元。

今年4月,商汤发布了“日日新”(SenseNova)5.0大模型。“中文大模型发布完,我们马上就开始筹划粤语了。”在采访中商汤科技亚太区副总裁兼战略执行负责人邹春慧对第一财经表示。

邹春慧表示,粤语受众人群不小,加之香港是一个非常独特的接轨国际和内地的市场,所以商汤在较早就开始考虑,基于5.0超大模型底座做粤语模型。

商汤在2014年于香港科学园成立,其创始团队源于香港中文大学的多媒体实验室。邹春慧提到,中国的大模型发布了很多,但目前市场上还是以普通话或英文为主,针对非主要语种做得不多。而商汤作为一个诞生在香港的科技公司,在这里扎根十年,在内地市场之后发展粤语市场也是自然而然。

商汤科技董事长兼CEO徐立表示,在激烈的市场竞争中,生成式人工智能的机会在于深耕应用,打造行业闭环。而应用落地需要大模型熟悉和服务本地文化,所以希望推出日日新5.0粤语版能够填补香港的行业空白。

商汤科技联合创始人林达华在会上表示,日日新5.0一直全面对标OpenAI的GPT-4 Turbo,但类似GPT4的国际大模型,在特定文化领域里,容易出现由于数据不足和欠缺文化理解而处理不当的问题。此次推出的日日新5.0粤语版支持粤语问答,具备大语言模型能力、多模态能力等,与ChatGPT相比,商汤的优势在于精准理解和掌握粤语以及粤语区文化和热点。

除了粤港澳之外,邹春慧提到,粤语人群实际上也覆盖到了海外,全球有广大的粤语人群,“会有机会去面向其他更广阔的市场”。据介绍,商汤在新加坡、东京、首尔等地都有设立办公室。

就在近日,中国电信人工智能研究院也发布了方言语音识别大模型,支持30种方言自由混说的星辰超多方言语音识别大模型,可同时识别理解粤语、上海话、四川话、温州话等方言。据悉,星辰语音大模型已在福建、江西、广西、北京、内蒙等地的中国电信万号智能客服试点应用。

在主流语言之后,方言和海外市场或已成为大模型厂商的一个探索方向。

对于此次发布的粤语大模型,商汤方面对第一财经表示,其意义并不是一个简单的方言大模型,而是深耕香港市场,在信息、文化、生活服务等方面深入香港去打磨,其更重要的概念是大模型“在另一个地区本地化落地的尝试”。

当天,商汤科技与德勤中国、香港电讯、隶属吉利科技集团的长兴吉数科技分别签订了合作备忘录。关于应用场景,邹春慧举例介绍,之于电讯行业来说,大模型可以在客服粤语对话场景应用,而德勤有不少金融咨询、业务流程的改善需求,大模型可以应用在整个业务流程的提效中。

2024年被认为是大模型应用元年,但至今仍没有诞生革命性的应用。邹春慧认为,现在全球AI行业最关键要解决的一个问题是通用性,所谓通用人工智能是所有场景、所有行业都能够去普及和应用,但目前看来这个目标还是有距离的,目前只是一些行业能够应用。

“但今年和去年比已经真的很不一样。” 邹春慧也感慨,现在金融、银行、教育、工业等领域都已开始应用,日常生活也用得越来越多,未来一定会越来越普及。因为随着应用场景铺开,数据量越多,AI的训练也就会越智能。

虽然今年是应用元年,但是诞生革命性应用的时间或许还不够,因为这需要大量的数据、场景去训练。另外很重要的是数据的质量,质量不够好训练出的结构也不会好。邹春慧表示,过去虽然可能积累了大量数据,但很多数据还要花时间去做数据清洗、重构。“我们也看到了非常快速的发展,我相信到明年这个时候,那会是一个翻天覆地(的变化)了。”

编辑/范辉

相关阅读
智道奇点政务服务人工智能大模型发布
北京青年报客户端 2024-05-29
中国移动发布北京大模型产业创新基地
北京青年报客户端 2024-05-27
商汤股价飙涨超30%暂停交易 大模型迎端侧爆发元年
第一财经 2024-04-25
商汤升级“日日新5.0”大模型 对标GPT-4Turbo
澎湃新闻 2024-04-24
大模型领域进展不断 多场景应用还有多远
新华社 2024-01-11
最新评论