OpenAI放“王炸”
上海证券报 2024-05-14 19:00

北京时间5月14日凌晨,美国科技公司OpenAI在其首次“春季新品发布会”上又带来了最新大模型产品。

这款被公司创始人萨姆·奥尔特曼称为“OpenAI有史以来最好的模型”,也是一款备受瞩目的多模态大模型。

真正的AI助手

北京时间5月14日凌晨,OpenAI发布了其新一代旗舰生成模型GPT-4o和桌面程序,并展示了一系列新能力。

据悉,ChatGPT这次更新以后,大模型可以接收文本、音频和图像的任意组合作为输入,并实时生成文本、音频和图像的任意组合输出。

值得关注的是,相较于此前擅长的文字大模型,GPT-4o是一款多模态大模型。奥尔特曼表示:“GPT-4o是OpenAI有史以来最好的模型。它很聪明,速度很快,是天然的多模态。”

而这也正呼应它名字中的“o”——代表着“omni”,意味着OpenAI朝着更自然的人机交互迈出了重要一步。OpenAI首席技术官Muri Murati表示,GPT-4o提供了“GPT-4级别”的智能,但在文本、视觉和音频方面改进了GPT-4的能力。

从发布会现场来看,此次发布的GPT-4o更接近大众理解的“AI助手”的模样。

首先,基于天然多模态优势,GPT-4o引入了更快的人工智能驱动的语音助手,可以输入并输出图像与声音,具有类似人类的反应。

从现场演示来看,GPT-4o能在232毫秒内对音频输入作出反应,平均反应时间为320毫秒,这与人类在对话中的反应时间相近。

“此前GPT也有语音助手的功能,但是用过的人都能感觉到,它的反应还是比较慢的。”一位业内人士解释道,“因为此前GPT需要把音频转成文字,然后再生成文字回答,最后再转语音。”

然而在多模态的加持下,不仅是音频,如今GPT-4o还具备了“视觉感知能力”。在直播中,OpenAI演示了一段OpenAI员工与GPT-4o对话的视频,模型反应速度与人类相近,GPT-4o可利用手机摄像头描述其“看到”的东西。

在另一段展示视频里,GPT-4o被装在两个手机上,其中一个代表人类与电信公司打电话沟通设备更换事项,另一个则扮演电信公司客服人员。OpenAI还展示了GPT-4o搭载在手机上的实时翻译能力。

OpenAI研究员Mark Chen进一步表示,新模型具有“感知情绪”的能力,能输出笑声、歌唱或表达情感,还可以处理用户打断它的情况。

性能明显提升的同时,GPT-4o的成本也在下降。据了解,目前该模型在英语和代码文本方面的性能与GPT-4 Turbo相当,在非英语语言文本方面也有显著提高,在应用程序接口(API)方面速度更快,成本则降低了50%。

OpenAI官网显示,GPT-4o输入、输出每1M token(文本单位)收费0.005美元、0.015美元;GPT-4 Turbo输入、输出每1M token收费0.01美元、0.03美元。

据悉,该模型或将成为首款免费向所有人提供GPT-4级别服务的AI。另外,OpenAI还将推出ChatGPT的桌面版本和一个更新的用户界面。目前,桌面版适配macOS系统,使用键盘快捷键就可向ChatGPT提问。今年晚些时候还将推出Windows版本。

大厂竞逐“杀手应用”

今年,整个AI市场,应用将成为全球大厂竞逐的焦点。

值得注意的是,近日还有消息传出苹果与OpenAI商谈,以便在下一代iPhone操作系统使用ChatGPT功能。此次OpenAI重点展示了大模型在手机端侧应用的能力。

而从时间节点来看,近期包括微软、谷歌在内的头部科技厂商纷纷召开发布会,密集推出一系列具有落地潜能的大模型产品。而放眼国内,如今投资市场对于大模型投资的逻辑也在转变。

“我们可以看到的是,经历了早前的‘百模大战’,如今国内厂商正在逐渐走出一条属于自己的道路。尤其是在To C的产品端上,我们需要看到中国厂商在C端应用上一直有着巨大优势。”天风证券全球科技首席分析师孔蓉认为,从市场来看,今年下半年,大模型的商业化落地将成为资本市场关注的焦点。

展望今年下半年,“落地”是孔蓉对人工智能行业今年趋势的大判断。“我们看到越来越多理论与概念正在变成现实,越来越多曾经构想中的东西正在产业中找到场景。”孔蓉表示,从港股市场来看,下半年科技板块或将迎来更多新的机遇。

采访中,多位市场人士直言,如今谁能先找到“杀手级”应用,谁就能获得这场竞赛的胜利。

此前,知名投资人在接受采访时表示,如今AI将引领下一个时代的发展已经成为市场的共识。但回望AI发展的几个阶段,如今对于AI的投资正在从存粹的“技术唯一”到了市场化的考核。

在谈及当下AI创业,李开复提醒其逻辑与移动互联网有巨大差别。“移动互联网没有推理成本,所以我们不能纯粹只关注产品市场的匹配度(PMF),应该还要考虑技术和成本的匹配。”

编辑/樊宏伟

相关阅读
ChatGPT两周后将进入“草莓”时代?
每日经济新闻 2024-09-17
OpenAI放大招!
第一财经 2024-09-17
OpenAI重磅发布!允许企业客户定制最强AI模型
每日经济新闻 2024-08-21
GPT-4o模仿人声说“不” 无意的语音生成仍是模型弱点
澎湃新闻 2024-08-13
OpenAI放大招!即日起向部分用户推出GPT-4o语音模式
每日经济新闻 2024-08-01
比GPT-3.5 Turbo便宜超60% OpenAI推出小模型卷性价比
每日经济新闻 2024-07-22
北京大明眼镜:孩子注意力不集中,可能是视功能问题惹的祸
北京青年报客户端 2024-07-22
推理能力接近类人水平?OpenAI神秘项目“草莓”被曝光!
每日经济新闻 2024-07-13
最新评论