针对OpenAI公司暂停字节跳动访问API的消息,字节跳动周一回应第一财经记者称,其使用OpenAI的技术来帮助开发自己的人工智能大模型,符合这家美国公司的服务条款,并未涉及利用OpenAI技术构建竞争性的产品。
根据OpenAI的说法,尽管字节跳动使用OpenAI的API较少,但公司正在进一步调查其使用规范性,并在调查期间暂停了字节跳动的帐户。OpenAI称,如果在调查中发现字节跳动的使用不遵守服务政策,将会要求他们进行必要的更改或终止他们的帐户。
字节跳动在发给第一财经记者的一份《关于OpenAI服务使用情况的澄清》声明中表示:“公司在使用OpenAI相关服务时,强调要遵守其使用条款。我们也正与OpenAI联系沟通,以澄清外部报道可能引发的误解。”
字节跳动承认,公司今年年初开始探索构建大模型,有部分工程师将GPT的API服务应用于较小模型的实验性项目研究中。“该模型仅为测试,没有计划上线,也从未对外使用。在4月公司引入GPT API 调用规范检查后,这种做法已经停止。”声明称。
字节跳动还表示,早在今年4月,字节大模型团队已经提出了明确的内部要求,不得将GPT模型生成的数据添加到字节大模型的训练数据集,并培训工程师团队在使用GPT时遵守服务条款。
今年9月,公司内部又进行了一轮检查,采取措施进一步保证对GPT的API 调用符合规范要求。例如分批次抽样检测模型训练数据与GPT的相似度,避免数据标注人员私自使用GPT。“未来几天里,我们会再次全面检查,以确保严格遵守相关服务的使用条款。”声明写道。
一家总部位于美国的AI大模型开发商对第一财经记者表示:“OpenAI暂停字节跳动的访问,本质上还是出于对AI竞争的担忧。”
两家公司的矛盾凸显了全球大模型的激烈竞赛。自从去年11月OpenAI推出基于GPT3.5模型的聊天机器人ChatGPT以来,引发了全球范围内的大模型浪潮。据不完全统计,截至今年11月底,我国涉及10亿参数规模以上的大模型厂商及高校院所已超过200家。
字节跳动被曝已于大约一年前在内部启动了基础大语言模型开发,拥有2000亿个参数,代号“Seed”。该项目下的两个主要产品,一个即已在国内运营的聊天机器人平台“豆包”,另一个是计划通过火山引擎对外提供服务的机器人平台。
今年6月,字节跳动旗下火山引擎发布大模型服务平台“火山方舟”,面向企业提供模型精调、评测、推理等全方位的平台服务(MaaS),目前集成了百川智能、出门问问、复旦大学MOSS、IDEA研究院、澜舟科技、MiniMax、智谱AI等多家AI科技公司及科研团队的大模型,类似于为各行各业提供了一个“大模型商场”。
另据透露,Seed的任务是在今年年底前达到GPT-3.5的性能,到2024年年中达到GPT-4的性能。
编辑/樊宏伟