ChatGPT还能再进化?OpenAI正寻求伙伴 生成更多AI训练数据
财联社 2023-11-10 14:01

美东时间周四,OpenAI在其官网发布博客文章称,它打算寻求合作伙伴,生产用于训练人工智能(AI)模型的公共和私人数据集。

目前,OpenAI旗下的ChatGPT主要基于大型语言模型生成内容,而这些模型目前完全是依靠互联网上可用的开源数据上训练出的。

在OpenAI的最新博客中,该公司表示,其对于那些目前还不容易在网上向公众开放的、能够反映人类社会的大规模数据集感兴趣。

这意味着,ChatGPT可能正寻求有助于生成更细致入微的训练数据、在风格上更像对话的数据。

该公司在博客文章中表示:“我们特别寻找能够表达人类意图的数据,无论语言、主题和格式如何。”

OpenAI表示,它目前所寻求的合作方式有两种,未来还可能扩大。

第一,它希望其合作伙伴能够帮助该公司创建一个用于训练语言模型的开源数据集。该数据集将公开,任何人都可以在人工智能模型训练中使用。

第二,OpenAI还在准备私人数据集,用于训练专有的人工智能模型。

该公司称:“如果你有希望保密的数据,但你希望我们的人工智能模型更好地了解你的领域(或者你甚至只是想衡量你的数据的潜力),这是最佳的合作方式。我们会按照你喜欢的敏感程度和访问控制来处理你的数据。”

编辑/范辉

相关阅读
“越大越好”的路径走不通?OpenAI正在寻求训练模型的新方法
财联社 2024-11-12
OpenAI重磅发布!允许企业客户定制最强AI模型
每日经济新闻 2024-08-21
OpenAI正研发ChatGPT文本水印技术以增强内容溯源与版权保护
第一财经 2024-08-05
OpenAI开发神秘项目“草莓”提升模型智能 工作原理严格保密
澎湃新闻 2024-07-22
OpenAI训练数据从哪里来、与苹果合作进展如何?“ChatGPT之母”最新回应
​每日经济新闻 2024-07-16
OpenAI 与医疗公司再牵手!开发AI助手辅助癌症筛查和治疗
第一财经 2024-06-18
OpenAI“超级对齐”团队解散后 谁还能为AI失控负责?
第一财经 2024-05-22
为了拥有更多数据 OpenAI牵手“美国贴吧”
澎湃新闻 2024-05-19
最新评论