谷歌发布人工智能大模型Gemini:包含三个版本,擅长数学和物理推理
北京青年报客户端 2023-12-07 15:55

12月7日凌晨,谷歌宣布推出谷歌自己的人工智能模型Gemini。谷歌首席执行官桑达尔·皮查伊表示,“这是谷歌人工智能新时代的开始”。

根据皮查伊和 Google DeepMind 首席执行官 Demis Hassabis 的描述,这是人工智能模型的巨大飞跃,最终将影响几乎所有的 Google 产品。据介绍,Gemini可以适配包括数据中心和移动设备等多种产品。Demini拥有三个版本:其一是Gemini Nano,负责 Android 设备上本地离线运行,是侧端设备上最高效的模型;其二是Gemini Pro,它相比与Nano更强大,它将为许多 Google AI 服务提供支持,并且Bard宣布将使用Gemini Pro来进行新的升级;其三是Gemini UItra,它是 Google 迄今为止创建的最强大的模型,以大型语言模型(LLM)研究和开发中广泛使用的 32 项学术为基准,Gemini Ultra 的性能有 30 项都超过了目前最先进的水平,它适用于完成高度复杂的任务,主要是为数据中心和企业应用程序设计的。

值得注意的是,据Demis Hassabis描述,Gemini从一开始就被创建为多模态的模型,这意味着它可以归纳并流畅地理解、操作以及组合不同类型的信息,包括文本、代码、音频、图像和视频。比如它经过训练,可以同时识别并理解文本、图像、音频等,因此它能更好地理解具有细微差别的信息,回答与复杂主题相关的问题。这就让它尤其擅长解释数学和物理等复杂科目中的推理。

据谷歌自己称,“从自然图像、音频和视频理解到数学推理,在被大型语言模型(LLM)研究和开发中广泛使用的 32 项学术基准中,Gemini Ultra 的性能有 30 项都超过了目前最先进的水平。”

目前,Gemini1.0产品已在多种产品和平台上推出。谷歌公司计划通过 Google Cloud 将 Gemini 授权给客户,供他们在自己的应用程序中使用。从 12 月 13 日开始,开发者和企业客户可以通过 Google AI Studio 或Google Cloud Vertex AI中的 Gemini API 访问 Gemini Pro。Android 开发者也可以通过 AICore 使用端侧任务最高效的模型 Gemini Nano进行构建。

谷歌表示,它将在 170 多个国家和地区提供英语服务,并且计划在未来几个月内扩展不同的模态,并支持新的语言和地区。下一步,谷歌将进一步扩展其未来版本的各种功能,包括在规划和记忆方面取得进展,以及通过增加上下文窗口来处理更多信息并提供更好的响应。明年年初,谷歌还将推出 Bard Advanced,这是一种全新的、前沿的 AI 体验,让用户可以从 Gemini Ultra 开始使用模型和功能。

实习生 应雨诺

文/北京青年报记者 温婧
编辑/樊宏伟

相关阅读
提前两个月抢跑!谷歌Pixel发布会成AI秀场,安卓手机未来集体上车Gemini
每日经济新闻 2024-08-15
挑战苹果?谷歌深夜发布四款AI手机 799美元起步
第一财经 2024-08-14
向苹果发起挑战?谷歌重磅发布AI加持系列手机, 5717元起步
每日经济新闻 2024-08-14
谷歌展台“挤满”中国厂商 生成式AI走向应用开发层
第一财经 2024-08-13
欧盟加大对AI巨头审查,OpenAI、微软与谷歌在列
第一财经 2024-06-29
谷歌在印度推出Gemini手机应用,支持英语和九种印度语言
​第一财经 2024-06-18
OpenAI跌倒,谷歌吃饱?ChatGPT宕机5小时,谷歌聊天机器人搜索激增
澎湃新闻 2024-06-05
OpenAI的“双重挑战”:谷歌全面反击,首席科学家出走
国际金融报 2024-05-16
最新评论