Gemini Live 现已向所有人免费开放:为 Android 免费用户提供 10 种新声音
2024年10月7日
什么是Gemini
与OpenAI的ChatGPT、微软的Copilot和Apple Intelligence一样,Google Gemini 是人工智能 (AI) 和聊天机器人领域的主导力量之一。Gemini 既是 Google 聊天机器人的名称,也是支持它的 LLM,它可以通过网络浏览器或移动设备免费使用,但有一个付费版本,称为 Gemini Advanced,它有一些有趣的功能,比如 Gemini Live。
Google Gemini 于 2024 年 2 月一经推出,立即在 AI 领域掀起了波澜,但真正让它名声大噪的是 2024 年 8 月在 Made for Google 活动上发布的Gemini Live。Gemini LIve 是 Gemini 的一个版本,可在 Android 手机上运行,让您无需在键盘上打字,就能用语音自由地讨论复杂话题。但 Gemini Live 足以击败苹果的 AI 增强型 Siri 或即将推出的 ChatGPT 语音模式吗?它现在能做什么,未来又能做什么?如果您想使用 Gemini,您究竟该怎么做?我们深入研究了 Gemini 的世界,以找到所有这些问题的答案,甚至更多。如果您对谷歌最新的 AI 努力感到好奇,这里就是您要来的地方。
Gemini 不仅仅是一个人工智能模型,它也是其聊天机器人(之前称为Bard)的新名称和身份。本质上,谷歌通过将底层模型和聊天机器人本身都称为 Gemini,简化了流程。此外,现在有一款适用于 Android 的免费 Gemini 应用程序,如果您愿意,Gemini 可以取代Android 手机上的 Google Assistant 。在 iOS 上,Gemini 存在于 Google 应用程序中。还有一个免费版的 Google Gemini,可通过任何互联网浏览器访问。
Gemini 是一门多模态法学硕士。换句话说,它可以处理各种形式的输入和输出,包括文本、代码、音频、图像和视频。这使其具有很大的灵活性来执行各种任务。上传图像(或用智能手机拍摄图像),Gemini 可以分析图像并告诉你有关它的信息。将一些代码粘贴到 Gemini 提示框中并要求它重写它,Gemini 就可以做到这一点。
Gemini 与 GPT-4 相比如何
首先,Gemini 首次亮相时,谷歌声称它比 GPT-4 更先进。在一篇博客文章中,谷歌展示了 8 项基于文本的基准测试的结果,Gemini 在其中 7 项测试中获胜。至少谷歌表示,在 10 项多模式基准测试中,Gemini 在每一项测试中都名列前茅。
这似乎意味着 Gemini 是更优越的系统,但当然事情并没有那么简单。GPT-4 于 2023 年 3 月问世,Gemini 1.5 Pro 于 2 月问世,Gemini 1.5 Flash 于 2024 年 5 月问世。因此,Gemini 再次赶上了竞争对手的 AI 工具。我们不知道 OpenAI 的下一个 GPT 版本有多强大,而且除了谷歌自己有限的基准测试之外,这场战斗中还有许多细微差别,所以目前很难说哪个才是真正的更好工具。
此外,谷歌只将其更先进的模型 Gemini Ultra 与 GPT-4 进行对比,而不是 Gemini Pro。鉴于 GPT-4 和 Gemini Ultra 之间的差距通常很小,OpenAI 的模型似乎很有可能胜过 Gemini Pro。
Gemini Live智能助手
Gemini Live 是 Google 智能助手 Gemini 的一项语音对话功能,用户可以随心所欲地与 Gemini 聊天。它提供了多种不同的语音选项,并且能够更好地处理实际对话中的暂停和打断等功能。它还具有上下文保留功能,这意味着它会记住之前的互动,使后续对话更有意义。
Google 已开始向 Android 免费用户推出 Gemini Live,并增加了 10 种新声音。该功能于 8 月首次面向 Gemini Advanced 用户推出,现已全面向所有英语用户推出。“Gemini Live 现已在 Android 应用上面向所有英语版 Gemini 用户开放。我们迫不及待地想让你试用它,”Google Gemini App 帐户在 X 上的一篇帖子中宣布。使用 Gemini Live,用户可以与 Gemini 进行类似自然对话的交流。该功能可以从 Gemini 覆盖层或应用程序的右下角访问。据 9to5Google 报道,用户界面将扩展到全屏,底部包含“保持”和“结束”按钮。该应用程序也可以关闭,而 Gemini Live 继续在后台运行。用户可以通过说“停止”或向下滑动以访问通知来结束会话。
据报道,对话会附有文本记录,显示用户的提示和 Gemini 的回复,允许用户重新开始会话。目前,Live 不支持 Gemini Extensions 通过实时聊天访问 Gmail 和 YouTube Music 等服务,但此功能正在开发中,相机功能也是 Project Astra 的一部分。此外,谷歌计划在未来将 Gemini Live 引入 iOS 应用。用户还可以强制停止 Gemini 应用以触发新的更新。
Gemini Live 的 10 种新声音适用于所有 Gemini。要访问这些声音,请导航至 Gemini 设置,然后导航至 Gemini 的声音。新的声音选项包括:
- Nova: Calm – Mid-range voice
- Ursa: Engaged – Mid-range voice
- Vega: Bright – Higher voice
- Pegasus: Engaged – Deeper voice
- Orbit: Energetic – Deeper voice
- Lyra: Bright – Higher voice
- Orion: Bright – Deeper voice
- Dipper: Engaged – Deeper voice
- Eclipse: Energetic – Mid-range voice
- Capella: British accent – Higher voice
谷歌在 Pixel 9 系列手机发布会上带来了 Gemini Live,该服务提供了一种移动对话体验,让用户和 Gemini 展开自由流畅的对话。Gemini Live 是对标 OpenAI ChatGPT 最新上线的 Advanced Voice 模式(限量 Alpha 测试),采用了增强型语音引擎,可以展开更连贯、更有情感表达力、更逼真的多轮对话。
在 Android 移动设备上与 Gemini 自然地实时聊天
借助 Gemini Live,你可以与 Gemini 进行顺畅自然的对话。你甚至可以打断 Gemini,比如当你想添加更多详情或更改对话主题时,都可以打断它。借助 Gemini Live,你可以:
- 连续对话:无需打字就能与 Gemini 对话,Gemini 将给出语音回答。
- 语音头脑风暴:让 Gemini 出谋划策,构思礼物创意、策划活动或制定业务计划。
- 深层探索:深入了解感兴趣的主题。
- 大声练习:以更自然的对话形式排练重要活动。
重要提示:我们正在逐步推出 Gemini Live 的更新,因此您可能暂时无法使用最新功能。
所需条件
- Android 手机或平板电脑。
- Gemini 移动应用,或者将 Gemini 用作手机助理。
- 目前,无法在 iPhone 上通过 Gemini Web 应用、Google 信息中的 Gemini 或 Google 应用中的 Gemini 标签页使用 Gemini Live。
- 拥有一个自行管理的个人 Google 账号。
- 目前,在登录工作 Google 账号或学校 Google 账号的情况下,Gemini Live 不可用。
- 设置中的第一语言必须是支持的语言。了解如何更改语言。
- 年满 18 周岁。
- 目前 Gem 无法与 Gemini Live 搭配使用。