谷歌近日发布了独立iOS版本的Gemini聊天机器人应用,这标志着Gemini从最初的谷歌App内嵌功能走向了更广阔的应用生态。此前,iOS用户只能通过谷歌App内的Gemini选项卡来体验这项AI服务,而现在,他们可以拥有一个独立的、功能更加完善的Gemini应用。这一举措无疑提升了用户的使用便捷性,也预示着谷歌正在加速其AI产品线的独立化和专业化。
这款独立应用在功能上进行了显著扩展,除了传统的文本聊天功能外,还增加了对图片和语音的支持。用户现在可以直接拍摄照片或从相册中选择图片,然后将这些图片发送给Gemini进行分析和讨论。这一功能极大地拓展了 Gemini的应用场景,使其能够处理更加复杂的任务,例如图像识别、场景理解和基于图像的创意生成。此外,iOS版本的Gemini还支持文生图功能,用户只需输入对图片的描述,Gemini即可生成相应的图像,这为用户提供了更加便捷的内容创作方式。
语音模式是此次更新的另一大亮点。谷歌将其命名为“Gemini Live”,实质上是一种交互式的语音对话功能,类似于ChatGPT的语音模式。用户可以通过语音与AI进行自然流畅的对话。值得一提的是,Gemini Live支持随时打断,这一特性使得对话体验更加自然,更贴近人与人之间的交流方式。此前,Gemini Live功能仅在Android应用上可用,此次登陆iOS平台无疑将吸引更多的用户。
图片和语音功能对所有用户开放,无需额外付费。这意味着,即使是免费用户也可以体验到Gemini的强大功能,这无疑提升了Gemini的市场竞争力。
尽管发布时间不长,Gemini已经迅速攀升至iOS生产力应用排行榜的第四名,仅次于ChatGPT、Gmail和微软验证。这一成绩充分证明了Gemini在用户中的受欢迎程度,也反映了AI技术在生产力工具领域的巨大潜力。Gemini的快速崛起,无疑给其他同类应用带来了巨大的竞争压力。
Gemini的iOS和安卓版本均已提供下载。但需要注意的是,iOS版本目前在部分国家和地区尚未开放,用户可能需要切换App Store账号地区才能下载。目前已支持的地区包括美国、英国、澳大利亚和印度等。安卓用户则可以直接在谷歌Play Store应用商店下载。
一款AI工具的性能表现,很大程度上取决于其搭载的AI模型。谷歌Gemini的基础模型(免费版本)已于今年7月切换到Gemini 1.5 Flash。这是一款参数较小的模型,类似于GPT-4o和GPT-4o mini的关系。而对于付费用户,Gemini提供的高级模型为Gemini 1.5 Pro。这是一款拥有100万tokens上下文、支持多模态的模型,能够处理更加复杂的任务。
在LMSYS Leaderboard排行榜中,Gemini 1.5 Pro大致处于仅次于GPT-4o和o1系列模型的第二梯队。而Gemini 1.5 Flash则与GPT-4o mini排名相近。这些数据表明,Gemini在AI模型性能方面具有一定的竞争力,尤其是在长文本处理和多模态任务方面。
关于Gemini的付费模式,我的建议是:非必需不付费。Gemini的付费会员名为“Gemini Advanced”,价格为每月20美元。但需要注意的是,Gemini Advanced并非一个独立的订阅计划,而是与Google One捆绑在一起的。也就是说,每月支付20美元,用户可以同时获得Gemini Advanced和Google One会员,其中包括2TB的Google Drive网盘空间。
目前,Gemini Advanced提供一个月的免费体验,用户可以在到期前取消会员,以避免被扣款。之所以建议“非必需不付费”,主要是因为市场上存在其他更具竞争力的选择。例如,综合体验方面,同等价格的ChatGPT Plus会员明显更胜一筹,功能更加全面。而在代码处理方面,Claude Pro则更具优势,价格也与Gemini Advanced相同。
此外,Gemini的免费版本已经提供了相当不错的使用体验,包括文生图和实时语音功能Gemini Live。对于那些对高级模型有需求的用户,也可以在谷歌AI Studio免费使用Gemini 1.5 Pro。综合来看,Gemini的免费版本已经能够满足大部分用户的需求,付费版本则更适合那些对AI性能有更高要求的专业人士。
总的来说,虽然不推荐付费,但免费版的Gemini仍然值得一试,特别是其实时语音功能Gemini Live。这一功能为用户提供了一种全新的交互方式,使得人与AI之间的沟通更加自然和高效。Gemini的发布,无疑为AI领域注入了新的活力,也为用户带来了更多的选择。