Gemini-Exp-1121免费用:谷歌AI Studio实战指南,AI模型巅峰之作

5

在人工智能(AI)技术日新月异的今天,AI不再是遥不可及的概念,而是成为了我们提升效率、拓展能力的强大“外挂”。作为一名长期关注AI领域的互联网技术产品经理,我坚信AI能够赋能每一个人,让普通人也能拥有强大的力量。今天,我将为大家深入解析谷歌最新的模型Gemini-Exp-1121,并分享如何免费使用这一强大工具。

在昨天的文章中,我提到了Gemini-Exp-1121在最新的**LMSYS聊天机器人排行榜(Chatbot Arena Leaderboard)**上超越了GPT-4oo1以及Claude 3.5 Sonnet,荣登榜首。这一成绩不仅代表了LMSYS官方的认可,也预示着AI技术发展的新方向。

LMSYS排行榜

两种方式体验Gemini-Exp-1121

目前,使用Gemini-Exp-1121主要有两种方式:谷歌AI StudioAPI调用。本文将重点介绍如何通过谷歌AI Studio免费使用该模型。

谷歌AI Studio地址https://aistudio.google.com

首先,打开谷歌AI Studio的官方链接,点击左下角的Sign in登录,使用任意一个谷歌账号(Gmail账号)即可。

登录谷歌AI Studio

登录后,你会看到两种使用Gemini模型的方式。选择第一种方式,即直接在谷歌AI Studio中使用,点击Use Google AI Studio,然后点击New Prompt

创建新的Prompt

谷歌AI Studio的操作界面主要分为左、中、右三个部分,下面我将详细介绍每个部分的功能。

1. 项目名称(Untitled prompt)

  • 位于界面顶部,用于为当前的Prompt项目自定义命名,方便管理和区分不同的任务。

2. 系统提示词(System Instructions)

  • 提供可选的语气和风格指令,用于定义AI生成内容的上下文、语气、风格等。
  • 这里的系统提示词类似于AI Agent中的提示词,即告诉大模型它在本次任务中的角色(Role)、简介(Profile)、背景信息(Background)、目标(Goals)、技能(Skills)、限制条件(Constraints) 等细节。建议使用结构化提示词,以获得更好的效果。你可以根据不同的任务设定不同的角色,例如“你是专业的文案撰写员”、“你是资深的法律顾问”等,从而使模型更好地理解你的需求。

3. 聊天输入框(Type something)

  • 位于界面底部,用于输入问题或指令,与模型进行交互。

4. 模型选择(Model)

  • 模型选择:在右侧菜单中,可以通过下拉框选择不同的Gemini模型。截图中默认选的是Gemini 1.5 Flash。部分模型在鼠标选中后会在左侧显示模型的详细信息。
  • Token计数(Token Count):显示当前模型的上下文长度和Token消耗情况。例如,最新的gemini-1.5-pro-002模型,其上下文窗口达到了惊人的200万tokens!这意味着它可以处理非常长的文本,并从中提取关键信息,这在处理复杂文档、分析大量数据等方面具有显著优势。在实际应用中,我们可以利用这一特性,将大量的背景资料、参考文档等输入模型,从而获得更加精准、全面的回答。

模型选择和Token计数

5. 温度(Temperature)

  • 位于右侧菜单的中间,通过滑块调整生成内容的随机性。
    • 温度值低(如0):生成的内容更确定性和一致,适合精确回答和事实性任务。例如,在进行数据分析、报告撰写等需要高度准确性的场景中,我们可以将温度值设置为较低的水平,以确保模型输出的内容尽可能地贴近事实。
    • 温度值高(如1或更高,最高为2):生成的内容更随机、更具创造性,适合创意写作和头脑风暴。例如,在进行小说创作、广告语设计等需要创新思维的场景中,我们可以适当提高温度值,以激发模型的创造力,产生更多意想不到的想法。

6. 工具(Tools)

  • 包括多个选项,可根据任务需求启用:
    • Structured output:用于生成结构化输出,可以编辑Schema来定义生成的格式。这对于需要将AI生成的内容用于数据分析、报表生成等场景非常有用。通过定义Schema,我们可以确保模型输出的数据具有统一的格式,方便后续处理。
    • Code execution:允许模型运行代码。这意味着模型不仅可以理解代码,还可以执行代码,并将结果反馈给你。这在进行数据分析、算法验证等场景中非常实用。
    • Function calling:启用后,模型可以调用预定义的函数。这使得模型可以与外部系统进行交互,例如调用API获取数据、发送邮件等。通过Function calling,我们可以将AI模型与实际业务流程相结合,实现更高级的自动化。
    • Grounding:启用后引入外部搜索结果(谷歌搜索),为回答提供额外信息。这可以帮助模型获取最新的信息,并提供更全面、准确的回答。在回答一些需要实时信息的提问时,Grounding功能尤为重要。

7. 创建新Prompt(Create new prompt)

  • 位于左侧导航栏,点击后可以创建一个新的Prompt任务。

8. 其他

  • 左侧导航栏:
    • Get API key:用于获取Gemini模型的API Key,以便在自己的应用程序中使用Gemini模型。
    • My library:管理自己的Prompt库,方便重复使用和管理。
    • Prompt Gallery:浏览和选择已有的Prompt模板,可以从中获取灵感。
    • Developer documentationDeveloper forum:提供开发者文档和其他资源,帮助开发者更好地使用Gemini模型。

谷歌AI Studio界面

Gemini-Exp-1121实战测评

以下测试均选择Gemini-Exp-1121模型进行。

1. 草莓测试

Strawberry一词中有多少个字母“r”?

回答正确。

草莓测试结果

在接下来的解释中,思路也很清晰。

草莓测试解释

2. 辛普森悖论

小明从A班调去了B班,结果A和B两个班的平均分都比上升了,请问这是为什么?

这道题来自于统计学中著名的“辛普森悖论”(Simpson's Paradox),指在分组数据中出现的一种现象,即当数据合并时,会出现与分组数据相反的趋势。辛普森悖论在现实生活中经常出现,例如在医学研究、市场营销等领域。理解辛普森悖论可以帮助我们更准确地分析数据,避免得出错误的结论。

Gemini-Exp-1121的回答正确,解释也提到了“辛普森悖论”,在解释为什么时总体思路正确。但给出的具体例子中存在一定的小问题。在实际应用中,我们需要对模型的回答进行一定的验证,以确保其准确性。

辛普森悖论测试结果

3. 逻辑推理

三个囚犯 A、B 和 C,分别戴着红帽或蓝帽(但无法看到自己的帽子)。守卫说:“至少有一个囚犯戴着红帽。” A 说:“我不知道我的帽子颜色。” B 说:“我也不知道。” C 说:“我知道了。” 问 C 的帽子是什么颜色?

还是这道经典的“红蓝帽子”的问题。这道题考察的是逻辑推理能力,需要综合考虑各种可能性。Gemini-Exp-1121的回答完全正确,解释清晰明了,有理有据。这表明Gemini-Exp-1121在逻辑推理方面具有很强的能力。

红蓝帽子测试结果

总的来说,Gemini-Exp-1121在语言理解、逻辑推理等方面都表现出了强大的能力。通过谷歌AI Studio,我们可以免费体验这一强大的AI模型,并将其应用到各种实际场景中。无论是进行文本创作、数据分析,还是进行逻辑推理,Gemini-Exp-1121都能够为我们提供强大的支持。在未来,随着AI技术的不断发展,我们有理由相信,AI将会成为我们工作和生活中不可或缺的一部分。

通过以上测试可以看出,Gemini-Exp-1121在多种任务中都表现出色。它不仅能够准确理解问题,还能够给出清晰、有条理的答案。尤其是在逻辑推理方面,其表现令人印象深刻。当然,正如我在辛普森悖论测试中所指出的,我们仍然需要对模型的输出进行一定的验证,以确保其准确性。但总的来说,Gemini-Exp-1121是一款非常值得尝试的AI模型。

希望本文能够帮助大家更好地了解和使用Gemini-Exp-1121。在AI的道路上,让我们一起探索,共同进步。