Auto-GPT:让人工智能自主迭代,探索AGI的边界
最近,ChatGPT的横空出世引发了AI领域的巨大变革,各种基于大型语言模型的二次开发项目层出不穷。其中,Auto-GPT无疑是近期最受瞩目的焦点之一,它在GitHub上获得了超过6万个点赞,充分体现了其在AI社区中的影响力。
Auto-GPT自诩为一个实验性的开源应用程序,旨在展示GPT-4语言模型的强大能力。它由GPT-4驱动,能够自主地进行企业开发和管理,从而实现净值的增长。作为GPT-4完全自主运行的早期案例,Auto-GPT正在推动人工智能的可能性边界,探索通用人工智能(AGI)的新方向。
过去,我们使用ChatGPT时,需要通过精心设计的“咒语”来引导它完成任务。如果输入的指令不够精确,ChatGPT可能会给出不尽如人意的结果。只有当我们不断尝试,找到合适的“咒语”时,才能让ChatGPT高效地完成任务。这种模式被称为“人在回路”,强调人类在AI系统中的干预作用。正如《流浪地球2》中MOSS对图恒宇所说,需要基于对丫丫意识进行人在回路的学习。
然而,一个真正成熟的通用人工智能(AGI)应该具备自我迭代和思考的能力,从而独立完成既定目标。例如,当导师询问“Mp1p蛋白有什么作用?”时,一个合格的研究人员会主动查阅相关文献,进行分析和总结。Auto-GPT正是致力于实现这一目标,它试图让人工智能像人类一样,通过自我迭代思考来完成任务。为此,Auto-GPT具备以下关键特性:
- 接入互联网: 能够通过搜索和信息收集获取广泛的知识。
- 长短期内存管理: 具备良好的记忆力,能够对重要信息进行长期存储,并快速访问短期记忆,以便及时处理任务。
- GPT-4文本生成: 能够利用GPT-4生成高质量的文本,例如文章、邮件等。
- 访问流行网站和平台: 能够像人类一样,了解最新的时事和热门话题。
- GPT-3.5文件管理: 能够高效地进行文件存储和管理。
Auto-GPT的部署流程
在部署Auto-GPT之前,需要确保满足以下必备条件:
- 网络连接畅通: 这是使用Auto-GPT的基础。
- 拥有OpenAI API Key: 需要注册OpenAI账号并获取API Key,无需PLUS账号。
- 安装Python 3.8或更高版本: 建议使用Anaconda环境进行管理。
此外,以下项目是可选的,但可以增强Auto-GPT的功能:
- PINECONE API Key: 用于增强记忆功能。
- GOOGLE API KEY和CUSTOM SEARCH ENGINE ID: 用于接入谷歌搜索引擎。
第一步:下载项目
- 从Auto-GPT的GitHub仓库下载项目压缩包。
- 将压缩包解压到本地目录,建议使用全英文路径,例如
E:\Auto-GPT\Auto-GPT-master-0415
。
第二步:安装Python依赖库
项目所需的依赖库位于
requirements.txt
文件中,共有26个。首先,安装Anaconda,打开Anaconda Prompt,并创建一个新的虚拟环境:
conda create -n gptac_venv python=3.9
激活新创建的虚拟环境:
conda activate gptac_venv
将路径切换到项目所在的目录:
e: cd E:\Auto-GPT\Auto-GPT-master-0415
使用pip安装依赖库:
python -m pip install -r requirements.txt
安装过程可能需要较长时间,具体取决于网络速度。建议开启网络加速工具。
第三步:配置OPENAI API KEY
确保网络畅通。
访问OpenAI平台,登录账号并生成API Key:https://platform.openai.com/account/api-keys
将项目目录中的
.env.template
文件重命名为.env
,并使用文本编辑器打开,填入你的API Key。OPENAI_API_KEY=你的API密钥
注意:API Key不需要双引号。
第四步:配置PINECONE API KEY
确保网络畅通。
访问Pinecone网站,注册并登录账号:https://login.pinecone.io/
获取PINECONE API KEY(Value)和PINECONE ENV(Environment)。
将API Key和Environment填入
.env
文件:PINECONE_API_KEY=你的Pinecone API密钥 PINECONE_ENV=你的Pinecone环境
第五步:配置GOOGLE搜索引擎
需要填入GOOGLE API KEY和CUSTOM SEARCH ENGINE ID。
确保网络畅通。
访问Google Cloud Console,注册并登录账号:https://console.cloud.google.com/welcome?project=high-unity-383319&pli=1
创建一个新的项目。
在API和服务中,启用Custom Search API。
创建API密钥,复制API密钥。
访问Programmable Search Engine,创建自定义搜索引擎:https://programmablesearchengine.google.com/about/
复制搜索引擎ID。
将API Key和搜索引擎ID填入
.env
文件:GOOGLE_API_KEY=你的Google API密钥 CUSTOM_SEARCH_ENGINE_ID=你的搜索引擎ID
第六步:运行程序
打开Anaconda Prompt,切换到虚拟环境和项目目录。
运行以下命令:
python -m autogpt --gpt3only
出现绿色字“Welcome back”表示程序启动成功。
简单用法:为AI取一个名字,设置角色和目标,然后根据程序的提示,使用y
、n
等指令来指挥Auto-GPT。
Auto-GPT测评:以真菌Mp1p蛋白研究为例
为了测试Auto-GPT的功能,我设置了以下目标:
- Name: JET-GPT
- Role: A mycologist with a focus on disseminated fungal infections
- Goals: Introduce the research progress of fungal Mp1p protein
简单来说,我希望Auto-GPT能够介绍真菌Mp1p蛋白的研究进展。由于我之前运行过程序,它自动调用了上次的设置。输入y
继续运行:
程序首先会进行任务拆分,然后开始在谷歌上搜索相关信息。它会分析搜索结果,并尝试从中提取有用的信息。Auto-GPT甚至会自我反思,例如,它意识到自己的短期记忆有限,因此决定启动一个经过文本摘要训练的GPT代理来辅助完成任务。
在搜索和分析文献后,Auto-GPT给出了一些总结。然而,结果并不完全准确。经过进一步的引导,它逐渐意识到我感兴趣的是真菌的Mp1p蛋白。随后,它继续在网上查找相关文献,但由于GPT3.5的限制,无法读取所有文献的信息。最终,它只能从已知的知识中提取信息,并可能进行了一些推测。
虽然这次测试的结果并不完美,但Auto-GPT展现出的自主思考和迭代能力令人印象深刻。考虑到它仍处于早期阶段,并且我只能调用GPT3.5,未来Auto-GPT的提升空间非常巨大。
几点注意事项
- 关于不能联网: 有传言称,需要修改
.env
文件中的某个参数(将8000改为4000),但具体效果有待验证。 - 关于API Key的费用: 调用OpenAI API Key会产生费用。新注册的账号通常会赠送一定的额度(例如5美元),用完后需要付费。因此,在使用Auto-GPT时,需要注意控制成本。
本次测试中,我花费了0.13美元,约合1元人民币。虽然成本不高,但随着使用频率的增加,费用也会相应增加。所以,请大家在体验Auto-GPT的同时,注意合理控制成本。
Auto-GPT的出现,无疑为AGI的发展带来了新的希望。尽管它目前仍存在一些局限性,但其自主学习和迭代的能力,预示着人工智能未来发展的巨大潜力。