Auto-GPT实战：探索自主迭代AI，未来AGI雏形？

Auto-GPT：让人工智能自主迭代，探索AGI的边界

最近，ChatGPT的横空出世引发了AI领域的巨大变革，各种基于大型语言模型的二次开发项目层出不穷。其中，Auto-GPT无疑是近期最受瞩目的焦点之一，它在GitHub上获得了超过6万个点赞，充分体现了其在AI社区中的影响力。

Auto-GPT自诩为一个实验性的开源应用程序，旨在展示GPT-4语言模型的强大能力。它由GPT-4驱动，能够自主地进行企业开发和管理，从而实现净值的增长。作为GPT-4完全自主运行的早期案例，Auto-GPT正在推动人工智能的可能性边界，探索通用人工智能（AGI）的新方向。

过去，我们使用ChatGPT时，需要通过精心设计的“咒语”来引导它完成任务。如果输入的指令不够精确，ChatGPT可能会给出不尽如人意的结果。只有当我们不断尝试，找到合适的“咒语”时，才能让ChatGPT高效地完成任务。这种模式被称为“人在回路”，强调人类在AI系统中的干预作用。正如《流浪地球2》中MOSS对图恒宇所说，需要基于对丫丫意识进行人在回路的学习。

然而，一个真正成熟的通用人工智能（AGI）应该具备自我迭代和思考的能力，从而独立完成既定目标。例如，当导师询问“Mp1p蛋白有什么作用？”时，一个合格的研究人员会主动查阅相关文献，进行分析和总结。Auto-GPT正是致力于实现这一目标，它试图让人工智能像人类一样，通过自我迭代思考来完成任务。为此，Auto-GPT具备以下关键特性：

接入互联网： 能够通过搜索和信息收集获取广泛的知识。
长短期内存管理： 具备良好的记忆力，能够对重要信息进行长期存储，并快速访问短期记忆，以便及时处理任务。
GPT-4文本生成： 能够利用GPT-4生成高质量的文本，例如文章、邮件等。
访问流行网站和平台： 能够像人类一样，了解最新的时事和热门话题。
GPT-3.5文件管理： 能够高效地进行文件存储和管理。

Auto-GPT的部署流程

在部署Auto-GPT之前，需要确保满足以下必备条件：

网络连接畅通： 这是使用Auto-GPT的基础。
拥有OpenAI API Key： 需要注册OpenAI账号并获取API Key，无需PLUS账号。
安装Python 3.8或更高版本： 建议使用Anaconda环境进行管理。

此外，以下项目是可选的，但可以增强Auto-GPT的功能：

PINECONE API Key： 用于增强记忆功能。
GOOGLE API KEY和CUSTOM SEARCH ENGINE ID： 用于接入谷歌搜索引擎。

第一步：下载项目

从Auto-GPT的GitHub仓库下载项目压缩包。
将压缩包解压到本地目录，建议使用全英文路径，例如E:\Auto-GPT\Auto-GPT-master-0415。

第二步：安装Python依赖库

项目所需的依赖库位于requirements.txt文件中，共有26个。
首先，安装Anaconda，打开Anaconda Prompt，并创建一个新的虚拟环境：
```
conda create -n gptac_venv python=3.9
```
激活新创建的虚拟环境：
```
conda activate gptac_venv
```
将路径切换到项目所在的目录：
```
e:
cd E:\Auto-GPT\Auto-GPT-master-0415
```
使用pip安装依赖库：
```
python -m pip install -r requirements.txt
```
安装过程可能需要较长时间，具体取决于网络速度。建议开启网络加速工具。

第三步：配置OPENAI API KEY

确保网络畅通。
访问OpenAI平台，登录账号并生成API Key：https://platform.openai.com/account/api-keys
将项目目录中的.env.template文件重命名为.env，并使用文本编辑器打开，填入你的API Key。
```
OPENAI_API_KEY=你的API密钥
```
注意：API Key不需要双引号。

第四步：配置PINECONE API KEY

确保网络畅通。
访问Pinecone网站，注册并登录账号：https://login.pinecone.io/
获取PINECONE API KEY（Value）和PINECONE ENV（Environment）。

将API Key和Environment填入.env文件：

PINECONE_API_KEY=你的Pinecone API密钥
PINECONE_ENV=你的Pinecone环境

第五步：配置GOOGLE搜索引擎

需要填入GOOGLE API KEY和CUSTOM SEARCH ENGINE ID。
确保网络畅通。
访问Google Cloud Console，注册并登录账号：https://console.cloud.google.com/welcome?project=high-unity-383319&pli=1
创建一个新的项目。
在API和服务中，启用Custom Search API。
创建API密钥，复制API密钥。
访问Programmable Search Engine，创建自定义搜索引擎：https://programmablesearchengine.google.com/about/
复制搜索引擎ID。

将API Key和搜索引擎ID填入.env文件：

GOOGLE_API_KEY=你的Google API密钥
CUSTOM_SEARCH_ENGINE_ID=你的搜索引擎ID

第六步：运行程序

打开Anaconda Prompt，切换到虚拟环境和项目目录。
运行以下命令：
```
python -m autogpt --gpt3only
```
出现绿色字“Welcome back”表示程序启动成功。

简单用法：为AI取一个名字，设置角色和目标，然后根据程序的提示，使用y、n等指令来指挥Auto-GPT。

Auto-GPT测评：以真菌Mp1p蛋白研究为例

为了测试Auto-GPT的功能，我设置了以下目标：

Name: JET-GPT
Role: A mycologist with a focus on disseminated fungal infections
Goals: Introduce the research progress of fungal Mp1p protein

简单来说，我希望Auto-GPT能够介绍真菌Mp1p蛋白的研究进展。由于我之前运行过程序，它自动调用了上次的设置。输入y继续运行：

程序首先会进行任务拆分，然后开始在谷歌上搜索相关信息。它会分析搜索结果，并尝试从中提取有用的信息。Auto-GPT甚至会自我反思，例如，它意识到自己的短期记忆有限，因此决定启动一个经过文本摘要训练的GPT代理来辅助完成任务。

在搜索和分析文献后，Auto-GPT给出了一些总结。然而，结果并不完全准确。经过进一步的引导，它逐渐意识到我感兴趣的是真菌的Mp1p蛋白。随后，它继续在网上查找相关文献，但由于GPT3.5的限制，无法读取所有文献的信息。最终，它只能从已知的知识中提取信息，并可能进行了一些推测。

虽然这次测试的结果并不完美，但Auto-GPT展现出的自主思考和迭代能力令人印象深刻。考虑到它仍处于早期阶段，并且我只能调用GPT3.5，未来Auto-GPT的提升空间非常巨大。

几点注意事项

关于不能联网： 有传言称，需要修改.env文件中的某个参数（将8000改为4000），但具体效果有待验证。
关于API Key的费用： 调用OpenAI API Key会产生费用。新注册的账号通常会赠送一定的额度（例如5美元），用完后需要付费。因此，在使用Auto-GPT时，需要注意控制成本。

本次测试中，我花费了0.13美元，约合1元人民币。虽然成本不高，但随着使用频率的增加，费用也会相应增加。所以，请大家在体验Auto-GPT的同时，注意合理控制成本。

Auto-GPT的出现，无疑为AGI的发展带来了新的希望。尽管它目前仍存在一些局限性，但其自主学习和迭代的能力，预示着人工智能未来发展的巨大潜力。