Обзор автономных агентов: BabyAGI, Auto-GPT, CAMEL и им подобных

Руководство по последним инновациям с открытым исходным кодом в области фреймворков автономных агентов с поддержкой ИИ.

Интерес к таким инструментам, как BabyAGI и Auto-GPT, огромен. Был ли когда-либо проект с открытым исходным кодом, который так быстро оказался в центре внимания разработчиков и творческих людей?

Скорость, с которой появляются новые версии и варианты этих фреймворков, поражает воображение. Так что, думаю, пришло время догнать последние релизы и посмотреть, как работают эти агенты, какие типы у нас есть на данный момент, и как вы можете попробовать их сами.

В этой статье мы рассмотрим:

Содержание

BabyAGI
Auto-GPT
AgentGPT
Godmode
Do Anything Machine
JARVIS от Microsoft
AI Legion
CAMEL
GPTRPG

BabyAGI

3 апреля Йохей Накаджима выложил в открытый доступ проект, над которым он работал для автоматизации процедуры управления личными задачами.

Иронично названный BabyAGI был выпущен на свободу!

Сценарий, лежащий в основе BabyAGI, удивительно прост (пусть вас не обманывает кажущаяся сложность схемы). По сути, это языковая модель, взаимодействующая со списком задач, целью которой является автоматическая генерация, определение приоритетов и выполнение задач на основе заранее определенной цели.

BabyAGI — это пример скрипта на Python для управления задачами с использованием искусственного интеллекта, который использует API от OpenAI и Pinecone для создания, приоритизации и выполнения задач. Основная идея системы заключается в том, что она создает задачи на основе результатов предыдущих задач и заранее определенной цели. Затем скрипт использует возможности обработки естественного языка (NLP) от OpenAI для создания новых задач на основе цели и Pinecone для хранения и извлечения результатов задач в контексте. Это упрощенная версия оригинальной системы управления задачами Task-Driven Autonomous Agent (от 28 марта 2023 года).

BabyAGI может быть использован для автоматизации процесса управления задачами, облегчая координацию и организацию работы. Он может быть полезен для команд, которые хотят оптимизировать свою работу и сделать процесс управления задачами более гибким и адаптивным.

Скрипт работает следующим образом:

Извлекает первую задачу из списка задач.
Отправляет задачу на выполнение агентом, который использует API OpenAI для выполнения задачи на основе контекста.
Обогащает результат и сохраняет его в Pinecone.
Создает новые задачи и переприоритизирует список задач на основе цели и результата предыдущей задачи.

Выполненные задания хранятся в базе данных и служат «памятью» языковой модели, из которой она может черпать контекст для создания и выполнения новых заданий. В базовом скрипте BabyAGI нет модулей для исследования Интернета или автономного выполнения кода. Однако эти возможности были реализованы в дочерних версиях. Посмотрите список проектов Йохея, основанных на BabyAGI: https://github.com/yoheinakajima/babyagi/blob/main/inspired-projects.md.

Веб-сайт: http://babyagi.org/

Twitter: https://twitter.com/babyAGI_

Github: https://github.com/yoheinakajima/babyagi

Auto-GPT

Посмотрите на историю людей, проявляющих энтузиазм к этому проекту с открытым исходным кодом на GitHub:

Auto-GPT — это экспериментальный проект с открытым исходным кодом, который использует GPT-4 для объединения «мыслей» ИИ (т.е. модель обдумывает, критикует и переоценивает задачи) и автономно пытается достичь указанной вами цели. Auto-GPT расширяет границы возможного в ИИ, наделяя модель способностью «выполнять команды», то есть она может решать, какие инструменты из заданного арсенала использовать и как их использовать. (вот краткое руководство по настройке и локальному запуску AutoGPT)

AutoGPT может исследовать веб-сайты, искать информацию, генерировать изображения, создавать и запускать код и т.д. Вот список текущих функций, которые он может выполнять:

Ссылка на GitHub: https://github.com/Significant-Gravitas/Auto-GPT

AgentGPT

AgentGPT переносит идею Auto-GPT/BabyAGI в веб. Вы можете развернуть свой собственный автономный агент через браузер здесь: https://agentgpt.reworkd.ai/.

На момент написания статьи в AgentGPT были добавлены следующие возможности:

Долгосрочная память через базу данных
Просмотр веб-страниц
Взаимодействие с веб-сайтами и людьми
Сохранение запусков агента

Website: https://agentgpt.reworkd.ai/

Twitter: https://twitter.com/asimdotshrestha/status/1644883727707959296

Github: https://github.com/reworkd/AgentGPT

Godmode

Говоря о веб-приложениях, вдохновленных Auto-GPT, есть еще одно, которое вы, возможно, захотите попробовать: Godmode. Это приложение также предоставляет пользователям интерактивный и удобный интерфейс, позволяя им использовать автономные агенты для решения задач.

Do Anything Machine

Еще один веб-проект, похожий на AutoGPT, — «Do Anything Machine». В настоящее время существует список ожидания для подачи заявки на получение раннего доступа к этому очень сложному проекту, целью которого является параллельная работа нескольких автономных агентов над задачами, при этом они имеют доступ к вашим приложениям и фоновой информации.

Веб-сайт: https://www.doanythingmachine.com/

JARVIS от Microsoft

Microsoft JARVIS, также известный как HuggingGPT, представляет собой систему совместной работы, которая использует несколько моделей ИИ для выполнения поставленной задачи, при этом в качестве контроллера выступают модели GPT от OpenAI.

JARVIS объединяет различные модели с открытым исходным кодом для работы с изображениями, видео, аудио и т.д., а также может подключаться к Интернету и получать доступ к файлам. Подобно BabyAGI и AutoGPT, JARVIS будет анализировать задания, а также выбирать подходящую модель для их выполнения.

App: https://huggingface.co/spaces/microsoft/HuggingGPT

Github: https://github.com/microsoft/JARVIS

AI Legion

Структура для автономных агентов, которые могут работать вместе для выполнения задач.

Это еще один интересный подход, когда вы взаимодействуете с несколькими агентами одновременно через консоль, где несколько агентов ИИ сотрудничают и общаются с вами для более эффективного выполнения задач.

Github: https://github.com/eumemic/ai-legion

CAMEL

CAMEL, сокращение от «Communicative Agents for ‘Mind’ Exploration of Large Scale Language Models», по сути, является ролевым подходом к циклической архитектуре BabyAGI & AutoGPT.

В CAMEL у вас есть два агента, которым вы назначаете определенные роли. Затем вы просто наблюдаете за тем, как они сотрудничают и работают вместе над решением вашей задачи.

Web Demo: http://agents.camel-ai.org/

Страница проекта: https://www.camel-ai.org/

Github: https://github.com/lightaime/camel

GPTRPG

Наконец, геймифицированный подход к парадигме автономных агентов можно найти в этом экспериментальном репо на GitHub: https://github.com/dzoba/gptrpg.

Репозиторий состоит из двух основных компонентов:

Простая RPG-подобная среда, в которой может существовать агент ИИ с поддержкой LLM.
Простой агент ИИ, подключенный к OpenAI API, для существования в этой среде.

Это основано на недавно опубликованной работе, в которой несколько агентов были развернуты для автономного участия в онлайн-игре. Это увлекательная концепция! Вы можете ознакомиться с документом и узнать больше об исследовании здесь: https://arxiv.org/abs/2304.03442.