В последние годы искусственный интеллект все больше внедряется в повседневную жизнь, и одним из ярких примеров такого применения является гуманоидный робот Ameca. В новом видео, опубликованном создателями робота, продемонстрировано, как алгоритм чат GPT-3 от OpenAI выбирает соответствующие мимические реакции для Ameca. Разработчики также провели сравнительные испытания с использованием чат GPT-4, чтобы продемонстрировать разницу во времени обработки и отзывчивости робота.
GPT-3 (сокращение от «Generative Pre-trained Transformer 3») — это модель машинного обучения, разработанная OpenAI, способная анализировать и обрабатывать информацию для генерации естественного языка и множества других задач. В контексте работы с Ameca, GPT-3 анализирует различные входные данные, такие как текст и аудио, чтобы выбрать наиболее подходящие мимические выражения для робота в реальном времени.
В сравнении с GPT-3, GPT-4 представляет собой более продвинутую модель, способную обрабатывать больше информации и предоставлять еще более точные результаты. Однако, как показали испытания, время обработки с использованием чат GPT-4 было дольше, что приводило к меньшей отзывчивости гуманоидного робота Ameca.
Согласно видео, разработчики Ameca использовали GPT-3 для обеспечения более быстрой и плавной работы робота. Благодаря этому решению, Ameca обладает высокой степенью отзывчивости и естественности взаимодействия с людьми, что делает его идеальным инструментом для различных областей применения, включая образование, исследования и развлечения.
С развитием технологий искусственного интеллекта, таких как GPT-4, можно ожидать, что гуманоидные роботы, вроде Ameca, будут способны работать еще точнее и быстрее. Сейчас чат GPT-4 имеет более длительное время обработки по сравнению с GPT-3, что делает его менее подходящим для обеспечения быстрой отзывчивости робота. Однако, по мере популяризации и оптимизации чат GPT-4, можно ожидать улучшений в его производительности и эффективности.
С прогрессом чат GPT-4 и его адаптацией для использования в робототехнике, роботы смогут обрабатывать и анализировать больше информации, что позволит им точнее реагировать на взаимодействия с людьми и окружающей средой. Это может привести к созданию роботов, которые лучше понимают человеческие эмоции, контекст и культурные различия, обеспечивая более естественное и бесшовное общение.
В дополнение к предыдущей информации о гуманоидном роботе Ameca, создатели робота объявили о том, что демонстрация использования GPT-3 также включает в себя общение и перевод. Робот использует сервис DeepL для определения языка, а голоса созданы с помощью Amazon Polly Neural Voices. Это позволяет Ameca общаться на разных языках, обеспечивая плавный и естественный перевод.
Создатели также сообщают о работе над интеграцией технологии голосового клонирования от Eleven Labs. Эта технология добавляет сложности из-за необходимости генерировать дополнительные фонемы и виземы для синхронизации движений губ. Все эти инновации объединяются на программной платформе Tritium, которую разработчики планируют выпустить в бета-версии для публики в ближайшие месяцы.
Платформа Tritium будет включать в себя виртуального робота андроида Ameca и поддержку импорта других моделей роботов в формате SDF. Это расширит возможности использования платформы для разработчиков и исследователей в различных областях, связанных с робототехникой и искусственным интеллектом.
Это обновление подчеркивает амбиции создателей Ameca предоставить мощные и гибкие решения для создания естественного взаимодействия между роботами и людьми, объединяя передовые технологии искусственного интеллекта в одной интегрированной платформе.