DeepMind разработала универсальную архитектуру для создания искусственного интеллекта




Специалисты лаборатории DeepMind создали универсальную архитектуру Perceiver IO для обработки всех типов входных и выходных данных.

To tackle all the challenges we meet while solving intelligence, we need tools that are as adaptable as possible. Announcing the paper & code for Perceiver IO, an architecture that handles a wide range of data and tasks, all while scaling gracefully: Building architectures that can handle the world’s data 1/4 pic.twitter.com/PO9JSHt7yL

— DeepMind (@DeepMind) August 3, 2021

В ее основе — оригинальная модель Perceiver, представленная в июне 2021 года. Она обрабатывает изображения, аудио, видео и их комбинации, однако ограничивается задачами с простыми выходными данными, такими как классификация.


Для решения этой проблемы исследователи создали более общую версию архитектуры — Perceiver IO. Она может выдавать широкий спектр выходных данных из разнообразия входящей информации, что делает ее применимой к таким областям, как обработка естественного языка, компьютерное зрение и мультимодальное понимание.

Результаты оценки оптического потока или отслеживания движения всех пикселей изображения с помощью Perceiver IO. Цвет каждого пикселя показывает направление и скорость движения. Данные. DeepMind.

Perceiver и Perceiver IO построены на архитектуре трансформеров, которые хорошо работают для входных данных, содержащих нескольких тысяч элементов. Однако, по словам исследователей, изображения, аудио и видео могут содержать миллионы таких элементов.

«С помощью оригинального Perceiver мы решили главную проблему универсальной архитектуры: масштабирование трансформеров на очень большие входные данные без введения допущений, специфичных для предметной области», — говорится в блоге.

Исследователи также считают, что Perceiver IO может достичь беспрецедентного уровня универсальности.


Они опубликовали исходный код архитектуры на GitHub и надеются, что это поможет исследователям и практикам разрабатывать приложения без необходимости тратить ресурсы на создание индивидуальных решений с использованием специализированных систем.


Напомним, в конце июля DeepMind представила обширную игровую среду XLand для обучения универсальных агентов искусственного интеллекта.


В июле специалисты ИИ-лаборатории собрали и опубликовали самую полную базу данных белковых структур человека, созданную нейронной сетью AlphaFold.


В июне ученые из DeepMind заявили, что для достижения общего искусственного интеллекта достаточно обучения с подкреплением.


Подписывайтесь на новости ForkLog в Telegram: ForkLog AI — все новости из мира ИИ!

Источник _Биткоин, блокчейн, криптовалюты, финтех - ForkLog
 
Верх Низ