Компьютерный ученый Луи Кастрикато после восьми лет изучения больших языковых моделей, лежащих в основе чат-ботов вроде ChatGPT и Claude, почувствовал, что зашел в тупик. «Мы в основном прошли точку, где можно проводить реальные фундаментальные исследования LLM, — сказал Кастрикато. — Теперь это просто приложения». Исследователь бросил учебу в Брауновском университете и основал новую компанию Overworld. Ее амбиция — ИИ, который может понимать и ориентироваться в мире, а не только в словах. Об этом сообщает портал Qazaqyia.kz со ссылкой на издание Associated Press.
Об этом сообщает портал Qazaqyia.kz со ссылкой на издание Associated Press.
На чат-ботах с ИИ все еще можно заработать — инвесторы вкладывают триллионы долларов в ведущих разработчиков, таких как Anthropic и OpenAI. Но растущее число предпринимателей в сфере ИИ посвящают себя тому, что они считают следующим рубежом: «мировым моделям», которые обучают системы ИИ, а иногда и роботов, реагировать в физической среде. Среди них — такие видные ученые, как «крестная мать ИИ» Фей-Фей Ли, которая описывает концепцию мировой модели как «один из самых важных и перегруженных терминов в ИИ сегодня».
В основе исследований мировых моделей лежит идея о том, что ИИ не может быть по-настоящему интеллектуальным, если он умеет только читать книгу. Ему также нужно «читать» обстановку. «В то время как языковые модели изучают статистическую структуру текста, мировые модели изучают статистическую структуру пространства и времени: как свет падает на поверхность, как сад выглядит с угла, который не запечатлела ни одна камера, как объекты реагируют на силу и следуют законам физики», — написала Ли в эссе, опубликованном в этом месяце.
Еще один сторонник — пионер ИИ Янн ЛеКун, который в прошлом году уволился с поста главного научного сотрудника Meta по ИИ, чтобы основать парижскую Advanced Machine Intelligence Labs. «Мировая модель быстро становится модным словом», — сказал ЛеКун в недавнем подкасте «Unsupervised Learning». Он считает, что это позволяет агенту ИИ «предсказывать последствия своих собственных действий».
Существует несколько способов определения мировых моделей, часто в зависимости от технологий, которые кто-то надеется с их помощью построить — будь то роботы или более интерактивная видеоигра. Обучение на всех книгах, новостях и визуальных медиа человечества, как это делают языковые модели ИИ, привело к появлению помощников ИИ, которые меняют характер офисной работы и некоторых творческих областей. Но некоторые сторонники видят ограничения в генеративных моделях ИИ, которые работают, предсказывая следующее слово или пиксель для создания нового диалога, изображений или строк кода. «Чат-боты не могут поднять чашку с кофе», — отмечает Мартин Хеберт, декан факультета компьютерных наук Университета Карнеги-Меллона.
