От GPT к o3: искусственный интеллект учится думать по-новому

leer en español

От GPT к o3: искусственный интеллект учится думать по-новому

OpenAI создала систему, которая решает тест ARC-AGI не хуже человека.

image

20 декабря новая ИИ-система OpenAI под названием o3 преодолела важный рубеж. При прохождении теста ARC-AGI на определение уровня мышления модель набрала 85% - столько же, сколько в среднем набирают люди. В дополнение к этому она блестяще справилась со сложными математическими задачами.

До сих пор лучший результат среди подобных разработок не превышал 55%. Многие исследователи считают, что o3 совершила серьезный прорыв на пути к созданию искусственного общего интеллекта (AGI), хотя скептики по-прежнему сомневаются в значимости достижения.

Здесь важно разобраться в особенностях теста ARC-AGI. Главный показатель в нем - "эффективность выборки", то есть умение приспосабливаться к новым условиям, располагая минимумом примеров. Проще говоря, тест определяет, сколько образцов новой ситуации нужно, чтобы уловить принцип ее работы.

Современные языковые модели вроде ChatGPT на базе GPT-4 не могут похвастаться высокой эффективностью выборки. Во время обучения они просматривают миллионы фрагментов человеческих текстов и на их основе выводят наиболее вероятные сочетания слов. Такой метод помогает справляться с типичными задачами, но дает сбой в нестандартных ситуациях - просто потому, что в базе не хватает похожих примеров.

Пока искусственный разум можно использовать только там, где задачи повторяются или где случайные ошибки не приведут к серьезным последствиям. Главная проблема в том, что модели не умеют быстро обучаться и подстраиваться под новые обстоятельства.

Способность находить верные решения незнакомых задач, опираясь на ограниченный набор сведений, ученые называют обобщением. В научном сообществе эту черту считают необходимым и фундаментальным признаком интеллекта. ARC-AGI состоит из задач с сеткой квадратов, похожих на школьные тесты IQ. На экране появляются два изображения: первоначальный узор и образец того, к какому состоянию он должен прийти после определенных манипуляций. Программа должна понять закономерность превращения начального состояния в конечное.

К каждому заданию прилагаются три обучающих примера. Изучив их, алгоритм должен вывести правила и применить их на практике. Такой подход позволяет проверить, насколько быстро происходит адаптация.

В поиске закономерностей важно не делать лишних предположений и не вдаваться в излишние подробности. Теоретически, если удается найти самые простые правила, которых достаточно для решения, программа сможет лучше приспосабливаться к новым ситуациям.

"Простые правила" обычно можно описать короткими фразами. Например, в задаче с сеткой квадратов правило может звучать так: "Фигура с выступающей линией сдвинется к концу этой линии и накроет собой все фигуры на своем пути".

Как именно работает o3, пока неизвестно, но вряд ли ее специально учили искать "простые правила". OpenAI взяла за основу универсальную версию модели, способную дольше размышлять над сложными вопросами, а потом дополнительно натренировала ее для прохождения теста ARC-AGI.

Французский исследователь ИИ Франсуа Шолле, который создал тест, предполагает, что o3 перебирает разные "цепочки рассуждений" - последовательности шагов для достижения цели. Затем выбирается лучший вариант с опорой на определенные правила-подсказки.

Однако пока рано говорить о том, насколько это приближает нас к созданию AGI. Базовые механизмы работы с языком могли остаться прежними - просто теперь они эффективнее заточены под решение конкретного типа задач.

OpenAI держит почти всю информацию о своей разработке в секрете. Компания ограничилась несколькими презентациями для СМИ и разрешила протестировать o3 лишь некоторым исследователям, лабораториям и организациям, которые занимаются безопасностью ИИ.

Антивирус для мозга!

Лечим цифровую неграмотность без побочных эффектов

Активируйте защиту — подпишитесь