Liquid AI разрабатывает жидкие нейросети: чем они отличаются от обычных моделей?
Компания Liquid AI, основанная выдающимся специалистом в области робототехники Даниэлой Рус из Массачусетского технологического института, создает универсальные ИИ-системы на базе относительно новых моделей — жидких нейронных сетей.
Жидкие нейросети состоят из небольшого количества «нейронов», поведение которых описывается уравнениями. В отличие от традиционных моделей, таких как GPT-3 с 175 миллиардами параметров и 50 000 токенов, жидкие сети гораздо компактнее и требуют значительно меньших вычислительных мощностей для обучения и работы. Например, программа для автономного вождения может содержать всего 20 тысяч параметров и работать даже на Raspberry Pi.
При этом жидкие сети способны постоянно оптимизировать свои параметры для повышения эффективности с течением времени. Они анализируют последовательности данных в отличие от традиционного ИИ, обрабатывающего отдельные фрагменты, и динамически регулируют обмен сигналами между нейронами. Это позволяет им адаптироваться к изменениям окружающей среды, например, при смене погодных условий.
В тестах жидкие сети показали высокую эффективность по части прогнозирования и автономного управления дронами. Например, сеть, обученная на данных от опытного пилота, смогла управлять квадрокоптерами в лесу и условиях большого города. При этом она применяла полученные навыки в новых ситуациях без дополнительных настроек.
За реализацию проекта отвечают Даниэла Рус, Рамин Хасани (CEO), Матиас Лехнер (CTO) и Александр Амини (главный научный сотрудник).
Компания привлекла 37,5 млн долларов инвестиций от венчурных фондов и крупных технологических компаний. Эти средства позволят коммерциализировать новое поколение ИИ-моделей, аналогичных GPT, но более эффективных.
Также Liquid AI будет предоставлять вычислительную инфраструктуру и инструменты для корпоративных клиентов, чтобы они могли создавать собственные жидкие сети для решения конкретных задач. Например, для мониторинга дикой природы, поисково-спасательных операций, прогноза нагрузок в электросетях и так далее.
По словам основателей, технология подходит для анализа любых явлений, данные о которых представлены в виде динамических последовательностей — видео, аудио, телеметрия.
Таким образом, жидкие нейронные сети — это многообещающее и активно развивающееся направление. Они сочетают компактность, вычислительную эффективность и способность к адаптации.
При этом в Liquid AI подчеркивают важность прозрачности и безопасности подобных технологий, ведь жидкие сети проще интерпретировать и анализировать по сравнению с крупными и сложными программами.
Гравитация научных фактов сильнее, чем вы думаете