OpenAI стремится сделать свою будущую Open Source модель ИИ лучшей в своём классе

OpenAI стремится сделать свою будущую Open Source модель ИИ лучшей в своём классе

В конце марта компания OpenAI заявила, что намерена выпустить свою первую «открытую» языковую модель после GPT‑2 где-то в этом году. Теперь подробности об этой модели начинают просачиваться из бесед компании с сообществом разработчиков ИИ.

Эйдан Кларк, вице-президент OpenAI по исследованиям, руководит разработкой открытой модели, которая находится на очень ранней стадии, сообщили источники, знакомые с ходом работ. Компания планирует выпустить модель логического вывода по аналогии с моделями серии o в начале лета и хочет убедиться, что она превзойдёт другие открытые модели логического вывода.

По словам источников, OpenAI рассматривает возможность предоставления модели по свободной лицензии с небольшими ограничениями по использованию или коммерческому применению. Открытые модели, такие как Llama и Gemma от Google, критиковались некоторыми участниками сообщества за наложение обременительных требований — критики, которой OpenAI, по-видимому, стремится избежать.

Разработчик ChatGPT сталкивается с растущим давлением со стороны конкурентов, таких как китайская лаборатория искусственного интеллекта DeepSeek, которая использует открытый подход к запуску моделей. В отличие от стратегии OpenAI, эти «открытые» конкуренты предоставляют свои модели сообществу специалистов по искусственному интеллекту для экспериментов и, в некоторых случаях, для коммерциализации.

Для некоторых компаний это оказалось чрезвычайно успешной стратегией. Компания Meta*, которая вложила значительные средства в семейство открытых моделей ИИ Llama, заявила в начале марта, что Llama скачали более 1 миллиарда раз. Тем временем DeepSeek быстро собрала большую базу пользователей по всему миру и привлекла внимание инвесторов.

Источники сообщили, что OpenAI планирует использовать свою открытую модель, которая будет работать по принципу «ввод текста — вывод текста», на высокопроизводительном потребительском оборудовании и, возможно, позволит разработчикам включать и выключать «рассуждения», как в моделях рассуждений, недавно выпущенных Anthropic и другими компаниями. Если запуск пройдёт успешно, OpenAI может выпустить дополнительные модели — возможно, более компактные.

Генеральный директор OpenAI Сэм Альтман ранее заявлял, что, по его мнению, OpenAI оказался не на той стороне истории, когда дело дошло до открытого доступа к технологиям.

«[Я лично считаю, что нам нужно] разработать другую стратегию с открытым исходным кодом, — сказал Альтман во время обсуждения на Reddit в январе. — Не все в OpenAI разделяют эту точку зрения, и это не является нашим главным приоритетом на данный момент […] Мы будем создавать более качественные модели [в будущем], но будем отставать от конкурентов меньше, чем в предыдущие годы».

Альтман также заявил, что будущая открытая модель OpenAI будет тщательно протестирована и оценена с точки зрения безопасности. Источники сообщили, что компания намерена опубликовать модельную карту — подробный технический отчёт, демонстрирующий результаты внутреннего и внешнего тестирования OpenAI и проверки безопасности.

«[П]еред выпуском мы оценим эту модель в соответствии [с] нашей системой оценки готовности, как и любую другую модель, — сказал Альтман в посте на X в прошлом месяце. — [И] мы проделаем дополнительную работу, учитывая, что мы знаем, что эта модель будет изменена после выпуска».

Компания OpenAI вызвала недовольство некоторых специалистов по этике ИИ тем, что, как сообщается, ускорила тестирование безопасности своих последних моделей и не выпустила карточки с моделями для других. Альтман также обвиняется в том, что вводил руководителей OpenAI в заблуждение относительно проверок безопасности моделей до своего кратковременного увольнения в ноябре 2023 года.

Источник: TechCrunch

Интересно? Поделиться:

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *