ИИ-стартап Mistral подтвердил утечку языковой модели, сравнимой по мощности с GPT-4

02.02.2024

1 View

SaveSavedRemoved 0

Французский ИИ-стартап Mistral признал, что один из его клиентов случайно опубликовал в сети мощную языковую модель с открытым исходным кодом под названием «miqu-1-70b». По некоторым оценкам, эта модель превосходит бесплатные и приближается по своим возможностям к коммерческой GPT-4 от OpenAI.

Что известно

28 января модель появилась на платформе HuggingFace, а затем на имиджборде 4chan. Сооснователь Mistral Артур Менш (Arthur Mensch) подтвердил ее аутентичность.

ПО его словам, модель является старой разработкой компании, которую переобучили на базе Llama 2 и распространили среди некоторых клиентов. Однако один из них, «чрезмерно увлеченный» технологией, опубликовал файлы на HuggingFace.

Менш также дал понять, что Mistral достиг значительных успехов в разработке языковых моделей после выпуска miqu-1-70b и скоро анонсирует нечто более мощное. Эксперты предполагают, что речь может идти о полноценном аналоге GPT-4 с открытым исходным кодом.

An over-enthusiastic employee of one of our early access customers leaked a quantised (and watermarked) version of an old model we trained and distributed quite openly.

To quickly start working with a few selected customers, we retrained this model from Llama 2 the minute we got…

— Arthur Mensch (@arthurmensch) January 31, 2024

Появление бесплатной модели такого уровня способно коренным образом изменить ландшафт в области генеративного ИИ. Это окажет сильное давление на бизнес-модель OpenAI, которая основана на платных подписках за доступ к GPT-3 и GPT-4.

Источник

Читать Новые секреты Xiaomi Civi 4: больше не скучный середняк для женщин!