Французский ИИ-стартап Mistral признал, что один из его клиентов случайно опубликовал в сети мощную языковую модель с открытым исходным кодом под названием “miqu-1-70b”. По некоторым оценкам, эта модель превосходит бесплатные и приближается по своим возможностям к коммерческой GPT-4 от OpenAI.
Что известно
28 января модель появилась на платформе HuggingFace, а затем на имиджборде 4chan. Сооснователь Mistral Артур Менш (Arthur Mensch) подтвердил ее аутентичность.
ПО его словам, модель является старой разработкой компании, которую переобучили на базе Llama 2 и распространили среди некоторых клиентов. Однако один из них, “чрезмерно увлеченный” технологией, опубликовал файлы на HuggingFace.
Менш также дал понять, что Mistral достиг значительных успехов в разработке языковых моделей после выпуска miqu-1-70b и скоро анонсирует нечто более мощное. Эксперты предполагают, что речь может идти о полноценном аналоге GPT-4 с открытым исходным кодом.
An over-enthusiastic employee of one of our early access customers leaked a quantised (and watermarked) version of an old model we trained and distributed quite openly.
To quickly start working with a few selected customers, we retrained this model from Llama 2 the minute we got…
— Arthur Mensch (@arthurmensch) January 31, 2024
Появление бесплатной модели такого уровня способно коренным образом изменить ландшафт в области генеративного ИИ. Это окажет сильное давление на бизнес-модель OpenAI, которая основана на платных подписках за доступ к GPT-3 и GPT-4.