Laurenz Heymann/Unsplash
Компания Apple совместно с исследователями Калифорнийского университета разработала и опубликовала модель искусственного интеллекта MLLM-Guided Image Editing (MGIE). Она позволяет вносить изменения в изображения на основе текстовых инструкций на естественном языке.
Что известно
MGIE использует технологию мультимодальных моделей больших языков. Это дает возможность интерпретировать короткие и неоднозначные команды пользователя для последующего редактирования фотографий. Например, подсказку “сделать более здоровой” для снимка пиццы ИИ может понять, как необходимость добавить овощные ингредиенты.
Помимо внесения серьезных изменений в контент, модель умеет выполнять базовые операции вроде обрезки, поворота, изменения размера и цветокоррекции изображений. Также ИИ может обрабатывать отдельные области для трансформации определенных объектов.
MGIE доступна на GitHub. Кроме того, Apple разместила демо-версию сервиса на ресурсе Hugging Face.
Пока неизвестно, планирует ли компания интегрировать технологию в собственные продукты.