Ранее Google, вместе со смартфонами Google Pixel 9, анонсировала обновленную модель ИИ Gemini Nano с мультимодальностью, которая на данный момент доступна только на устройствах серии Pixel 9. Но, по последним данным, новая модель Gemini Nano скоро будет расширена и на устройства других производителей, таких как Samsung.
Что известно
MediaTek объявила, что их новый флагманский чипсет Dimensity 9400 будет оптимизирован для ИИ Gemini Nano с мультимодальностью. Пока точно не известно, какие именно смартфоны получат первыми новую функцию с этим чипом, но, согласно намёков от Google DeepMind, это могут быть смартфоны серии Samsung Galaxy S25.
Мультимодальная Gemini Nano, разработанная совместно с Google DeepMind, позволяет устройствам лучше понимать контекст текста, изображений, аудио и видео. В смартфонах Pixel 9 на основе этой функции работают такие приложения, как Pixel Screenshots, Pixel Recorder, Talkback и другие.
Ранее Google DeepMind упомянула в своём блоге, что MediaTek использует их технологии для ускорения разработки своих самых передовых чипов, таких как новый флагман Dimensity, который будет использоваться в смартфонах Samsung.
How did I miss this ???? https://t.co/rRCQfQdqTW pic.twitter.com/eNKjv0cS4L
— sawtooth special edition (@negativeonehero) October 7, 2024
Так как до сих пор Samsung не выпустила смартфона с флагманским чипом Dimensity, то скорей всего речь шла о предстоящих флагманах Galaxy S25 и S25+, так как Galaxy S25 Ultra будет построен на базе другого флагманского чипа – Snapdragon 8 Gen 4. Использование Dimensity 9400 может облегчить некоторые проблемы, связанные с производством Exynos 2500, и привнести мультимодальные возможности Gemini Nano в предстоящие флагманы серии S25.
, Google DeepMind
Для тех, кто хочет знать больше
Мультимодальность в контексте искусственного интеллекта означает способность системы обрабатывать и интегрировать информацию из различных типов данных или модальностей. Например, мультимодальная система может одновременно анализировать текст, изображения, аудио и видео, чтобы лучше понимать и реагировать на запросы пользователя.
Это позволяет создавать более сложные и интуитивные взаимодействия, так как система может использовать разные источники информации для более точного и контекстуального ответа. Например, голосовые помощники, которые могут распознавать речь и одновременно анализировать визуальные данные, являются примером мультимодальных систем.