Смартфоны Samsung Galaxy S25 и S25+ могут получить чип Dimensity 9400, который будет поддерживать мультимодальную ИИ модель Gemini Nano

Автор: Влад Черевко, 08 октября 2024, 13:08

Ранее Google, вместе со смартфонами Google Pixel 9, анонсировала обновленную модель ИИ Gemini Nano с мультимодальностью, которая на данный момент доступна только на устройствах серии Pixel 9. Но, по последним данным, новая модель Gemini Nano скоро будет расширена и на устройства других производителей, таких как Samsung.

Что известно

MediaTek объявила, что их новый флагманский чипсет Dimensity 9400 будет оптимизирован для ИИ Gemini Nano с мультимодальностью. Пока точно не известно, какие именно смартфоны получат первыми новую функцию с этим чипом, но, согласно намёков от Google DeepMind, это могут быть смартфоны серии Samsung Galaxy S25.

Мультимодальная Gemini Nano, разработанная совместно с Google DeepMind, позволяет устройствам лучше понимать контекст текста, изображений, аудио и видео. В смартфонах Pixel 9 на основе этой функции работают такие приложения, как Pixel Screenshots, Pixel Recorder, Talkback и другие.

Ранее Google DeepMind упомянула в своём блоге, что MediaTek использует их технологии для ускорения разработки своих самых передовых чипов, таких как новый флагман Dimensity, который будет использоваться в смартфонах Samsung.

Так как до сих пор Samsung не выпустила смартфона с флагманским чипом Dimensity, то скорей всего речь шла о предстоящих флагманах Galaxy S25 и S25+, так как Galaxy S25 Ultra будет построен на базе другого флагманского чипа – Snapdragon 8 Gen 4. Использование Dimensity 9400 может облегчить некоторые проблемы, связанные с производством Exynos 2500, и привнести мультимодальные возможности Gemini Nano в предстоящие флагманы серии S25.

Источник: @negativeonehero, Google DeepMind

Для тех, кто хочет знать больше

Мультимодальность в контексте искусственного интеллекта означает способность системы обрабатывать и интегрировать информацию из различных типов данных или модальностей. Например, мультимодальная система может одновременно анализировать текст, изображения, аудио и видео, чтобы лучше понимать и реагировать на запросы пользователя.

Это позволяет создавать более сложные и интуитивные взаимодействия, так как система может использовать разные источники информации для более точного и контекстуального ответа. Например, голосовые помощники, которые могут распознавать речь и одновременно анализировать визуальные данные, являются примером мультимодальных систем.