Google запустила Gemini 3.1 Flash-Lite: что известно о новой модели ИИ

04.03.2026 17:09

Компания Google официально представила Gemini 3.1 Flash-Lite — новую легковесную модель семейства Gemini, которая позиционируется как самое быстрое и экономически выгодное решение в линейке.

Разработка ориентирована на эффективную обработку больших объемов данных и призвана существенно снизить порог входа для разработчиков, создающих масштабируемые приложения, – сообщает корреспондент сетевого издания «Белновости».

Цена за 1 миллион входных токенов установлена на уровне 0,25 доллара, а за 1 миллион выходных — 1,50 доллара. Такое ценообразование делает модель особенно привлекательной для задач, требующих огромных вычислительных мощностей, где каждый цент имеет значение.

ноутбук
Фото: Pixabay

Предварительная версия модели уже доступна разработчикам через Gemini API в Google AI Studio, а корпоративные клиенты могут протестировать её на платформе Vertex AI.

В отличие от своих более "тяжелых" собратьев, Gemini 3.1 Flash-Lite создавался с прицелом на максимальную отзывчивость. По данным Artificial Analysis, по сравнению с предыдущей версией Gemini 2.5 Flash, новая модель демонстрирует впечатляющие результаты: время до генерации первого токена (Time to First Token) сократилось в 2,5 раза, а общая скорость вывода ответов выросла на 45%.

При этом, как уверяют в Google, качество работы осталось на сопоставимом или даже более высоком уровне.

Такая низкая задержка делает Gemini 3.1 Flash-Lite идеальным кандидатом для создания приложений, работающих в реальном времени, и отзывчивых пользовательских интерфейсов, где каждая миллисекунда ожидания критична.

Несмотря на статус "облегченной" версии, модель демонстрирует высокие результаты в бенчмарках. На арене Arena.ai ей удалось набрать 1432 балла Elo, что позволяет ей опережать аналогичные модели других вендоров в задачах на рассуждение и мультимодальную обработку.

Особенно показательны результаты в сложных тестах. В бенчмарке GPQA Diamond, включающем вопросы уровня докторантуры по естественным наукам, алгоритм показал результат в 86,9%, а в тесте MMMU Pro, оценивающем мультимодальное понимание, — 76,8%. Эти цифры не только превосходят показатели Gemini 2.5 Flash, но и обходят ряд более крупных моделей прошлых поколений.

Ключевой особенностью новинки стала функция "уровней рассуждения" (thinking levels), доступная в AI Studio и Vertex AI. Этот инструмент позволяет разработчикам гибко настраивать глубину аналитической работы модели в зависимости от поставленной задачи.

Для высокочастотных и простых операций, таких как массовый перевод текстов или модерация контента, глубину рассуждений можно уменьшить, добиваясь максимальной скорости и экономии. В то же время, при разработке сложных пользовательских интерфейсов, дашбордов или проведении моделирования на основе комплексных запросов, уровень "вдумчивости" алгоритма можно повысить, чтобы получить более качественный и точный результат.

Первые корпоративные клиенты, включая Latitude, Cartwheel и Whering, уже интегрировали Gemini 3.1 Flash-Lite в свои рабочие процессы. В своих отзывах они подчеркивают исключительную эффективность модели и её способность обрабатывать сложные входные данные с точностью, присущей гораздо более крупным системам.

Таким образом, Google предлагает рынку не просто дешевую, а по-настоящему гибкую модель, способную закрыть широкий спектр задач — от черновой работы до интеллектуального анализа.

Виталий Кистерный Автор: Виталий Кистерный Главный редактор