Gemini 3.1 Pro Preview API

Активна

google/gemini-3.1-pro-preview

от Google LLC•дата релиза: 2/19/2026

Gemini 3.1 Pro Preview — это самая продвинутая мультимодальная LLM от Google, превосходящая в сложных рассуждениях, задачах с длинным контекстом и надежных агентных рабочих процессах.

$1/$6за 1М токенов

Gemini 3.1 Pro Preview API - Предыстория

Обзор

Gemini 3.1 Pro Preview — это самая передовая модель ИИ для рассуждений от Google LLC, выпущенная в феврале 2026 года как часть серии Gemini 3. API Gemini 3.1 Pro Preview разработан для сложных реальных задач, требующих глубокого мышления, многоэтапных рассуждений и надежного мультимодального понимания. Он поддерживает нативную обработку текста, изображений, видео, аудио и PDF-входов, что делает его универсальным решением для требовательных корпоративных и разработческих приложений.

История разработки

Gemini 3.1 Pro Preview строится на основе Gemini 3 Pro, внося значительные улучшения в рассуждения, надежность и мультимодальные возможности. Выпущенный 19 февраля 2026 года, он знаменует собой важный скачок в дорожной карте ИИ Google с улучшениями, нацеленными на агентские рабочие процессы, программную инженерию и задачи с длинным контекстом. Разработка была сосредоточена на снижении галлюцинаций, повышении эффективности токенов и оптимизации для сложных сценариев, управляемых инструментами.

Ключевые инновации

Массивное окно контекста в 1M токенов для ввода и 65k для вывода, обеспечивающее обработку документов с длинным контекстом и крупномасштабную обработку
Глубокая мультимодальная поддержка текста, изображений, видео, аудио и PDF с безупречными межмодальными рассуждениями
Оптимизации агентских и программно-инженерных рабочих процессов, включая надежную многоэтапную оркестровку инструментов и выполнение кода

Gemini 3.1 Pro Preview API - Технические характеристики

Архитектура

Gemini 3.1 Pro Preview — это крупномасштабная трансформерная мультимодальная модель с нативной поддержкой текста, изображений, видео, аудио и PDF-входов. Она обладает расширенной интеграцией инструментов, вызовом функций и возможностями агентских рабочих процессов, с пользовательскими вариантами, оптимизированными для использования инструментов и агентских задач.

Параметры

Точное количество параметров не раскрывается, но модель работает в передовом масштабе, конкурируя с ведущими моделями, такими как Claude Opus 4.6 и серия GPT-5.

Возможности

Обрабатывает и рассуждает над мультимодальными входами, включая текст, изображения, видео, аудио и PDF
Поддерживает вызов функций, структурированный вывод, выполнение кода и пакетные операции API
Обрабатывает чрезвычайно длинные контексты (до 1,048,576 входных токенов) с высокой фактической согласованностью и стабильностью

Ограничения

Не поддерживает генерацию изображений или аудио, интеграцию с live API или привязку к картам
Предварительный статус может привести к колебаниям качества в неагентских сценариях; ультрадлинные выводы лучше всего генерировать поэтапно

Gemini 3.1 Pro Preview API - Производительность

Преимущества

Исключительные рассуждения и фактическая точность со значительно сниженными галлюцинациями по сравнению с предыдущими версиями
Превосходная производительность в программной инженерии, агентских рабочих процессах и длинноконтекстных мультимодальных задачах

Эффективность в реальных условиях

В реальных приложениях API Gemini 3.1 Pro Preview демонстрирует надежную производительность в сложных критически важных сценариях, таких как финансовое моделирование, автономные агенты кодирования и интерактивный дизайн. Его высокие оценки в бенчмарках, таких как ARC-AGI-2 (77.1%), GPQA Diamond (94.3%) и SWE-Bench Verified (80.6%), отражают его способность справляться с абстрактными рассуждениями, научными знаниями и агентскими задачами кодирования. Эффективность и надежность модели делают ее сильным выбором для корпоративных и разработческих случаев использования, требующих продвинутого ИИ-рассуждения.

Gemini 3.1 Pro Preview API - Когда использовать

Сценарии

У вас есть крупномасштабный проект анализа документов или синтеза данных, включающий различные форматы, такие как текст, изображения и PDF. API Gemini 3.1 Pro Preview превосходен в обработке и рассуждении над мультимодальными входами с массивным окном контекста, обеспечивая всеобъемлющий анализ и извлечение insights из сложных наборов данных. Это приводит к улучшенной эффективности и точности в управлении знаниями и исследовательских рабочих процессах.
Вы разрабатываете автономных агентов кодирования или вам нужно автоматизировать рабочие процессы программной инженерии. API Gemini 3.1 Pro Preview оптимизирован для агентских задач, предлагая надежную многоэтапную оркестровку инструментов и выполнение кода. Это приводит к более быстрым циклам разработки, сниженному ручному вмешательству и более высокому качеству кода для корпоративных программных проектов.
Вам требуются интерактивные инструменты дизайна или симуляции в реальном времени, которые интегрируют мультимодальные данные и пользовательский ввод. API Gemini 3.1 Pro Preview поддерживает передовые случаи использования, такие как 3D-симуляции с отслеживанием жестов и генеративная музыка, что делает его идеальным для творческих индустрий и прототипирования продуктов. Это обеспечивает быструю итерацию и более богатый пользовательский опыт.

Лучшие практики

Используйте мультимодальные возможности модели и длинный контекст для задач, требующих глубоких рассуждений и понимания разных форматов.
Для ультрадлинных выводов или очень сложной генерации разбивайте задачи на управляемые этапы для обеспечения оптимального качества и надежности.

Технические характеристики

Длина контекста1,048,576

Дата релиза2/19/2026

Форматы ввода

textimagevideoaudiopdf

Форматы вывода

text

Возможности и функции

Возможности

multimodal reasoning (text, image, audio, video, PDF)large context understanding (1M tokens)advanced multi step and agentic reasoningfunction callingstructured outputcode interpretation and generationreal time search groundingbatch API supportcontextual URL/file ingestionlong sequence codebase handlingcache utilization

Поддерживаемые типы файлов

.txt.jpg.jpeg.png.mp4.mp3.pdf

← Назад к поиску