Gemini 3.1 Pro Preview API

google/gemini-3.1-pro-preview
by Google LLCリリース日: 2/19/2026

Gemini 3.1 Pro Previewは、Googleの最も高度なマルチモーダルLLMであり、複雑な推論、長文脈タスク、および堅牢なエージェントワークフローに優れています。

$1/$6100万トークンあたり

Gemini 3.1 Pro Preview API - 背景

概要

Gemini 3.1 Pro Previewは、Google LLCが2026年2月にGemini 3シリーズの一部としてリリースした最先端の推論AIモデルです。Gemini 3.1 Pro Preview APIは、深い思考、多段階推論、堅牢なマルチモーダル理解を必要とする複雑で実世界のタスク向けに設計されています。テキスト、画像、動画、音声、PDFの入力をネイティブに処理し、要求の厳しいエンタープライズおよび開発者向けアプリケーションに対応する多機能なソリューションです。

開発履歴

Gemini 3.1 Pro PreviewはGemini 3 Proの基盤に基づいて構築されており、推論、信頼性、マルチモーダル機能に大幅な改善を導入しています。2026年2月19日にリリースされ、GoogleのAIロードマップにおける大きな飛躍を示し、エージェント的ワークフロー、ソフトウェアエンジニアリング、長コンテキストタスクを対象とした強化が図られています。開発では幻覚の減少、トークン効率の向上、複雑でツール駆動のシナリオに向けた最適化に焦点が当てられました。

主要な革新

  • 入力用に100万トークン、出力用に65,000トークンの大規模コンテキストウィンドウにより、長コンテキストおよび大規模文書処理を実現
  • テキスト、画像、動画、音声、PDFを横断するシームレスな推論を伴う深いマルチモーダルサポート
  • 信頼性の高い多段階ツール編成とコード実行を含む、エージェント的およびソフトウェアエンジニアリングワークフローの最適化

Gemini 3.1 Pro Preview API - 技術仕様

アーキテクチャ

Gemini 3.1 Pro Previewは、テキスト、画像、動画、音声、PDF入力をネイティブでサポートする大規模トランスフォーマーベースのマルチモーダルモデルです。高度なツール統合、関数呼び出し、エージェント的ワークフロー機能を特徴とし、ツール使用とエージェントタスク用に最適化されたカスタムバリアントを備えています。

パラメータ

正確なパラメータ数は非公開ですが、このモデルはフロンティアスケールで動作し、Claude Opus 4.6やGPT-5シリーズなどの主要モデルと競合しています。

機能

  • テキスト、画像、動画、音声、PDFを含むマルチモーダル入力の処理と推論
  • 関数呼び出し、構造化出力、コード実行、バッチAPI操作をサポート
  • 極めて長いコンテキスト(最大1,048,576入力トークン)を高い事実的一貫性と安定性で処理

制限事項

  • 画像や音声の生成、ライブAPI統合、マップグラウンディングはサポートしていません
  • プレビューステータスにより、非エージェント的シナリオでは品質の変動が生じる可能性があり、超長出力は段階的に生成するのが最適です

Gemini 3.1 Pro Preview API - 性能

強み

  • 以前のバージョンと比較して幻覚が大幅に減少した例外的な推論と事実精度
  • ソフトウェアエンジニアリング、エージェント的ワークフロー、長コンテキストマルチモーダルタスクでの優れた性能

実世界での有効性

実世界のアプリケーションにおいて、Gemini 3.1 Pro Preview APIは金融モデリング、自律コーディングエージェント、インタラクティブデザインなどの複雑で重要なシナリオで堅牢な性能を実証しています。ARC-AGI-2(77.1%)、GPQA Diamond(94.3%)、SWE-Bench Verified(80.6%)などのベンチマークでの高得点は、抽象的推論、科学知識、エージェント的コーディングタスクを処理する能力を反映しています。モデルの効率性と信頼性により、高度なAI推論を必要とするエンタープライズおよび開発者のユースケースに最適な選択肢となっています。

Gemini 3.1 Pro Preview API - 使用場面

シナリオ

  • テキスト、画像、PDFなどの多様な形式を含む大規模文書分析やデータ統合プロジェクトがある場合。Gemini 3.1 Pro Preview APIは、大規模なコンテキストウィンドウでマルチモーダル入力の処理と推論に優れ、複雑なデータセットからの包括的な分析と洞察抽出を可能にします。これにより、知識管理と研究ワークフローの効率性と精度が向上します。
  • 自律コーディングエージェントを開発中または、ソフトウェアエンジニアリングワークフローの自動化が必要な場合。Gemini 3.1 Pro Preview APIはエージェントタスクに最適化されており、信頼性の高い多段階ツール編成とコード実行を提供します。これにより、エンタープライズソフトウェアプロジェクトにおいて開発サイクルの高速化、手動介入の削減、コード品質の向上が実現されます。
  • マルチモーダルデータとユーザー入力を統合するインタラクティブでリアルタイムなデザインやシミュレーションツールが必要な場合。Gemini 3.1 Pro Preview APIは、ジェスチャートラッキングを用いた3Dシミュレーションや生成音楽などの高度なユースケースをサポートし、クリエイティブ産業や製品プロトタイピングに最適です。これにより、迅速な反復とより豊かなユーザーエクスペリエンスが可能になります。

ベストプラクティス

  • 深い推論とクロスフォーマット理解を必要とするタスクに対して、モデルのマルチモーダルおよび長コンテキスト機能を活用してください。
  • 超長出力または高度に複雑な生成の場合、最適な品質と信頼性を確保するために、タスクを管理可能なステップに分割してください。

技術仕様

コンテキスト長1,048,576
リリース日2/19/2026
入力形式
textimagevideoaudiopdf
出力形式
text

機能と特徴

機能
multimodal reasoning (text, image, audio, video, PDF)large context understanding (1M tokens)advanced multi step and agentic reasoningfunction callingstructured outputcode interpretation and generationreal time search groundingbatch API supportcontextual URL/file ingestionlong sequence codebase handlingcache utilization
対応ファイル形式
.txt.jpg.jpeg.png.mp4.mp3.pdf