【毎日AI】Gemini 3.5 Flash 公開 — Pro超え・速度4倍・GPT-5.5を凌駕 | コラム

今日のポイント

Googleが2026年5月19日のI/O 2026キーノートで「Gemini 3.5 Flash」を発表し、同日からGA（一般提供）を開始しました。
出力速度は289トークン/秒で、Googleによれば他社のフロンティアモデル比4倍。Gemini 3.1 Proをcoding/agenticスイートで上回ったとされます。
Claude Opus 4.7やGPT-5.5を複数ベンチマーク（モデル性能評価のテスト）で上回ったとGoogleは説明。API入力料金は1Mトークンあたり$1.50からです。

Gemini 3.5 Flash が GA、API・Workspace・Gemini アプリで利用可能

Googleは2026年5月19日（米国時間）、開発者向けイベント「Google I/O 2026」のキーノートで、最新の高速モデル「Gemini 3.5 Flash」を発表しました。発表と同日にGA（General Availability：正式版としての一般提供）が開始されています。

利用先は広く、Gemini API、Google AI Studio、Vertex AI、Geminiアプリ、Google Workspace、検索のAI Overviewsまで、Googleのほぼ全プロダクトとAPIに順次ロールアウトされます。Googleは公式ブログで「frontier intelligence with action（行動を伴うフロンティア知性）」と表現し、推論力と実行力の両立を強調しました。

注目すべきは、エージェント（自律的にタスクを進めるAI）開発プラットフォーム「Google Antigravity」と共同開発された点です。Antigravity上では複数エージェントを並列で動かす用途に最適化されており、Gemini 3.5 Flashはその中核モデルとして据えられました。

出力 289 トークン/秒 — 他社モデル比 4 倍速

Gemini 3.5 Flashの最大の特徴は出力速度です。Googleの発表によると、出力速度は289トークン/秒に達し、他社のフロンティアモデル比で約4倍の速さを実現したとされます。

この速度はエージェント用途で大きな意味を持ちます。1つのタスクを完遂するために何十回もLLM（大規模言語モデル）を呼び出すエージェントワークフローでは、1回あたりのレスポンスが速いほど全体の完了時間が短縮されます。Googleは「複数のエージェントを並列で動かすケースで、特に効果が出る」と説明しています。

また、Flash系列はもともと低コスト・低遅延を狙ったライン。3.5世代では速度を大きく引き上げつつ、後述のとおり料金は据え置きに近い水準を維持しています。

主要ベンチで Pro・GPT-5.5・Claude Opus 4.7 を上回る

Googleが公開したベンチマーク結果では、Gemini 3.5 Flashは前世代の上位モデル「Gemini 3.1 Pro」をcoding（コーディング）とagentic（エージェント）スイートで上回ったとされます。同社のFlashがProを超えるのは異例の構図です。

さらに、競合のClaude Opus 4.7やGPT-5.5に対しても、MCP Atlas、Toolathlon、Finance Agent v2、CharXiv Reasoning、MMMU-Proの各ベンチマークで上回ったとGoogleは発表しました。

ベンチマーク	Gemini 3.5 Flash	位置づけ
Terminal-Bench 2.1	76.2%	Gemini 3.1 Pro 超え（ターミナル操作）
MCP Atlas	83.6%	Claude Opus 4.7・GPT-5.5 超え
CharXiv Reasoning	84.2%	Claude Opus 4.7・GPT-5.5 超え（図表推論）
GDPval-AA	1656 Elo	実務タスク評価でのスコア

もちろん、ベンチマークは万能ではなく、実運用での体感とは別物です。ただし「Flashという軽量ラインがフラッグシップ級モデルと戦える」という構図自体が、業界の前提を揺さぶる材料になります。

API料金: 入力 $1.50 / 出力 $9.00（1Mトークン）

API料金は標準ティアで、入力が100万トークンあたり$1.50、出力が100万トークンあたり$9.00です。フロンティア級の性能を持つモデルとしては低い水準で、エージェントのように出力を多く生成する用途でもコスト見積もりが立てやすくなっています。

例えば、社内のFAQ自動応答や議事録要約のような業務では、1リクエストあたり数円〜十数円のレンジで運用できる計算です。中小企業が「とりあえず試す」コストとしては十分に現実的でしょう。

Gemini 3.5 Pro は2026年6月公開予定

上位モデルの「Gemini 3.5 Pro」は、現時点ではGoogle社内で利用中とのこと。公式ブログでは「来月ロールアウト予定」と説明されており、発表が5月であることから2026年6月の公開が見込まれます。

Flashが3.1 Proを超えた今、3.5 Proはさらに上のラインに入ると予想されます。長文脈、マルチモーダル、複雑な推論を必要とする業務では、6月のProを待ってから比較検討するのが堅実です。

業務で何が変わるか — エージェント実用化への一歩

Mihataとして見たとき、今回のリリースで重要なのは「エージェントが業務に組み込めるレベルに近づいた」点です。出力289トークン/秒という速度は、人間の待ち時間を体感的にゼロに近づけます。

具体的には、メール仕分け、見積もり下書き、議事録要約、社内Q&A対応など、これまでChatGPTやClaudeに手作業でコピペしていた処理を、エージェントが自走して完了させる流れがより現実的になります。料金面でも入力$1.50/1Mというラインは、中小企業の月額AI予算（数千〜数万円）に収まりやすいレンジです。

一方で、エージェントは「権限の渡し方」と「人間レビューの境界」を間違えると事故ります。当面は、社内文書の検索・要約や下書き生成といった、出力を人がレビューしてから使う用途から導入するのが安全です。用途別の使い分けはChatGPT・Claude・Gemini 用途別比較で詳しく解説しています。

まとめ

Gemini 3.5 Flashは、「速度」「コスト」「ベンチマーク性能」の3点を同時に押し上げた、エージェント時代の本命モデルです。Flashが前世代Proを超え、競合フラッグシップとも複数ベンチで競り合う構図は、業界の前提を1段階引き上げました。

6月公開予定のGemini 3.5 Pro、そして他社の追随も含め、2026年夏は「エージェントの実装をどう自社業務に落とすか」が経営課題として浮上する季節になりそうです。本日の他のAIニュースは2026年5月20日の毎日AIまとめからどうぞ。