GPT-5.6 Sol/Terra/Lunaが政府ゲート付きで登場、7月Cerebrasで750tpsへ ― Gemini 3.5 ProはGA目前

2026年7月4日のAIニュース要点

OpenAI GPT-5.6（Sol/Terra/Luna）: 3階層で登場したが、米政府と共有のうえ約20組織限定のプレビューでスタート。7月にはCerebras上で750tps（トークン毎秒）へ。
Gemini 3.5 Pro が7月GAへ後ろ倒し: 品質調整を理由にGoogleが一般提供を6月から7月へ延期。フロンティアモデルは「発表→誰でも使える」までのタイムラグが常態化。
リーク・噂: 常時稼働エージェント「Gemini Spark」、新Gemini Flash、ChatGPTの双方向ボイス「Bidi 1」の動きが報じられている（いずれも未確定）。

今日の要点

ここを押さえる

7/4GPT-5.6 Sol/Terra/LunaOpenAI政府ゲート付きプレビュー・7月にCerebrasで750tps

7/4Gemini 3.5 Pro GA遅延Google品質調整で6月→7月へ後ろ倒し

7/4Spark/Flash/Bidi 1噂常時稼働エージェントや双方向ボイスの動き

OpenAI、GPT-5.6「Sol/Terra/Luna」を政府ゲート付きでプレビュー公開

2026年6月26日、OpenAIは次世代モデル群 GPT-5.6 を「Previewing GPT-5.6 Sol」としてプレビュー公開しました。構成は3階層で、フラッグシップの Sol（フロンティア推論・長時間エージェント作業向け）、バランス型の Terra（GPT-5.5相当の性能を約半額で）、最速・最安の Luna です。

料金は100万トークンあたりで、VentureBeatの報道によると Sol が入力5ドル・出力30ドル、Terra が2.5ドル・15ドル、Luna が1ドル・6ドルです。用途とコストで層を選び分ける設計になっています。

max reasoning effort と ultra mode

新機能として、難問により長く推論を割り当てる「max reasoning effort（最大推論努力）」が加わりました。さらに「ultra mode（ウルトラモード）」は、単一のエージェントを超えて subagents（サブエージェント）を並列に起動し、複雑な作業を高速化します。並列処理のループがモデルレベルで埋め込まれている点が特徴です。

仕組み

ultra mode（ウルトラモード）

受付複雑なタスクを1つ受け取る

分割・並列サブエージェントを並列に起動

統合結果をまとめて高速に完了

アクセスは政府ゲート付き、Cerebrasで750tpsへ

アクセスは当初、API と Codex で「信頼できるパートナー」（約20組織規模と報じられている）に限定されました。Constellation Researchによれば、OpenAIは米政府（トランプ政権）と事前にモデルとリリース計画を共有し、政府の要請で段階的な公開になったとされます。ただしOpenAIは「顧客ごとの政府承認を恒久化することには反対」の立場で、GA（一般提供）は「数週間内」を計画しています。

速度面では、7月に Sol を Cerebras のウェハースケール・ハードウェア上で最大750tps（当初は限定顧客）で提供開始とされています。従来のGPUクラスタでのフロンティアモデルのストリーミングが概ね40〜120tpsであることを踏まえると、桁違いの体感速度です。Cerebrasの Eric Vishria 氏もこの提供について述べており、同社はOpenAIと200億ドル超・750MWの推論契約を開示済みで、今年IPOを申請しています。

速度

Cerebras上のSol

750tpsCerebras上のSol

40〜120tps従来のGPUクラスタ

20B+ドルCerebras推論契約

で、どうなるの？ 最上位モデルが「発表と同時に誰でも使える」時代は一区切りです。政府ゲートと限定プレビューが挟まることで、フロンティア性能は当面「一部の組織が先に触る」段階を経ます。中小事業者にとっては、まず Terra や Luna の低価格層でコストを抑えつつ、GA（数週間内予定）を待って Sol を検証する、という現実的な進め方が有効です。

Google、Gemini 3.5 Pro の一般提供を7月へ後ろ倒し

Googleは5月19日のI/OでGemini 3.5 Proを披露し、当初6月のGAを目標にしていました。しかしTechTimesの報道によると、トークン効率・コーディング性能・長い多段推論といった品質調整を理由に、GAを7月へ後ろ倒ししました。

Startup Fortuneの報道では、早期エンタープライズ検証後の調整と説明されています。モデルは2Mトークンのコンテキストと Deep Think 推論モードを備え、記事時点では Vertex AI の限定プレビュー段階です。

で、どうなるの？ GPT-5.6の政府ゲート付き段階公開と、Gemini 3.5 ProのGA遅延が重なり、フロンティアモデルは「発表から誰でも使えるまでのタイムラグ」が新常態になりつつあります。導入計画は発表日ではなくGA日を基準に組むのが安全です。

【未確定だけど気になる】今週のAIリーク・噂まとめ ※確定情報ではありません

※以下は未確定情報です。一次資料の確認まで「気になる動き」として読んでください。

Gemini Spark（常時稼働エージェント）

信頼度：中 / 情報源：TestingCatalog

再設計されたGeminiのデスクトップ/Webアプリ内に、常時稼働エージェント「Gemini Spark」が存在すると報じられている。Connected Apps・チャット・タスク・ログイン中サイト・位置情報などから文脈を取り込み、一部データを第三者にルーティングして操作を実行しうるとされる。オンボーディング文言では「実験的」で、確認なしに情報共有や購入を行う可能性がある旨が示されていると報じられている（Android Authority）。

Gemini Flash 新チェックポイント

信頼度：中 / 情報源：TestingCatalog

新しいGemini FlashのチェックポイントがLM Arenaでテストされていると報じられている。リリース時には Gemini 3.6 Flash や Gemini 4 Flash など、別のバージョン番号が付く可能性があるとされる。

ChatGPT 双方向ボイス「Bidi 1」

信頼度：中 / 情報源：TestingCatalog

OpenAIが双方向（フルデュプレックス）音声モデル「GPT-Bidi-1」をChatGPT向けに準備していると報じられている。ユーザーが話している最中でも相槌を打ちつつ聞き続け、タスクを即座に切り替え、リアルタイム翻訳もできる可能性があるとされる。6月16日以降にアプリ内へUI要素が出現し、6月23日にはWeb向けの準備が確認されたと報じられている。

まとめ

今週は、フロンティアモデルの「公開の仕方」が変わりつつあることが最大の論点でした。GPT-5.6は政府ゲートと限定プレビューを挟み、Gemini 3.5 ProはGAを7月へ後ろ倒し。発表と実利用のあいだにタイムラグが入るのが新常態です。

実務では、いま触れる Terra／Luna などの層でコストと使い勝手を確かめつつ、GA日を基準に本命モデルの検証計画を組むのが堅実です。噂段階の常時稼働エージェントや双方向ボイスは、確定情報を待ってから評価すれば十分間に合います。

GPT-5.6 Sol/Terra/Lunaが政府ゲート付きで登場、7月Cerebrasで750tpsへ ― Gemini 3.5 ProはGA目前

2026年7月4日のAIニュース要点

OpenAI、GPT-5.6「Sol/Terra/Luna」を政府ゲート付きでプレビュー公開

max reasoning effort と ultra mode

アクセスは政府ゲート付き、Cerebrasで750tpsへ

Google、Gemini 3.5 Pro の一般提供を7月へ後ろ倒し

【未確定だけど気になる】今週のAIリーク・噂まとめ ※確定情報ではありません

Gemini Spark（常時稼働エージェント）

Gemini Flash 新チェックポイント

ChatGPT 双方向ボイス「Bidi 1」

まとめ

まずはお気軽にご相談ください