OpenAI GPT-5.4リリース

· NOP

はじめに

2026年3月5日、OpenAIが最新モデル「GPT-5.4」をリリースしました。「プロフェッショナルな作業に最も適したモデル」という触れ込みで、コンピュータ操作機能の標準搭載など大きなアップデートがあります。この記事では、発表された機能と性能を整理してみます。

主な特徴

1. ネイティブコンピュータ操作

GPT-5.4は、OpenAIの汎用モデルとして初めて「コンピュータ操作機能」を標準搭載しました。

  • スクリーンショットを見て、キーボード・マウス操作ができる
  • OSWorld-Verified: 75.0%(人間のスコアは72.4%)
  • 最大 1Mトークン のコンテキストウィンドウ対応

これまでコンピュータ操作はClaudeのComputer Useが先行していましたが、OpenAIもついに参入した形です。

2. プロフェッショナル知識作業

OpenAIによると、44の職業における専門家と比較して、83%のケースで同等以上の性能だったそうです。

  • スプレッドシートモデリング: 87.3%(GPT-5.2は68.4%)
  • 投資銀行業務タスクでの改善
  • プレゼン、ドキュメント、スプレッドシート作成に対応

ただし、これらはOpenAIが公開したベンチマーク結果で、第三者検証はまだありません。この点は覚えておきたいところです。

3. エラー削減

GPT-5.2と比べると、以下の改善があるとのこと:

  • 誤った主張: 33%減少
  • エラーを含む回答: 18%減少

4. コーディング能力

  • SWE-Bench Pro: 57.7%(GPT-5.3-Codexと同等)
  • /fastモードで最大1.5倍高速化
  • フロントエンド開発タスクでの改善

5. ツール使用・Web検索

  • 大規模なツールエコシステムへの対応
  • BrowseComp: 82.7%(GPT-5.2比で17%向上)
  • 複数ソースの統合や情報検索への対応

モデルラインナップ

モデル用途
GPT-5.4汎用・コーディング・エージェントタスク
GPT-5.4 Pro複雑な問題解決向け
GPT-5-miniコスト最適化された推論
GPT-5-nano高スループットタスク向け

料金(API)

モデル入力キャッシュ入力出力
gpt-5.4$2.50/M$0.25/M$15/M
gpt-5.4-pro$30/M$180/M

GPT-5.2よりトークン単価は上がっていますが、効率が良くなったので総コストは変わらないとOpenAIは説明しています。

利用可能な環境

  • ChatGPT: Plus、Team、Proユーザーに順次展開
  • API: gpt-5.4gpt-5.4-pro
  • Codex: 実験的な1Mコンテキスト対応

気になるところ

  • ベンチマークの多くがOpenAIの自己申告値で、第三者検証がまだありません
  • 「83%の職業で専門家レベル」という主張は、評価基準が明確ではありません
  • コンピュータ操作機能が実際にどれくらい使えるかは、実運用での検証が必要そうです

まとめ

GPT-5.4の主な変更点:

  1. コンピュータ操作機能の標準搭載 - Claude Computer Useへの対抗
  2. ビジネスツールへの対応強化 - スプレッドシートなど
  3. エラー削減 - 信頼性の改善を主張
  4. 大規模コンテキスト - 1Mトークン対応

2026年は「AIエージェントの実務適用」がトレンドと言われています。GPT-5.4もその流れに乗った製品です。ベンチマーク数値の第三者検証はこれからですが、コンピュータ操作の実用性など、実際に触って確かめていきたいと思います。

参考資料