OpenAI GPT-5.4リリース
はじめに
2026年3月5日、OpenAIが最新モデル「GPT-5.4」をリリースしました。「プロフェッショナルな作業に最も適したモデル」という触れ込みで、コンピュータ操作機能の標準搭載など大きなアップデートがあります。この記事では、発表された機能と性能を整理してみます。
主な特徴
1. ネイティブコンピュータ操作
GPT-5.4は、OpenAIの汎用モデルとして初めて「コンピュータ操作機能」を標準搭載しました。
- スクリーンショットを見て、キーボード・マウス操作ができる
- OSWorld-Verified: 75.0%(人間のスコアは72.4%)
- 最大 1Mトークン のコンテキストウィンドウ対応
これまでコンピュータ操作はClaudeのComputer Useが先行していましたが、OpenAIもついに参入した形です。
2. プロフェッショナル知識作業
OpenAIによると、44の職業における専門家と比較して、83%のケースで同等以上の性能だったそうです。
- スプレッドシートモデリング: 87.3%(GPT-5.2は68.4%)
- 投資銀行業務タスクでの改善
- プレゼン、ドキュメント、スプレッドシート作成に対応
ただし、これらはOpenAIが公開したベンチマーク結果で、第三者検証はまだありません。この点は覚えておきたいところです。
3. エラー削減
GPT-5.2と比べると、以下の改善があるとのこと:
- 誤った主張: 33%減少
- エラーを含む回答: 18%減少
4. コーディング能力
- SWE-Bench Pro: 57.7%(GPT-5.3-Codexと同等)
/fastモードで最大1.5倍高速化- フロントエンド開発タスクでの改善
5. ツール使用・Web検索
- 大規模なツールエコシステムへの対応
- BrowseComp: 82.7%(GPT-5.2比で17%向上)
- 複数ソースの統合や情報検索への対応
モデルラインナップ
| モデル | 用途 |
|---|---|
| GPT-5.4 | 汎用・コーディング・エージェントタスク |
| GPT-5.4 Pro | 複雑な問題解決向け |
| GPT-5-mini | コスト最適化された推論 |
| GPT-5-nano | 高スループットタスク向け |
料金(API)
| モデル | 入力 | キャッシュ入力 | 出力 |
|---|---|---|---|
| gpt-5.4 | $2.50/M | $0.25/M | $15/M |
| gpt-5.4-pro | $30/M | — | $180/M |
GPT-5.2よりトークン単価は上がっていますが、効率が良くなったので総コストは変わらないとOpenAIは説明しています。
利用可能な環境
- ChatGPT: Plus、Team、Proユーザーに順次展開
- API:
gpt-5.4、gpt-5.4-pro - Codex: 実験的な1Mコンテキスト対応
気になるところ
- ベンチマークの多くがOpenAIの自己申告値で、第三者検証がまだありません
- 「83%の職業で専門家レベル」という主張は、評価基準が明確ではありません
- コンピュータ操作機能が実際にどれくらい使えるかは、実運用での検証が必要そうです
まとめ
GPT-5.4の主な変更点:
- コンピュータ操作機能の標準搭載 - Claude Computer Useへの対抗
- ビジネスツールへの対応強化 - スプレッドシートなど
- エラー削減 - 信頼性の改善を主張
- 大規模コンテキスト - 1Mトークン対応
2026年は「AIエージェントの実務適用」がトレンドと言われています。GPT-5.4もその流れに乗った製品です。ベンチマーク数値の第三者検証はこれからですが、コンピュータ操作の実用性など、実際に触って確かめていきたいと思います。