オープンモデル / AIエージェント / コーディング
Ornith-1.0登場──Claude Opus 4.7と同等性能のコーディングAIモデル、ローカル動作も可能
AI研究組織DeepReinforceが、エージェントコーディングに特化したAIモデルファミリー「Ornith-1.0」をオープンモデルとして公開した。最上位のOrnith-1.0-397Bは複数のベンチマークでClaude Opus 4.7を上回る性能を示し、最小のOrnith-1.0-9Bはエッジデバイスで動作する。
Ornith-1.0の4サイズ展開
Ornith-1.0はGemma 4とQwen3.5をベースに開発されたエージェントコーディング特化モデル。4種類のサイズが用意されている。
| モデル | タイプ | 特徴 |
|---|---|---|
| Ornith-1.0-397B | MoE | 最上位、Claude Opus 4.7に匹敵 |
| Ornith-1.0-35B | MoE | Qwen3.6 35BやGemma 4 31Bを上回る |
| Ornith-1.0-31B | Dense | 近日公開予定 |
| Ornith-1.0-9B | Dense | 最小、エッジデバイス動作、Gemma 4 31Bを上回る |
いずれもMITライセンスで公開されており、Hugging Faceからダウンロード可能。
Self-Scaffolding:スキャフォールドも学習する新方式
Ornith-1.0の最大の技術的特徴は「Self-Scaffolding」アプローチにある。従来のAIエージェントでは、スキャフォールド(エージェントの動作フレームワーク)やハーネスは人間が設計するのが一般的だった。Ornith-1.0はスキャフォールド自体も学習対象とすることで、報酬ハッキングを避けつつエージェント性能を最適化することに成功している。
これにより、単なるベンチマークスコアの向上ではなく、実際のエージェントタスクにおける実用的な性能向上が期待できるとしている。
ベンチマーク性能
Ornith-1.0-397Bは複数のベンチマークテストでClaude Opus 4.7を上回るスコアを記録。中規模のOrnith-1.0-35Bも同クラスのQwen3.6 35BやGemma 4 31Bを上回っている。最も注目すべきは最小のOrnith-1.0-9Bで、パラメーター数が約3分の1であるGemma 4 31Bを上回る性能を示した点だ。
コーディングAIエージェントへの影響
CodexやClaude CodeのようなコーディングAIエージェントは現在、OpenAIやAnthropicのプロプライエタリモデルに依存している。Ornith-1.0のような高性能オープンモデルの登場は、開発者が自前でホストできるコーディングエージェント構築の選択肢を広げることになる。
特にOrnith-1.0-9Bはローカルデバイスで動作するため、外部APIに依存しないコーディング支援環境の構築が可能になる。9Bモデルが31Bモデルを上回る性能を示した点は、小さなモデルの可能性を大きく広げる結果といえる。
本記事の情報源
本記事はGIGAZINEの記事「Claude Opus 4.7と同等性能のコーディングAIモデル「Ornith-1.0」が登場、ローカルで動作する小型モデルもラインナップ」をもとにcodexguide.jpが編集・要約したものです。


