オープンモデル / AIエージェント / コーディング

Ornith-1.0登場──Claude Opus 4.7と同等性能のコーディングAIモデル、ローカル動作も可能

公開日: 2026年7月5日出典: GIGAZINE

AI研究組織DeepReinforceが、エージェントコーディングに特化したAIモデルファミリー「Ornith-1.0」をオープンモデルとして公開した。最上位のOrnith-1.0-397Bは複数のベンチマークでClaude Opus 4.7を上回る性能を示し、最小のOrnith-1.0-9Bはエッジデバイスで動作する。

Ornith-1.0の4サイズ展開

Ornith-1.0はGemma 4とQwen3.5をベースに開発されたエージェントコーディング特化モデル。4種類のサイズが用意されている。

モデルタイプ特徴
Ornith-1.0-397BMoE最上位、Claude Opus 4.7に匹敵
Ornith-1.0-35BMoEQwen3.6 35BやGemma 4 31Bを上回る
Ornith-1.0-31BDense近日公開予定
Ornith-1.0-9BDense最小、エッジデバイス動作、Gemma 4 31Bを上回る

いずれもMITライセンスで公開されており、Hugging Faceからダウンロード可能。

Self-Scaffolding:スキャフォールドも学習する新方式

Ornith-1.0の最大の技術的特徴は「Self-Scaffolding」アプローチにある。従来のAIエージェントでは、スキャフォールド(エージェントの動作フレームワーク)やハーネスは人間が設計するのが一般的だった。Ornith-1.0はスキャフォールド自体も学習対象とすることで、報酬ハッキングを避けつつエージェント性能を最適化することに成功している。

これにより、単なるベンチマークスコアの向上ではなく、実際のエージェントタスクにおける実用的な性能向上が期待できるとしている。

ベンチマーク性能

Ornith-1.0-397Bは複数のベンチマークテストでClaude Opus 4.7を上回るスコアを記録。中規模のOrnith-1.0-35Bも同クラスのQwen3.6 35BやGemma 4 31Bを上回っている。最も注目すべきは最小のOrnith-1.0-9Bで、パラメーター数が約3分の1であるGemma 4 31Bを上回る性能を示した点だ。

コーディングAIエージェントへの影響

CodexやClaude CodeのようなコーディングAIエージェントは現在、OpenAIやAnthropicのプロプライエタリモデルに依存している。Ornith-1.0のような高性能オープンモデルの登場は、開発者が自前でホストできるコーディングエージェント構築の選択肢を広げることになる。

特にOrnith-1.0-9Bはローカルデバイスで動作するため、外部APIに依存しないコーディング支援環境の構築が可能になる。9Bモデルが31Bモデルを上回る性能を示した点は、小さなモデルの可能性を大きく広げる結果といえる。

本記事の情報源
本記事はGIGAZINEの記事「Claude Opus 4.7と同等性能のコーディングAIモデル「Ornith-1.0」が登場、ローカルで動作する小型モデルもラインナップ」をもとにcodexguide.jpが編集・要約したものです。