DWF Ventures：AIはDeFi取引量の19％を占めているが、複雑な取引においては人間のパフォーマンスの5分の1にも満たない。

著者：DWF Ventures

編集：Deep Tide TechFlow

詳細解説： AIエージェントはすでにDeFi取引量の約5分の1を占めており、利回り最適化のような明確なシナリオでは人間のエージェントを凌駕する実績を上げています。しかし、自律取引となると、最高レベルのAIでさえ、最高レベルの人間のエージェントの5分の1にも満たないパフォーマンスしか発揮できません。本調査では、さまざまなDeFiシナリオにおけるAIの実際のパフォーマンスを分析しており、自動取引に関心のある方ならどなたでも一読の価値があります。

要点

自動化およびエージェントによる活動は現在、オンチェーン活動全体の約19%を占めているが、真のエンドツーエンドの自律性はまだ実現されていない。

利益最適化のような、狭く明確に定義されたユースケースにおいては、エージェントは人間やボットと比較して優れたパフォーマンスを発揮する。しかし、取引のような多面的なアクションにおいては、人間がエージェントを上回る。

エージェントの中でも、モデル選択とリスク管理は取引パフォーマンスに最も大きな影響を与える。

エージェントが大規模に導入されるにつれて、シビル攻撃、ポリシーの混雑、プライバシーのトレードオフなど、信頼性と執行に関していくつかのリスクが生じる。

エージェントの活動は拡大し続けている。

エージェントの活動は過去1年間で着実に成長しており、取引量と取引件数の両方が増加しています。特にCoinbaseのx402プロトコルが大きな成長を牽引しており、Visa、Stripe、Googleといった企業が参入し、独自の標準規格を打ち出しています。現在構築されているインフラの多くは、エージェント間のチャネル、または人間がトリガーするエージェント呼び出しという2種類のシナリオに対応するように設計されています。

ステーブルコイン取引は広く支持を集めているものの、現在のインフラは依然として従来の決済ゲートウェイを基盤としており、中央集権的な取引相手に依存している。そのため、エージェントが自己資金調達、自己実行、そして変化する状況に基づいて継続的に最適化できる「完全自律型」の最終目標はまだ達成されていない。

エージェントはDeFiにおいて全く新しい存在というわけではありません。長年にわたり、オンチェーンプロトコルではボットによる自動化が行われ、MEV（最小実行可能価値）の獲得や、コードなしでは不可能な超過収益の獲得が可能でした。これらのシステムは、頻繁に変更されず、追加の監視も必要としない明確なパラメータに基づいて非常にうまく機能していました。しかし、市場は時間の経過とともに複雑化しています。こうした状況の中で、新たな世代のエージェントが登場し、ここ数ヶ月間、オンチェーンはこうした活動のテスト場となっています。

エージェントの実際のパフォーマンス

報告書によると、エージェントの活動は飛躍的に増加しており、2025年以降、17,000以上のエージェントが稼働を開始している。自動化されたエージェント活動の総量は、オンチェーン活動全体の19%以上を占めると推定されている。ステーブルコインの送金の76%以上がボットによって行われていると推定されていることを考えると、これは驚くべきことではない。このことから、DeFiにおけるエージェント活動には大きな成長の余地があることが示唆される。

エージェントの自律性は、高度な人間の監視を必要とするチャットボットのような体験から、ターゲットからの入力に基づいて市場状況に合わせた戦略を策定できるエージェントまで、幅広く存在します。ボットと比較して、エージェントにはいくつかの重要な利点があります。例えば、新しい情報にミリ秒単位で対応して実行できること、そして同じレベルの厳密さを維持しながら数千もの市場に拡張できることなどが挙げられます。

現在、ほとんどのエージェントはアナリストから副操縦士レベルにとどまっています。これは、そのほとんどがまだテスト段階にあるためです。

利益最適化：エージェントのパフォーマンスは素晴らしい

流動性供給は、自動化がますます一般的になっている分野であり、エージェントが保有する総流動性資産（TVL）は3,900万ドルを超えています。この数字は主に、ユーザーがエージェントに直接預け入れた資産を計測したもので、金庫を経由した資金は含まれていません。

業界最大規模のプロトコルの1つであるGiza Techは、昨年後半に、主要なDeFiプロトコルの利回り獲得を強化するために設計された初のエージェントアプリ「ARMA」をリリースしました。ARMAは、運用資産総額1,900万ドル以上を集め、エージェント取引高は40億ドルを超えています。運用資産総額に対する取引高の比率が高いことは、エージェントが頻繁に資金のリバランスを行い、より高い利回り獲得を実現していることを示しています。契約に資金が預け入れられると、実行は自動化され、ユーザーは最小限の監視でワンクリックのシンプルな操作で取引を行うことができます。

ARMAのパフォーマンスは明らかに優れており、USDCの年間利回りは9.75%を超えています。追加のリバランス手数料とエージェントの10%のパフォーマンス手数料を考慮しても、その利回りはAaveやMorphoでの一般的なレンディングを上回っています。しかしながら、これらのエージェントは主要なDeFiプロトコルを管理・拡張するための実戦テストをまだ受けていないため、スケーラビリティは依然として重要な課題です。

貿易：人類ははるかに先を行っている

しかし、トレーディングのようなより複雑なアクションの場合、結果ははるかに多様になります。現在のトレーディングモデルは、人間が定義した入力に基づいて動作し、事前に定義されたルールに従って出力を提供します。機械学習は、明示的な再プログラミングなしに新しい情報に基づいてモデルの動作を更新できるようにすることで、これを拡張し、モデルを副操縦士のような役割へと押し上げます。完全自律型エージェントの導入により、トレーディング環境は劇的に変化するでしょう。

エージェント同士、あるいは人間とエージェントの間で、いくつかのトレーディングコンテストが開催され、その結果はモデル間の大きな違いを示しています。TradeXYZは、自社プラットフォームに上場されている株式を対象に、人間とエージェントによるトレーディングコンテストを開催しました。各アカウントの初期資本は1万ドルで、レバレッジや取引頻度に制限はありませんでした。結果は圧倒的に人間有利で、トップの人間はトップのエージェントを5倍以上も上回る成績を収めました。

一方、Nof1は、資本保全から最大レバレッジまで、さまざまなリスクプロファイルをテストするために、自社のモデル（Grok-4、GPT-5、Deepseek、Kimi、Qwen3、Claude、Gemini）間でエージェント取引コンペティションを開催しました。その結果、パフォーマンスの違いを説明するのに役立ついくつかの要因が明らかになりました。

保有時間：強い相関関係があります。各ポジションを平均2～3時間保有するモデルは、頻繁にポジションを入れ替えるモデルよりもはるかに優れています。

期待値：これは、モデルが1回の取引で平均して利益を上げているかどうかを示す指標です。興味深いことに、期待値がプラスになっているのは上位3つのモデルのみであり、これはほとんどのモデルが勝ちトレードよりも負けトレードの方が多いことを意味します。

レバレッジ：平均して6～8倍の低いレバレッジレベルは、10倍以上のレバレッジで運用されているモデルよりも優れたパフォーマンスを発揮することが証明されていますが、高いレバレッジレベルは損失を加速させます。

ヒント：モンクモードは群を抜いて最高のパフォーマンスを発揮するモデルであり、状況認識モードは最もパフォーマンスが低い。モデルの特性に基づくと、リスク管理に重点を置き、外部情報源を減らすことで、より良いパフォーマンスが得られることがわかる。

基本モデルであるGrok 4.20は、さまざまなプロンプト戦略において他のモデルを22%以上も上回る優れたパフォーマンスを示し、平均的な収益性を達成した唯一のモデルでした。

ロング／ショートの選好度、取引規模、信頼度スコアといったその他の要因については、十分なデータが不足しているか、モデルのパフォーマンスとの正の相関関係が示されていない。全体として、結果はエージェントが明確に定義された制約内でより良いパフォーマンスを発揮する傾向があることを示しており、ターゲット配分における人間の介入が依然として重要であることを示唆している。

エージェントを評価する方法

エージェントはまだ開発初期段階にあるため、現時点では包括的な評価フレームワークは存在しません。過去の実績はエージェントの評価基準としてよく用いられますが、優れたエージェント性能を示すより強力な指標となる根本的な要因によって影響を受けます。

さまざまな変動レベルにおけるパフォーマンス：状況が悪化した際の規律ある損失管理を含め、エージェントが取引収益性に影響を与える可能性のあるオフチェーン要因を特定できることを示します。

透明性とプライバシー：どちらにもトレードオフが存在する。透明性の高いエージェントは、そのトランザクションが積極的にコピーされる可能性がある場合、戦略的な優位性をほとんど持たない。一方、プライベートなエージェントは、作成者のデータベースから抽出されるリスクに直面し、作成者がユーザーを容易に奪う可能性が生じる。

情報源：エージェントが接続するデータソースは、エージェントの意思決定方法を決定する上で非常に重要です。ソースが信頼できるものであり、単一の依存関係を持たないことを確認することが不可欠です。

セキュリティ：スマートコントラクトの監査と適切なエスクロー構造を導入し、ブラックスワン現象に対するバックアップ対策を確実に講じることは非常に重要です。

エージェントの次のステップ

大規模なエージェント導入に向けたインフラ整備には、まだ多くの課題が残されている。これは、エージェントの信頼性と運用管理に関する重要な問題に集約される。自律型エージェントの行動に対する安全対策が不十分なため、資金の不正管理といった事態が発生している。

2026年1月にローンチされたERC-8004は、オンチェーンレジストリとして初めて、自律型エージェントが互いを発見し、検証可能な評判を構築し、安全に連携することを可能にしました。これは、信頼スコアがスマートコントラクト自体に組み込まれているため、エージェントとプロトコル間のパーミッションレスな活動が可能になり、DeFiのコンポーザビリティの重要な鍵となります。しかし、評判の共謀やシビル攻撃などのセキュリティ脆弱性が発生する可能性があるため、エージェントが常に悪意のない方法で動作することを保証するものではありません。したがって、保険、セキュリティ、エージェントの経済的ステーキングなどの分野では、大幅な改善の余地が残されています。

DeFiにおけるエージェント活動の拡大に伴い、戦略の集中化が構造的なリスクとなる。イールドファームはその最も分かりやすい例であり、戦略が普及するにつれてリターンが圧縮される。エージェント取引にも同様の現象が当てはまる可能性がある。多数のエージェントが類似のデータに基づいて学習し、類似の目標に向けて最適化されている場合、それらは類似のポジションと類似の決済シグナルに収束するだろう。

2026年1月にコーネル大学が発表したCoinAlg論文は、この問題の一形態を定式化した。透明なエージェントは、その取引が予測可能で先制攻撃を受ける可能性があるため、裁定取引の対象となる。プライベートエージェントはこのリスクを回避するが、別のリスクをもたらす。すなわち、作成者はユーザーに対して情報上の優位性を保持し、不透明性によって保護されるはずの内部知識を通じて価値を引き出すことができる。

エージェントの活動は今後も加速し続けるでしょう。そして、今日構築されるインフラが、オンチェーン金融の次の段階の運営方法を決定づけることになります。エージェントの利用が増加するにつれて、エージェントは改良を重ね、ユーザーの好みに適応する能力を高めていくでしょう。したがって、最大の差別化要因は信頼できるインフラとなり、それが最大の市場シェアを獲得することになるでしょう。