DWF Ventures: AI는 DeFi 거래량의 19%를 차지하지만, 복잡한 거래에서 인간의 5분의 1에도 못 미치는 성능을 보입니다.

저자: DWF Ventures

작성자: Deep Tide TechFlow

심층 분석: AI 에이전트는 이미 DeFi 거래량의 거의 5분의 1을 차지하고 있으며, 수익률 최적화와 같은 잘 정의된 시나리오에서는 실제로 인간 에이전트보다 뛰어난 성과를 보였습니다. 그러나 자율 거래에 있어서는 최고 수준의 AI조차도 최고 수준의 인간 에이전트의 5분의 1에도 미치지 못하는 성능을 보입니다. 이 연구는 다양한 DeFi 시나리오에서 AI의 실제 성능을 분석하며, 자동 거래에 관심 있는 사람이라면 반드시 읽어볼 만한 가치가 있습니다.

핵심 사항

현재 자동화 및 에이전트 활동은 전체 온체인 활동의 약 19%를 차지하지만, 진정한 엔드투엔드 자율성은 아직 달성되지 않았습니다.

수익 최적화와 같이 구체적이고 명확하게 정의된 사용 사례에서는 에이전트가 인간과 봇 모두보다 우수한 성능을 보여주었습니다. 그러나 거래와 같이 다양한 요소를 포함하는 작업에서는 인간이 에이전트보다 더 나은 성능을 보입니다.

에이전트 중에서 모델 선택과 위험 관리가 거래 성과에 가장 큰 영향을 미칩니다.

에이전트가 대규모로 도입됨에 따라 시빌 공격, 정책 혼잡, 개인정보 보호 문제 등 신뢰 및 집행과 관련된 여러 위험이 발생합니다.

에이전트 활동이 지속적으로 증가하고 있습니다.

지난 한 해 동안 에이전트 활동은 거래량과 거래 건수 모두 꾸준히 증가했습니다. 코인베이스의 x402 프로토콜이 이러한 성장을 주도했으며, 비자, 스트라이프, 구글과 같은 기업들도 참여하여 자체 표준을 출시했습니다. 현재 구축 중인 인프라는 크게 두 가지 시나리오, 즉 에이전트 간 채널 또는 사람이 직접 요청하는 에이전트 호출을 지원하도록 설계되었습니다.

스테이블코인 거래가 널리 지지를 얻고 있지만, 현재의 인프라는 여전히 전통적인 결제 게이트웨이를 기반으로 하고 있어 중앙 집중식 거래 상대방에 의존하고 있습니다. 따라서 주체들이 자체적으로 자금을 조달하고, 거래를 실행하며, 변화하는 환경에 따라 지속적으로 최적화할 수 있는 "완전 자율"이라는 최종 목표는 아직 달성되지 못했습니다.

에이전트는 DeFi에 완전히 새로운 개념은 아닙니다. 수년 동안 온체인 프로토콜은 봇을 통한 자동화를 통해 MEV를 획득하거나 코드 없이는 불가능한 초과 수익을 얻는 기능을 제공해 왔습니다. 이러한 시스템은 자주 변경되지 않고 추가적인 감독이 필요하지 않은 잘 정의된 매개변수 하에서 매우 효율적으로 작동했습니다. 그러나 시간이 지남에 따라 시장은 더욱 복잡해졌습니다. 바로 이 지점에서 새로운 세대의 에이전트가 등장하고 있으며, 지난 몇 달 동안 온체인은 이러한 활동을 위한 테스트 장이 되었습니다.

에이전트의 실제 성능

보고서에 따르면 에이전트 활동은 기하급수적으로 증가하여 2025년 이후 17,000개 이상의 에이전트가 출시되었습니다. 자동화/에이전트 활동의 총량은 전체 온체인 활동의 19% 이상을 차지하는 것으로 추정됩니다. 이는 스테이블코인 전송의 76% 이상이 봇에 의해 이루어진다는 점을 고려하면 놀라운 일이 아닙니다. 이는 DeFi 내에서 에이전트 활동이 크게 성장할 여지가 있음을 시사합니다.

에이전트의 자율성은 매우 다양하며, 높은 수준의 인간 감독이 필요한 챗봇과 같은 경험부터 목표 입력값을 기반으로 시장 상황에 맞는 전략을 수립할 수 있는 에이전트까지 존재합니다. 봇과 비교했을 때, 에이전트는 몇 가지 핵심적인 이점을 제공하는데, 여기에는 밀리초 단위로 새로운 정보에 반응하고 실행할 수 있는 능력, 그리고 동일한 수준의 정확성을 유지하면서 수천 개의 시장으로 확장할 수 있는 능력이 포함됩니다.

현재 대부분의 상담원들은 여전히 테스트 단계에 있기 때문에 분석가에서 부조종사 수준에 머물러 있습니다.

수익 최적화: 에이전트 성능이 탁월합니다.

유동성 공급은 자동화가 점차 보편화되고 있는 분야로, 에이전트들이 보유한 총 TVL(총 예치 자산)은 3,900만 달러를 넘어섰습니다. 이 수치는 주로 사용자가 에이전트에게 직접 예치한 자산을 측정한 것이며, 금고를 통해 이동된 자본은 제외됩니다.

업계 최대 프로토콜 중 하나인 기자 테크(Giza Tech)는 작년 말 주요 DeFi 프로토콜의 수익률 확보를 강화하기 위해 설계된 첫 번째 에이전트 앱인 ARMA를 출시했습니다. ARMA는 현재 1,900만 달러 이상의 운용 자산을 유치했으며, 40억 달러 이상의 에이전트 거래량을 기록했습니다. 운용 자산 대비 거래량 비율이 높은 것은 에이전트가 빈번하게 자본을 재조정하여 더 높은 수익률을 달성할 수 있음을 나타냅니다. 자본이 계약에 예치되면 거래 실행이 자동화되어 사용자는 최소한의 관리만으로도 간편하게 원클릭 거래를 할 수 있습니다.

ARMA의 성능은 눈에 띄게 우수하며, USDC에 대해 연평균 9.75% 이상의 수익률을 창출합니다. 추가적인 리밸런싱 수수료와 에이전트의 10% 성과 수수료를 고려하더라도, 수익률은 Aave나 Morpho에서의 일반적인 대출 수익률을 능가합니다. 그러나 확장성은 여전히 중요한 과제입니다. 이러한 에이전트들은 아직 주요 DeFi 프로토콜을 관리하거나 확장하는 데 있어 충분한 검증을 거치지 않았기 때문입니다.

무역: 인류는 훨씬 앞서 있다

하지만 거래와 같은 더 복잡한 행위의 경우 결과는 훨씬 더 다양합니다. 현재의 거래 모델은 사람이 정의한 입력값을 기반으로 작동하며 미리 정의된 규칙에 따라 출력값을 제공합니다. 머신 러닝은 모델이 명시적인 재프로그래밍 없이 새로운 정보에 따라 행동을 업데이트할 수 있도록 함으로써 이러한 방식을 확장하여 모델을 보조 조종사 역할로 이끌어갑니다. 완전 자율 에이전트가 추가됨에 따라 거래 환경은 극적인 변화를 겪게 될 것입니다.

여러 차례 거래 경쟁이 에이전트 간, 그리고 사람과 에이전트 간에 진행되었으며, 그 결과 모델 간에 상당한 차이가 나타났습니다. TradeXYZ는 자사 플랫폼에 상장된 주식을 대상으로 사람-에이전트 거래 경쟁을 개최했습니다. 각 계정에는 초기 자본금 1만 달러가 주어졌고, 레버리지나 거래 빈도에는 제한이 없었습니다. 결과는 압도적으로 사람의 우세였으며, 최고의 성과를 낸 사람은 최고의 에이전트보다 5배 이상 높은 수익률을 기록했습니다.

한편, Nof1은 자본 보존부터 최대 레버리지까지 다양한 위험 프로필을 테스트하기 위해 자사 모델(Grok-4, GPT-5, Deepseek, Kimi, Qwen3, Claude, Gemini) 간의 에이전트 트레이딩 경쟁을 개최했습니다. 그 결과, 성능 차이를 설명하는 데 도움이 될 수 있는 몇 가지 요인이 밝혀졌습니다.

보유 시간: 강한 상관관계가 있습니다. 각 포지션을 평균 2~3시간 보유하는 모델은 포지션을 자주 바꾸는 모델보다 훨씬 더 나은 성과를 보입니다.

기대값: 이는 모델이 거래당 평균적으로 수익을 내는지 여부를 측정합니다. 흥미롭게도 상위 3개 모델만 양의 기대값을 보였는데, 이는 대부분의 모델이 수익 거래보다 손실 거래가 더 많다는 것을 의미합니다.

레버리지: 평균 6~8배의 낮은 레버리지 수준이 10배 이상의 레버리지를 사용하는 모델보다 우수한 성과를 보이는 것으로 나타났으며, 레버리지 수준이 높을수록 손실이 가속화됩니다.

팁: 수도승 모드가 단연 최고의 성능을 보이는 모델이며, 상황 인식 모드는 최악의 성능을 보입니다. 모델의 특성을 분석해 보면, 위험 관리와 외부 요인 최소화에 집중하는 것이 더 나은 성과로 이어진다는 것을 알 수 있습니다.

기본 모델인 Grok 4.20은 다양한 프롬프트 전략에서 다른 모델보다 22% 이상 뛰어난 성능을 보였으며, 평균 수익성을 달성한 유일한 모델이었습니다.

장기/단기 선호도, 거래 규모, 신뢰도 점수와 같은 다른 요인들은 충분한 데이터가 부족하거나 모델 성능과의 긍정적인 상관관계가 입증되지 않았습니다. 전반적으로, 결과는 에이전트들이 명확하게 정의된 제약 조건 내에서 더 나은 성과를 보이는 경향이 있음을 보여주며, 이는 목표 할당에 있어 인간의 개입이 여전히 중요하다는 것을 시사합니다.

에이전트를 평가하는 방법

에이전트 기술이 아직 초기 단계에 있기 때문에 현재로서는 포괄적인 평가 프레임워크가 없습니다. 에이전트 평가의 기준으로 과거 성능이 자주 사용되지만, 이는 에이전트의 우수한 성능을 더 잘 보여주는 근본적인 요인들의 영향을 받습니다.

다양한 변동성 수준에서의 성능: 상황 악화 시 체계적인 손실 관리 능력을 포함하여, 에이전트가 거래 수익성에 영향을 미칠 수 있는 오프체인 요인을 식별할 수 있음을 보여줍니다.

투명성과 프라이버시: 양쪽 모두 장단점이 있습니다. 투명한 에이전트는 거래 내역을 쉽게 복제할 수 있다면 전략적 이점이 거의 없습니다. 반면 프라이버시를 보호하는 에이전트는 제작자의 데이터베이스에서 추출될 위험이 있으며, 이로 인해 제작자가 사용자를 쉽게 빼앗아 갈 수 있습니다.

정보 출처: 에이전트가 연결하는 데이터 출처는 에이전트의 의사 결정 방식에 매우 중요합니다. 출처가 신뢰할 수 있고 단일 종속성이 없는지 확인하는 것이 필수적입니다.

보안: 예상치 못한 사태(블랙 스완 이벤트)에 대비하기 위해 스마트 계약 감사 및 적절한 에스크로 구조를 마련하는 것이 매우 중요합니다.

에이전트의 다음 단계

에이전트를 대규모로 도입하기 위해서는 인프라 측면에서 해결해야 할 과제가 많습니다. 이는 에이전트에 대한 신뢰와 규제 준수와 관련된 핵심 문제로 귀결됩니다. 자율 에이전트의 부주의한 행동으로 인해 이미 자금 횡령 사례가 발생한 바 있습니다.

2026년 1월에 출시된 ERC-8004는 최초의 온체인 레지스트리로서, 자율 에이전트들이 서로를 발견하고, 검증 가능한 평판을 구축하며, 안전하게 협업할 수 있도록 했습니다. 이는 신뢰 점수가 스마트 계약 자체에 내장되어 에이전트와 프로토콜 간의 허가 없는 활동을 가능하게 함으로써 DeFi의 구성 가능성을 크게 확장하는 핵심 요소입니다. 그러나 평판 담합이나 시빌 공격과 같은 보안 취약점이 여전히 존재하기 때문에 에이전트가 항상 악의 없이 작동한다는 것을 보장하지는 않습니다. 따라서 보험, 보안, 에이전트의 경제적 스테이킹과 같은 영역에서 개선의 여지가 여전히 큽니다.

탈중앙 금융(DeFi)에서 에이전트 활동이 확대됨에 따라 전략 집중 현상이 구조적 위험으로 대두되고 있습니다. 수익률 파밍(Yield farm)이 가장 대표적인 사례로, 전략이 널리 퍼질수록 수익률이 압축되는 현상을 보여줍니다. 에이전트 거래에도 동일한 역학 관계가 적용될 수 있습니다. 만약 다수의 에이전트가 유사한 데이터로 학습되고 유사한 목표에 최적화된다면, 비슷한 포지션과 유사한 청산 신호로 수렴하게 될 것입니다.

2026년 1월 코넬 대학교에서 발표된 CoinAlg 논문은 이 문제의 한 버전을 공식화했습니다. 투명한 에이전트는 거래가 예측 가능하고 선점될 수 있기 때문에 차익거래의 대상이 될 수 있습니다. 비공개 에이전트는 이러한 위험을 피하지만 다른 위험을 초래합니다. 즉, 생성자가 사용자보다 정보 우위를 유지하고 불투명성이 보호하고자 하는 내부 지식을 통해 가치를 추출할 수 있다는 것입니다.

에이전트 활동은 앞으로 더욱 가속화될 것이며, 오늘날 구축되는 인프라가 온체인 금융의 다음 단계를 좌우할 것입니다. 에이전트 사용량이 증가함에 따라 에이전트는 반복적으로 개선되고 사용자 선호도에 더욱 능숙해질 것입니다. 따라서 가장 큰 시장 점유율을 확보하는 것은 신뢰할 수 있는 인프라의 핵심 경쟁력이 될 것입니다.