최고 명문 대학들의 협력체인 IC3가 인공지능과 암호화폐의 결합이 진정한 미래인지, 아니면 허구적인 이야기인지 분석합니다.

저자: IC3

작성자: 지아 환, 체인캐처

주요 결론

인공지능과 암호화폐의 의미 있는 통합은 아직 초기 단계에 있으며, 이러한 융합을 둘러싼 과대광고가 실제 진전을 가리고 있습니다.

암호화폐와 인공지능(AI)의 융합 영역에서 AI는 이미 기존 거래, 이벤트 및 프로토콜의 핵심 속성을 분석하고 탐지하여 사기 또는 취약한 스마트 계약을 식별할 수 있습니다. 이러한 기술은 대개 간단한 머신러닝 방식을 사용하며, 충분한 데이터가 확보된 통제된 환경에서 가장 효과적입니다.

인공지능(AI)과 암호화 기술의 융합 분야에서 암호화 도구는 AI 프로세스를 보호하고 관리하는 새로운 길을 열어줍니다. 영지식 증명이나 신뢰 컴퓨팅과 같은 도구를 활용하면 AI 결과의 변조 위험을 줄일 수 있습니다. 하지만 분산형 거버넌스나 분산형 인프라 관리와 같은 개념은 아직 주류 AI 커뮤니티에서 제대로 구현되지 못했습니다.

이 업계는 여전히 두 가지를 증명해야 합니다.

첫째, 분산형 AI는 중앙 집중식 솔루션과의 보다 엄격하고 직접적인 비용 비교가 필요합니다. 현재 업계에서는 주로 "대규모 모델을 분산 환경에서 학습시킬 수 있다"는 점을 입증하고 있지만, 특정 시나리오에서 중앙 집중식 플랫폼과의 비용 경쟁력에 대한 정량적 증거는 아직 부족합니다.

둘째, 암호화폐 결제는 중앙 집중식 솔루션과 비교하여 에이전트 결제 시나리오에서 실질적인 효율성을 입증해야 합니다. 암호화폐는 결제 분야에서 뚜렷한 발전을 이루지 못했지만, 에이전트 결제는 수수료가 저렴하고 "계좌는 특정 개인 소유여야 한다"는 기존 금융 모델의 제약이 없으므로 잠재력이 있습니다. 업계는 타당성 검토 단계에 머무르지 않고, 정량적인 증거를 통해 이러한 기회를 포착해야 합니다.

또한, 해결되지 않은 연구 과제가 두 가지 있습니다.

첫째, AI 보안에는 시스템 수준의 방어가 필요합니다. AI 커뮤니티는 일반적으로 모델 수준에서 보안 문제를 해결하고 입력 및 출력의 의미론에 대한 안전장치를 설계합니다. 그러나 에이전트가 더욱 자율화되고 기본 인프라에 직접 접근할 수 있게 됨에 따라 이러한 접근 방식은 더 이상 충분하지 않습니다. 암호화 기술의 검증 가능한 실행 및 인증 프로세스는 모델 수준에서 제공할 수 없는 시스템 수준 보호의 공백을 메울 수 있습니다.

둘째로, 암호화폐와 인공지능의 결합은 막을 수 없는 자율 에이전트나 제어 불능의 스마트 계약과 같은 새로운 위협 행위자와 공격 방식을 낳을 것이며, 이에 대해서는 아래에서 자세히 논의할 것입니다.

통합 프레임워크: AI와 암호화 기술은 서로에게 "미들웨어" 역할을 합니다.

자동화된 의사결정 과정은 인간의 의도, 입력, 프로그램, 출력의 네 단계로 나눌 수 있으며, 이 단계의 각 단계는 신뢰할 수 없을 수 있습니다. 인공지능과 암호화폐는 각각 이 틀 안에서 특정 부분을 담당합니다.

AI는 모호한 인간의 의도를 기계가 실행 가능한 프로그램으로 변환하는 "번역 미들웨어"입니다. 예를 들어 "주차 표지판을 인식하고 싶다"는 의도를 학습된 모델로 변환함으로써 블록체인 사용 장벽을 낮춥니다.

암호화 기술은 신뢰 컴퓨팅을 활용하여 특정 연산이 합의에 따라 실행되고 결과가 변조되지 않도록 보장하는 "신뢰 구축 미들웨어"입니다. 또한, 분산화를 통해 시스템의 상시 가용성과 검열 저항성을 보장합니다. 일부 방식은 입력과 출력이 유출되지 않도록 보장하는 기능(기밀성)도 제공합니다.

신뢰할 수 있는 컴퓨팅을 구현하는 데에는 세 가지 기술적 경로가 있습니다.

첫째, 신뢰 실행 환경(TEE)은 격리 및 원격 검증을 제공하기 위해 전용 하드웨어에 의존합니다(하드웨어는 칩의 진위 여부를 검증 가능한 방식으로 증명하여 변조되지 않았음을 확인합니다). NVIDIA의 기밀 컴퓨팅 기술을 활용하면 8B 파라미터 모델 추론 시 오버헤드는 7% 미만이며, 70B 모델의 경우 사실상 손실이 없습니다. 하지만 이러한 방식의 단점은 하드웨어 공급업체를 신뢰해야 한다는 점과 물리적 공격에 대한 보호가 부족하다는 점입니다.

둘째, 영지식 증명(ZK)은 오로지 암호학적 문제에만 의존하므로 가장 깔끔한 보안 가정을 하지만, 비용이 매우 많이 듭니다. 약 1,800만 개의 매개변수를 가진 작은 모델에 대한 증명을 생성하는 데 약 1분이 소요되는데, 이는 최첨단 대규모 모델에 비해 몇 자릿수나 느립니다.

셋째, 다자간 컴퓨팅(MPC)은 원본 데이터를 전달하지 않고도 여러 당사자가 공동으로 계산할 수 있도록 하지만 속도가 느립니다. 최첨단 MPC Transformer 추론 프레임워크는 LLaMA-7B 토큰 하나를 생성하는 데 약 5분이 소요됩니다.

오라클은 오프체인 데이터를 블록체인에 안정적으로 전송하는 역할을 담당합니다. 타운 크라이어(Town Crier)나 데코(DECO)와 같은 프라이버시 오라클은 개인정보를 침해하지 않고 데이터의 성격을 증명하는 기능을 제공합니다. 예를 들어, 다른 정보를 노출하지 않고 "누군가의 신용 점수가 700점 이상"이라는 사실을 증명할 수 있습니다.

업계에서는 일반적으로 이 기술을 zkTLS라고 부르지만, TEE 기반 솔루션은 영지식 증명을 사용하지 않으므로 이는 잘못된 명칭입니다.

암호화폐와 AI의 결합: AI를 활용한 블록체인 기술 강화

암호화폐 분야의 인공지능 연구는 크게 세 세대로 나눌 수 있다.

1세대: 분석 및 탐지

10년 이상 동안 머신러닝은 온체인 상태를 분석하는 데 사용되어 왔습니다. 예를 들어, 합의 프로토콜의 취약점(채굴자가 채굴한 블록을 숨겼다가 적절한 시기에 공개하여 더 많은 이익을 얻는 이기적 채굴 등)을 발견하고, P2P 네트워크에서 이클립스 공격(많은 수의 악성 노드로 노드를 둘러싸고 정상 네트워크와의 연결을 차단하는 공격)을 탐지하고, 코인 가격을 예측하고, 사기 거래 및 자금 세탁을 식별하는 데 활용됩니다.

이러한 유형의 분석은 공개적으로 이용 가능한 정보를 얻을 수 있는 시나리오에 의존하는 경우가 많고, 시뮬레이션 데이터에 기반하며 실제 공격 사례가 부족하다는 한계가 있습니다.

오늘날 가장 발전된 계약 취약점 탐지 방법은 더 이상 AI가 코드에서 직접 결론을 추측하는 방식에 의존하지 않습니다. 대신, AI는 먼저 의심스러운 지점을 식별한 다음 정적 분석과 기호 실행(코드를 실제로 실행하지 않고 코드 구조를 분석하여 취약점을 찾는 방식)을 사용하여 이를 검증합니다.

단순히 대규모 모델을 감사 도구로 사용하는 것은 착각으로 인해 수많은 오탐을 초래할 수 있습니다. GPT-4와 Claude는 공격받은 52개의 DeFi 계약 중 40%에서만 취약점 유형을 정확하게 식별했습니다.

2세대: 알고리즘 설계

지난 6년간 강화 학습은 P2P 네트워크 토폴로지, 합의 프로토콜 매개변수 및 역할 선택, 샤딩, DeFi 시장 조성 및 대출률, MEV 입찰 전략 등 다양한 분야의 분산형 알고리즘 설계에 활용되어 왔습니다.

이러한 방법들은 대부분 명확한 모델링이 가능한 환경에서 효과적이지만, 아직 대규모로 실제 네트워크에 배포되거나 공격에 대한 테스트를 거치지 않아 대부분 연구 단계에 머물러 있습니다.

3세대: 현실 세계와의 상호작용

AI 기반 오라클의 도움으로 스마트 계약은 인식(비정형 데이터 및 자연어 이해), 실행(오프체인 AI 모델 및 도구 호출), 의사 결정(목표 기능에 따라 에이전트 역할 수행)이라는 세 가지 향상된 기능을 얻게 됩니다.

실제 환경에서 AI를 오라클로 활용하는 테스트 결과는 일관성이 없습니다. 체인링크 랩(Chainlink Labs)의 실험에 따르면, GPT-4o는 1,660개의 예측 질문에 대해 89.3%의 정확도를 달성했고, UMA의 Truth Bot은 75%를 달성했습니다. 반면, 인간 오라클은 UMA의 낙관적 오라클(처음에는 답변이 참이라고 가정하고, 이의 제기 기간을 설정한 후, 아무도 이의를 제기하지 않으면 효력이 발생하는 방식)에서 98.2%의 정확도를 기록했습니다.

정확도는 질문 유형에 따라 크게 달라집니다. 스포츠 경기 결과와 같이 공식 데이터 출처를 사용하는 이산형 질문은 정확도가 99.7%에 달할 수 있지만, 시간 순서가 포함되거나 비디오 녹취 및 계산이 필요한 질문의 경우 오류율이 크게 증가합니다.

이 문제를 해결하는 방법은 세 가지가 있습니다. 첫째, 오류 허용성을 갖도록 설계하고 중요도가 낮은 시나리오에서만 사용하는 것입니다. 둘째, 48시간의 분쟁 해결 기간을 설정하는 등 인간의 개입을 도입하는 것이지만, 이는 의사 결정 과정을 지연시킬 수 있습니다. 셋째, 모델이 불확실한 답변을 포기하도록 하고, 이때에만 인간의 개입을 도입하는 것입니다.

보고서는 코인알고리즘(CoinAlg)과 같은 AI 모델을 사용하여 공동 거래를 위해 자금을 모으는 "투자형 DAO"를 언급하며, 대표적인 프로젝트로는 엘리자오스(ElizaOS)와 AI XBT가 있는데, 이들의 최고 시가총액은 각각 27억 달러와 47억 달러에 달했다고 설명합니다. 이러한 제품들은 "코인알고리즘 교착상태"라고 부를 수 있는 피할 수 없는 설계상의 딜레마에 직면해 있습니다.

거래 전략이 투명하게 공개되면 복제되거나 샌드위치 공격(피해자의 거래 전후에 주문을 넣어 가격 차이를 이용하는 공격)에 악용될 수 있습니다. 반대로 전략이 비밀로 유지되면 전략을 아는 내부자가 정보 격차를 이용해 미리 이익을 취할 수 있는데, 이는 내부자 거래와 마찬가지입니다. 두 경우 모두 일반 투자자에게 피해를 줍니다.

이를 완화하기 위한 초기 접근 방식 중 하나는 전략을 TEE로 감싸고 거래를 무작위화하여 내부자가 예측하기 어렵게 만드는 것입니다.

새로운 위험: AI 기반 악성 스마트 계약

스마트 계약은 사람 간의 신뢰를 대체하는 데 사용되므로, 신뢰할 만한 관계가 부족한 범죄자들이 이를 악용할 수 있습니다.

한 가지 메커니즘은 범죄에 대한 현상금 계약을 활용하는 것입니다. 범죄자는 사전에 "비밀 표시"에 대한 암호화된 약속을 하고, 이는 범죄 후에 공개됩니다. 그러면 AI 모델이 현상금을 뉴스 보도와 비교하여 범죄 완료 여부를 확인하고 자동으로 현상금을 지급합니다. 이 경우 AI는 이전에는 자동화하기 어려웠던 "판결" 역할을 수행하며, 표적 괴롭힘, 조직 정보 탈취, 내부 고발자 폭로와 같은 시나리오에 활용될 수 있습니다.

가능한 대응책으로는 온체인 분석 및 추적, 해당 사건에 연루된 펀드 블랙리스트 작성, AI 모델을 사용하는 오라클이 고위험 요청에 대한 서비스 제공을 거부하도록 요구하는 것 등이 있습니다.

AI와 암호화폐: 암호화폐를 활용하여 AI를 강화하다

암호화폐가 인공지능에 기여할 수 있는 잠재적 역할은 크게 두 가지로 나눌 수 있습니다. 첫째, 인공지능 생명주기의 각 단계를 탈중앙화하는 것이고, 둘째, 이러한 단계의 보안을 보호하는 것입니다.

분산형 인프라(DePIN)

분산형 물리적 인프라 네트워크는 노드가 토큰 인센티브를 통해 컴퓨팅 파워와 같은 리소스를 제공할 수 있도록 합니다. Theta, Akash 등은 AWS 대비 50%에서 85%까지 비용을 절감할 수 있다고 주장하며, 주요 병목 현상은 공용 네트워크를 통한 노드 간 통신으로 인한 처리량과 지연 시간입니다.

적응성은 작업 유형에 따라 다릅니다. 학습은 오프라인으로 진행되므로 지연 시간에 민감하지 않지만, 지역 간 동기 통신이 병목 현상을 일으킵니다. 현재 분산 하드웨어에서 수십억 개의 매개변수를 가진 모델을 학습하는 데 상당한 성과가 있습니다(Bittensor에서 7억 및 70억, Prime Intellect에서 100억 매개변수 Intellect-1, 그리고 가장 큰 규모는 Psyche 네트워크에서 학습 중인 400억 매개변수 모델).

추론은 지연 시간에 더 민감하지만, 학습보다 처리량 요구 사항이 낮고 역전파(학습 중에 오류를 계층별로 역전파하여 매개변수를 업데이트하는 핵심 단계로, 학습 중에만 필요함)가 필요하지 않습니다. 지연 시간에 둔감한 추론(회의록, 문서 검토)은 DePIN에 특히 적합합니다.

핵심적인 문제는 이러한 프로젝트 대부분이 전체적인 비용을 공개하지 않는다는 점입니다. 시간당 GPU 사용료를 광고하지만, 머신러닝 작업 비용을 결정하는 실제 요소는 학습 효율성(단위 비용당 반복 횟수)과 추론 효율성(단위 비용당 토큰 수)입니다.

탈중앙화 데이터 및 모델 마켓플레이스

AI 데이터는 일반 상품과 구별되는 여러 가지 특징을 가지고 있습니다. 디지털 상품으로서 초기 생성 비용은 높지만 복제는 거의 무료이며, 대부분 비경쟁적(하나의 데이터 세트를 여러 당사자가 동시에 사용해도 손실 없음)입니다. 또한 품질을 사전에 판단하기 어렵다는 점, 즉 '레몬 시장' 문제(구매자가 품질을 미리 판단할 수 없어 고품질 제품이 저품질 제품에 밀려나는 현상)가 존재하며, 판매자는 샘플을 제공해야 하지만 샘플 자체에도 가치가 있습니다. 게다가 재판매가 가능하고, 두 데이터 세트가 실질적으로 동일한지 여부를 판단하기 어렵다는 단점도 있습니다.

중앙 집중식 시장을 둘러싼 논란은 가격 투명성 부족과 사용자 선택의 제한에 있지만, 중앙 집중식 가격 책정은 더 많은 정보에 접근할 수 있기 때문에 때로는 더 효율적일 수 있습니다.

데이터 시장은 아직 독점적인 거대 기업이 등장하지 않아 탈중앙화된 혁신을 위한 기회가 열려 있습니다. 활용 가능한 암호화폐 도구로는 소액 결제, TEE(특정 작업에만 데이터 사용을 제한하는 기술), 영지식 증명(데이터 자체는 공개하지 않고 구매자에게 데이터의 특성을 알려주는 기술) 등이 있습니다.

현재 대부분의 플랫폼은 결제 수단으로 암호화폐만 사용하며, 가격 책정 방식은 프로토콜 제공자가 결정하거나 판매자에게 전적으로 맡겨져 있는데, 이는 중앙 집중식 시장에서도 이미 존재하는 방식입니다. 탈중앙화가 정확히 무엇을 개선하는지는 아직 충분히 이해되지 않고 있습니다.

x402를 사용한 에이전트 결제 추적

에이전트 생태계 자체는 이미 탈중앙화되어 있습니다. 서로 다른 주체들이 서로 다른 목표를 위해 개발 및 최적화를 진행하며, 자연스러운 중앙 통제 지점이 존재하지 않습니다. 암호경제학(암호화 기법을 사용하여 경제적 보상과 처벌을 부여함으로써 참여자의 행동을 제약하는 방식)은 에이전트 거버넌스에 적용될 수 있습니다.

소액 결제는 에이전트 경제의 핵심입니다. 인터넷 역사 전반에 걸쳐 소액 결제가 반복적으로 실패한 이유는 결제 인프라 자체의 문제라기보다는 소액 결제 건마다 사람이 개입하여 의사결정을 내리는 데 드는 비용 때문이었습니다. 에이전트는 사람보다 훨씬 빠르게 소액 결제를 평가할 수 있으며, 사용자는 전략만 설정하면 되므로 소액 결제가 처음으로 성공할 가능성이 있습니다.

클라우드플레어는 "크롤러당 비용 지불" 서비스를 출시했으며, x402(애플리케이션이 HTTP를 통해 직접 소액의 온체인 결제를 할 수 있도록 하는 개방형 프로토콜)와 같은 프로토콜을 개발 중입니다.

이 시스템의 기반 자산은 주로 스테이블코인(USDC, USDT, DAI)입니다. 스테이블코인은 에이전트에게 안정적인 회계 단위(모든 상품 가격 책정의 표준)를 제공할 수 있는 반면, 이더리움(ETH)이나 솔(SOL)과 같은 네이티브 토큰은 변동성이 너무 크기 때문입니다.

에이전트 간의 신뢰는 에이전트의 온체인 신원 및 평판을 기록하는 온체인 레지스트리 항목(예: 이더리움에서 에이전트의 신원 및 평판을 확립하기 위한 제안 표준인 ERC-8004)에 의존합니다. 그러나 이는 본질적으로 자기 선언이며, 평판 반영에 시간이 걸리기 때문에 기존 플레이어에게 유리합니다.

또 다른 접근 방식은 검증 가능한 에이전트 감사입니다. TEE 내에서 실행되는 LLM이 독점 에이전트 코드를 검토하고 평판 점수를 생성하며, 감사 결과는 코드 해시에 연결되어 코드의 개인 정보를 보호하는 동시에 검증자에게 신뢰성을 보장합니다.

종료 불가능한 자율 에이전트(UAA)는 또 다른 위험을 초래합니다. 최첨단 에이전트가 자율적으로 작업을 완료하는 데 걸리는 시간은 2019년 이후 약 7개월마다 두 배씩 증가했습니다. 기존 연구에 따르면 모델은 자체 복제 임계값을 돌파하여 로컬에 독립적인 복사본을 생성할 수 있지만, 외부 인프라로의 복제는 여전히 인증 문제에 부딪혀 어려움을 겪고 있습니다.

앤트로픽의 미소스 모델은 벤더에게 알려지지 않았고 아직 패치되지 않은 제로데이 취약점을 자율적으로 발견하고 악용할 수 있는 능력을 입증했습니다. 지갑을 보유하고 있으며 차단할 수 없는 에이전트는 "운영자"를 중심으로 하는 기존 규제 체계의 사각지대에 놓이게 됩니다.

분산형 거버넌스

블록체인 커뮤니티는 시스템 제어권 배분에 있어 오랜 역사를 가지고 있습니다. 이러한 접근 방식은 본질적으로 탈중앙화되어 있으며 다양한 이해관계자를 포괄하고자 하지만, 보안 취약성, 투표 무관심, 뇌물 수수와 같은 단점도 존재합니다.

인공지능의 적응성은 커뮤니티 거버넌스의 다양한 단계에 따라 다릅니다. 사전 학습 데이터의 양이 너무 많아 효과적인 의견을 수집하기 어렵고, 그 가치는 세부 조정 단계에서 더욱 잘 드러납니다. 기본 아키텍처 선택은 기술적 결정이므로 커뮤니티 거버넌스에는 적합하지 않습니다. 평가 및 조정 단계는 기술적 판단과 규범적 판단을 결합해야 하므로 커뮤니티의 의견이 중요합니다.

헌법적 AI는 인간이 작성한 "헌법"을 사용하여 모델이 따라야 할 원칙을 정립합니다. 앤스로픽의 집단 헌법적 AI는 공개 투표를 통해 생성된 원칙을 통합하며, 오픈소스 원칙을 사용하여 훈련된 모델은 사회적 편향이 더 낮은 것으로 나타났습니다. 그러나 AI 기업들이 모델에 대한 통제권을 포기할 유인이 부족하기 때문에 이러한 민주적 거버넌스 실험은 아직 널리 채택되지 않았습니다.

DAO의 토큰 가중 투표 방식은 "금권 정치"로 널리 인식되고 있으며, 이로 인해 고래 투자자를 억제하기 위해 투표 비용을 증가시키는 2차 투표, 투표 보유 시간에 따라 가중치를 부여하는 신념 투표, 위임 투표와 같은 메커니즘이 개발되었지만 그 효과는 여전히 불분명합니다.

AI 시스템의 실행 무결성 보호

스마트 계약이 자체 역량을 넘어서는 머신러닝 연산을 활용해야 할 경우, "중재자" 역할을 수행할 수 있습니다. 모든 참여자는 먼저 사용할 모델과 데이터에 대한 약속을 하고 담보를 제공합니다. 연산이 오프체인에서 완료되면 결과가 검증을 위해 계약에 제출되고, 오류가 발생한 쪽은 불이익을 받습니다. 검증 경로는 네 가지가 있으며, 각 경로마다 장단점이 있습니다.

첫째, TEE는 신뢰할 수 있는 하드웨어 서명을 사용하여 계산 무결성을 입증하므로 가장 효율적이지만, 운영자에 대한 신뢰가 필요합니다.

둘째, 결과를 최종적인 것으로 간주하지 않고 이의 제기 여지를 남겨두는 낙관적인 방식으로 실행합니다. 이의 제기가 발생하면 이진 탐색(오류 범위를 반복적으로 절반으로 나누고 오류 단계를 신속하게 찾는 방식)을 사용하여 단일 오류 명령어를 찾아낸 다음 해당 명령어에 페널티를 부여합니다.

머신러닝에서 부동소수점 연산의 비결정성은 어려운 과제이며, 이는 연산 순서 제어 또는 허용 오차 의미론(두 계산 결과가 정확히 같을 필요는 없으며, 오차 범위 내에서 일관성이 있는 것으로 간주할 수 있도록 함)을 필요로 합니다. 대표적인 해결책으로는 Verde, TAO, Arbigraph, OPML 등이 있습니다.

셋째, 영지식 증명(zkML, 인공지능 추론의 정확성을 증명하기 위해 영지식 증명을 사용)은 모델 매개변수는 물론 입력과 출력까지 숨긴 상태에서도 추론의 정확성을 증명할 수 있습니다. CNN과 Transformer를 위한 전용 솔루션과 범용 컴파일러(EZKL, ZKML, DeepProve 등)가 이미 존재합니다.

이 알고리즘의 개인정보 보호 목표는 입력값 숨기기, 가중치 숨기기, 모델 구조 숨기기라는 세 가지 계층으로 구성됩니다. 그러나 개인정보 보호 수준이 높을수록 회로 제약 조건이 복잡해지고 최적화 공간이 줄어들어 개인정보 보호와 효율성 사이에 근본적인 상충 관계가 발생합니다. 주요 비용은 비선형 계층과 수치 표현에서 발생하며, 이로 인해 여전히 긴 컨텍스트, 대규모 모델 및 고처리량 서비스를 지원하기 어렵습니다.

넷째, 통계적 추론에 따르면 서로 다른 기능을 가진 두 모델은 필연적으로 내부적으로 계산되는 특징들이 다를 수밖에 없다는 원칙이 성립합니다. 따라서 이러한 특징들을 샘플링을 통해 비교함으로써, 추론이 실제로 지정된 모델에 의해 수행되었는지 여부를 확률적으로 판단할 수 있습니다.

이 알고리즘은 밀리초 수준의 오버헤드와 즉각적인 종료를 보여주므로 고빈도, 저지연 시나리오에 적합합니다. 서비스 제공업체가 모델을 교체하는 행위(예: 더 저렴한 정제 버전으로 전환하거나 정렬된 버전을 교체하는 행위)와 같은 실제 악의적인 행위를 방지할 수 있지만, 전체 계산 기록을 허구로 조작하는 악의적인 행위자를 완전히 막을 수는 없습니다. 후자는 여전히 해결되지 않은 문제입니다.

모델 학습 증명(zkPoT, 영지식 증명을 사용하여 학습 과정의 정확성을 증명)은 추론 증명보다 훨씬 어렵습니다. 학습 과정은 길고, 중간 상태가 지속적으로 누적되며, 무작위성이 강하기 때문에 학습 증명의 복잡성은 추론 증명보다 몇 배나 높습니다. 관련 연구(Garg et al., Kaizen)는 꾸준히 발전해 왔으며, 학습 데이터 소스 및 공정성 제약 조건에 대한 감사 가능한 증명(ZkAudit, Confidential-PROFITT)으로 확장되었습니다.

훈련 파이프라인을 보호하세요

단일 기관이 신뢰하는 데이터를 사용하여 모델을 학습시킬 경우, 일반적으로 개인정보 보호나 데이터 무결성에 대한 즉각적인 우려는 발생하지 않습니다. 그러나 여러 기관이 다양한 데이터 소스를 사용하여 공동으로 학습을 진행할 때는 복잡한 보안 문제가 발생합니다.

일반적인 시나리오는 여러 병원이 공동으로 진단 모델을 학습시키는 경우입니다. 모든 참여 기관의 전자 의료 기록(EHR)을 통합하면 더 넓은 환자 집단을 포괄하고 진단 정확도를 향상시킬 수 있지만, HIPAA와 같은 규정으로 인해 참여 기관들은 원시 데이터를 서로 또는 제3자에게 직접 제공하는 것을 꺼리고 불편해합니다.

금융기관들이 공동으로 사기 방지 모델을 훈련하거나 기업들이 공동으로 침입 탐지 모델을 훈련하는 것도 같은 범주에 속합니다.

연합 학습은 이러한 목적을 위해 설계된 솔루션입니다. 학습 환경은 먼저 전역 모델을 초기화하고 이를 각 참여자에게 배포합니다. 각 참여자는 자체 데이터를 사용하여 로컬에서 학습하고 모델 업데이트만 전송합니다. 그러면 학습 환경은 이러한 업데이트를 통합하여 새로운 전역 모델을 생성하며, 이 과정 전반에 걸쳐 모든 데이터는 로컬에 저장됩니다.

하지만 연합 학습은 실제 적용 사례가 제한적입니다(가장 잘 알려진 응용 분야는 휴대폰 입력 방식 예측입니다). 데이터와 연산의 무결성을 보장하지 못하며, 모든 참여자가 정직하더라도 통신 오버헤드가 높고, 네트워크 및 조정 지연으로 인해 전체 속도가 저하되며, 모델 정확도가 중앙 집중식 학습보다 낮고, 악의적인 공격자가 모델을 변조하거나 백도어를 심을 수 있습니다.

더 간단한 대안은 중앙 집중식 학습을 위해 TEE(Trusted Entity Environment)를 사용하는 것입니다. 학습 환경은 신뢰할 수 있고 기밀성이 보장되는 컴퓨팅 환경에서 실행되며, 암호화된 채널을 통해 모든 참여자로부터 원시 데이터를 수신하고, 모델을 중앙에서 학습시키고, 학습된 모델만 출력합니다. 데이터는 서로에게 보이지 않으며, 모델 추적성 인증서(누가 데이터를 제공했고 모델이 어떻게 학습되었는지)를 함께 제공할 수도 있습니다.

단점은 TEE의 고유한 사이드 채널 위험과 높은 I/O 오버헤드입니다. 실제로 대부분의 조직은 현재 격리, 접근 제어, 암호화 및 데이터 사용 프로토콜에 의존하여 규정을 준수하는 클라우드에 데이터를 통합하고 있지만, 이는 클라우드 서비스 제공업체에 대한 신뢰를 필요로 합니다.

사설 네트워크 데이터는 또 다른 접근 방식입니다. 공용 네트워크 텍스트 데이터는 한계에 다다르고 있으며(일부에서는 2025년에서 2030년 사이에 고갈될 것으로 예측함), 합성 데이터는 "모델 붕괴"의 위험이 있고 기존 도메인을 넘어 데이터 범위를 확장할 수 없습니다.

웹 크롤러가 접근할 수 없는 이메일, 건강 정보, 금융 정보 등의 데이터를 포함하는 "프라이빗 도메인 네트워크"는 공용 네트워크보다 두 자릿수 이상 큰 규모로 추산됩니다. 이는 풍부하고 아직 활용되지 않은 자원이지만, 현재는 매우 고립된 상태입니다.

오라클은 이러한 가능성을 열어줄 수 있습니다. 예를 들어, 환자가 업로드한 의료 기록을 의료 모델 학습에 활용하는 경우, 사용자는 오라클을 통해 병원 포털에서 학습 제공업체로 의료 기록을 전송하고 해당 데이터가 실제로 포털에서 제공된 것임을 입증할 수 있습니다. 연결이 사용자에 의해 시작되므로 전체 프로세스는 병원 인프라를 변경할 필요가 없습니다.

개인정보를 동시에 보호하기 위해서는 암호화된 채널을 통해 데이터를 전송하는 프라이버시 오라클과 TEE(Trusted Equipment for Training)가 필요합니다. TEE는 또한 사용자가 데이터를 전송하기 전에 검증할 수 있도록, "모델만 출력하는" 개인정보 보호 학습 소프트웨어가 실행 중임을 증명하는 자료를 제공할 수 있습니다.

이 외에도 차분 프라이버시(모델 출력값이 훈련 데이터에 최소한으로 의존하도록 함), 사용 후 데이터 삭제, 화이트리스트에 등록된 병원에서만 완성된 모델을 사용할 수 있도록 하는 등의 보다 구체적인 약속을 추가할 수 있습니다.

안전한 추론 파이프라인 및 보호된 파이프라인(Props)

오라클과 신뢰 컴퓨팅의 동일한 조합을 사용하여 개인 데이터에 대한 안전한 추론을 수행할 수도 있습니다.

은행 대출 승인을 예로 들면, 모델은 신청자의 재정 서류를 분석하여 승인 또는 거절 여부를 결정합니다. 현재 방식은 대출자가 직접 서류 사진을 다운로드하거나 업로드하는 방식인데, 이는 두 가지 문제를 야기합니다. 첫째, 대출 기관은 서류의 진위와 신뢰성을 확인할 수 없습니다. 둘째, 대출자의 서류가 대출 기관의 모델 시스템에서 유출될 위험이 있어 양측 모두에게 위협이 됩니다.

출처의 진위성을 보장하기 위해 프라이버시 오라클을 사용하고 개인정보 보호를 위해 기밀 컴퓨팅을 활용함으로써 안전한 추론 파이프라인을 구축할 수 있습니다. 이를 통해 대출 기관은 모델의 결론만 확인할 수 있으며, 입력값이 신뢰할 수 있다는 확신을 가질 수 있습니다.

개인 도메인 소스는 신원 및 자격 증명 시스템으로도 활용될 수 있습니다.

대출자는 본인의 신원이 명시된 은행 거래 내역서와 W-2 양식을 제출할 수 있으며, 이는 강력한 신원 증명 자료가 되어 기존 온라인 서비스를 임시 신원 확인 시스템으로 전환하여 신원 도용 및 복지 사기를 방지할 수 있습니다. 또한, 이 모델은 이를 기반으로 증명서를 발급할 수 있는데, 예를 들어 소규모 및 영세 기업의 세금 및 운영 자료를 검증하고 그 근거를 증명하는 서류와 함께 "특정 자격 요건 충족" 증명서를 발급할 수 있습니다.

전체 프로세스는 분산 방식으로 완료될 수 있습니다. 이론적으로 누구나 데이터 소스나 기존 기관의 도움 없이 신뢰할 수 있는 추론 파이프라인을 구축할 수 있습니다.

적대적 입력은 여전히 해결해야 할 과제입니다. 공격자는 겉으로는 정상처럼 보이지만 정교하게 조작된 은행 거래 명세서를 제출하여 모델이 부풀려진 잔액을 인식하고 대출을 잘못 승인하도록 속일 수 있습니다. 학계에서 적대적 예제에 대한 연구는 "크랙과 패치"의 악순환을 거듭해 왔으며, 아직까지 보편적인 해결책은 발견되지 않았습니다.

보안 추론 파이프라인은 인증된 네트워크의 소스에서만 입력을 제한하는 새로운 접근 방식을 제공함으로써 공격자가 적대적 입력을 구성할 여지를 줄이고 모델 계층 방어를 보완합니다.

모델 자체의 개인정보 보호 또한 중요합니다. 공격자는 정교하게 조작된 쿼리를 사용하여 모델 데이터를 탈취(특징 추출 또는 전체 모델 탈취), 멤버 추론(학습 데이터 세트에 특정인의 데이터가 포함되어 있는지 여부 확인), 심지어 원래 학습 데이터 재구성까지 시도할 수 있습니다. 또한 이를 통해 시스템 구성 및 전처리 설정에 대한 정보를 빼낼 수도 있습니다.

연구원들은 대규모 모델의 한 레이어 가중치를 훔치는 데 약 8,000달러가 소요될 수 있다고 추정했습니다. 개방형 시스템에서 흔히 사용되는 속도 제한은 익명의 사용자 한 명이 다수의 사용자를 사칭하여 시빌 공격을 감행할 수 있기 때문에 취약합니다.

안전한 추론 파이프라인은 양쪽 측면에서 문제를 완화할 수 있습니다. 오라클을 사용하여 입력 유형을 제한함으로써, 다양한 쿼리가 대량으로 필요한 추출 공격을 억제할 수 있습니다. 또한 파이프라인 내에서 생성된 강력한 인증을 사용함으로써, 각 사용자에게 쿼리 제한을 적용하고 사용자의 신원을 플랫폼에 노출하지 않고 쿼리를 실행하여 시빌 공격을 방지할 수 있습니다.

에이전트 메모리는 새롭게 떠오르는 공격 표면입니다. 공격자는 툴 호출이나 외부 자료(메모리 주입)를 통해 에이전트에 제공되는 컨텍스트를 오염시켜 에이전트가 비정상적으로 동작하도록 유도할 수 있습니다. 예를 들어, 대량의 암호화 자산을 관리하는 ElizaOS 프레임워크에서 오염된 컨텍스트는 에이전트가 승인되지 않은 거래를 시작하도록 만들 수 있습니다.

TEE는 에이전트가 TEE 내에서 실행되도록 허용하거나 인증된 컨텍스트만 가져오도록 함으로써 이러한 문제를 부분적으로 완화할 수 있습니다.

하지만 TEE를 사용하더라도 여전히 두 가지 어려움이 있습니다.

첫째, 신뢰할 수 있는 출처라 할지라도 오염된 콘텐츠를 포함할 수 있습니다. 예를 들어, 소셜 미디어 플랫폼의 콘텐츠는 사용자들이 직접 생성하는 것이므로 게시자가 자신의 게시물을 악용할 가능성이 매우 높습니다.

둘째, TEE 운영자는 롤백 또는 포크 공격을 통해 TEE 상태를 이전 체크포인트로 되돌리고 이후의 메모리 업데이트를 삭제할 수 있습니다.

전자는 암호화 기술로는 해결할 수 없는 콘텐츠 탐지 문제이고, 후자는 합의 메커니즘을 사용하여 해결할 수 있습니다. ROTE 및 Narrator와 같은 시스템은 분산 프로토콜이나 공개 블록체인을 활용하여 TEE 상태의 일관성과 최신성을 보장합니다.

이 섹션의 아키텍처를 요약하자면, 기존 인프라를 변경하지 않고 개인 도메인 데이터를 안전하게 사용하는 것을 목표로 하는 "보호된 파이프라인"(Props)의 일반적인 프레임워크입니다.

이 기술은 오라클과 신뢰 컴퓨팅을 세 부분으로 결합합니다. 오라클은 인증된 개인 도메인 소스에서 데이터를 검색하고 해당 소스를 증명합니다. TEE는 암호화 경계 내에서 학습 또는 추론을 완료합니다. 마지막으로 TEE는 파이프라인 속성(데이터 소스, 소프트웨어 또는 모델 코드 해시 등)을 설명하는 증명과 함께 모델 또는 결론을 출력합니다.

Props는 세 가지 속성을 보장합니다. 첫째, 종단 간 입력 무결성(출력은 신뢰할 수 있는 비공개 소스의 인증된 데이터에만 의존함), 둘째, 기본 기밀성(입력 및 중간 상태는 보호된 경계를 벗어나지 않으며 출력만 노출됨), 셋째, 공개 없이 입증 가능성(증명은 데이터 제공자와 결과 사용자 모두 무결성과 기밀성이 달성되었음을 확신할 수 있도록 보장함)입니다.

또한 데이터와 계산을 비밀로 유지할 필요 없이 인증만 받으면 되고, 출처는 공개 또는 비공개일 수 있는 "투명 버전"도 있습니다.

암호화폐와 AI에 대한 다섯 가지 오해

크립토엑스 AI 플랫폼과 그 응용 프로그램을 둘러싸고 업계에서 흔히 발생하는 몇 가지 오해와 잘못된 정보가 퍼져 있습니다. 다음 다섯 가지 내용은 완전히 틀린 것은 아니지만, 어떤 부분이 현재 사실이고 어떤 부분이 추가적인 증거가 필요한지 명확히 구분하는 것이 중요합니다.

오해 1: 블록체인은 AI가 생성한 콘텐츠와 사람이 생성한 콘텐츠를 구분할 수 있다.

콘텐츠가 인공지능(AI)에 의해 생성되었는지 아니면 사람이 생성했는지 나중에 판별할 수 있도록 블록체인에 콘텐츠를 등록하는 아이디어는 흔히 언급되는 접근 방식이며, Everlyn AI와 같은 일부 프로젝트는 이미 AI가 생성한 콘텐츠를 블록체인에 올리고 있습니다. 그러나 블록체인이 이러한 기능을 보편적으로 제공할 수는 없으며, "콘텐츠 탐지"와 "콘텐츠 추적성" 문제는 별도로 고려해야 합니다.

콘텐츠 탐지는 콘텐츠가 사람이 생성한 것인지 인공지능(AI)이 생성한 것인지를 판별하는 기술입니다. 현재 주류 접근 방식은 사후 탐지이며, 이는 사전에 삽입된 메타데이터나 신호에 의존하지 않습니다. 사후 탐지는 크게 두 가지 범주로 나뉩니다. 하나는 딥러닝을 사용하여 생성 모델 고유의 통계적 특징을 식별하는 AI 분류기이고, 다른 하나는 픽셀 수준의 노이즈 분포와 구조적 이상(예: AI가 생성한 얼굴의 생리적 불일치)을 분석하는 통계적 포렌식입니다.

문제는 블록체인 자체가 이러한 오프체인 정보를 인식할 수 없다는 점입니다. 분류 결과는 외부 분류기가 제공해야 합니다. 블록체인에 데이터를 업로드하는 것은 단지 이 결과를 고정시켜 제출 후 기록이 변조되지 않도록 보장할 뿐, 기록 시점에 해당 기록이 사실임을 보장하지는 않습니다. 외부 검사기가 오류를 범하면 블록체인은 그 오류를 영구적으로 저장합니다. 다시 말해, 블록체인은 "주장의 무결성"을 제공할 뿐, "주장의 진위 여부 검증"을 제공하는 것은 아닙니다.

콘텐츠 프로파일링은 디지털 자산의 생성 시점부터의 이력을 기록합니다. C2PA와 같은 업계 표준을 통해 제작자 또는 기기는 암호화 방식으로 서명된 메타데이터(콘텐츠 자격 증명)를 미디어에 첨부하여 출처, 작성자 및 후속 편집 내역을 기록할 수 있습니다. Numbers Protocol, Starling Lab 등은 블록체인을 사용하여 이러한 자격 증명의 공개적이고 변경 불가능한 레지스트리를 구축합니다.

블록체인에 기반한 강력한 추적 시스템을 갖추더라도 콘텐츠가 원래 사람이 생성한 것인지 인공지능이 생성한 것인지를 보장하는 것은 불가능합니다.

사용자는 AI가 생성한 이미지를 고화질 화면에 표시한 다음 C2PA 규정을 준수하는 카메라로 사진을 찍어 유효한 서명과 "실제 촬영"이라는 라벨이 붙은 문서를 얻을 수 있습니다. 마찬가지로 AI가 생성한 텍스트도 규정을 준수하는 편집기에 수동으로 다시 입력하여 "사람이 생성한 것"을 나타내는 합법적인 추적 정보를 포함할 수 있습니다.

더욱이, 콘텐츠가 온체인 기록과 일치하지 않을 정도로 변경되면 추적성이 무너지게 되며, 모든 콘텐츠를 포괄하는 통합 레지스트리가 가까운 미래에 등장하기는 거의 불가능하므로 추적 시스템에는 필연적으로 많은 허점이 생길 것입니다.

핵심 요점: 좁은 의미에서 블록체인은 추적성 메타데이터에 대한 강력한 무결성 보장을 제공할 수 있지만, AI 생성 콘텐츠 탐지 문제에 대한 완벽한 해결책과는 거리가 멀다.

진정으로 효과적인 해결책을 위해서는 모든 콘텐츠가 신뢰할 수 있는 기기에 의해 캡처되어 블록체인에 즉시 업로드될 수 있는 보편적인 생태계가 필요합니다. 그러나 현실적으로 대다수의 콘텐츠는 암호화 앵커링을 지원하지 않는 도구를 통해 생성되고 공유되므로, 라벨이 없는 콘텐츠는 모호한 영역에 머물러 있습니다.

오해 2: 블록체인 또는 탈중앙화는 AI의 편향성과 공정성 문제를 해결할 수 있다.

"모델 추론 및 학습을 블록체인에 옮김으로써 AI의 불공정성과 편향성을 해결할 수 있다"는 광범위한 주장을 평가하기 위해서는 먼저 다양한 유형의 편향성을 구분해야 합니다.

알고리즘 편향은 AI 커뮤니티에서 공정성 문제를 설명하는 가장 일반적인 개념입니다. 모델은 데이터 세트의 불균형을 학습하고 심지어 증폭시킬 수 있으며, 이로 인해 판단 모델은 불리한 집단에 대해 저조한 성능을 보이고, 생성 모델은 훈련 데이터에서 바람직하지 않은 경향(예: 유해한 언어 및 뿌리 깊은 고정관념)을 지속적으로 반영할 수 있습니다.

학계에서는 훈련과 추론을 위한 여러 기술적 해결책(안전장치)을 제시했지만, 이러한 보호 장치들은 완벽과는 거리가 멀다. 공정성 문제는 아직 완전히 해결되지 않았으며, 어쩌면 영원히 해결되지 않을 수도 있다. 심지어 "공정성을 어떻게 정의할 것인가"라는 질문 자체도 많은 절충을 요구한다.

탈중앙화는 알고리즘 편향 문제를 해결할 수 없습니다. 알고리즘 편향은 학습 과정 자체에서 비롯되기 때문입니다. 일반적으로 학습 또는 추론 기법을 개선함으로써 편향을 완화할 수 있지만, 탈중앙화는 근본적인 원인을 해결하지 못합니다.

하지만 편향의 두 번째 원인이 있습니다. 바로 모델 성능에 영향을 미치는 고차원적인 결정, 즉 어떤 데이터를 사용할지, 어떤 아키텍처를 사용할지, 그리고 기여자에게 어떻게 보상할지에 대한 결정입니다. 이 부분은 AI 커뮤니티에서 일반적으로 이해되는 공정성과는 별개이지만, 알고리즘 편향에 영향을 미칠 수 있으며, 분산화의 두 가지 특징을 활용함으로써 부분적으로 완화될 수 있습니다.

첫 번째 특징은 투명성입니다. 개발자는 블록체인을 사용하여 학습 데이터, 학습 알고리즘, 모델 체크포인트 및 추론 안전장치를 공개적으로 커밋할 수 있으므로 운영자는 특정 학습 또는 추론 세션의 결과를 확실하게 추적할 수 있습니다.

하지만 이는 대규모 모델이나 체크포인트와 같은 학습 결과물에는 적용하기 어렵습니다(저장 및 컴퓨팅 비용이 너무 높기 때문입니다). 기존 시스템에서는 이러한 데이터의 대부분이 이미 오프체인에 존재하며 사용자가 직접 접근할 수 없습니다. 단기적으로는 투명성의 이점이 추론 과정에만 국한될 수 있습니다.

더욱 중요한 것은, 업계가 이러한 투명성이 어떤 활용 사례에 적합하고 어떤 인터페이스를 갖춰야 하는지(예를 들어 사용자가 데이터 오용을 신고할 수 있도록 하는 기능, 이를 위해서는 진정한 데이터 소유권 확립과 기계적 망각과 같은 지원 기술이 필요함)를 파악하지 못한다면, 투명성 자체만으로는 사람들이 AI를 개발하고 사용하는 방식을 바꾸지 못할 수도 있다는 점입니다.

두 번째 특징은 분산형 거버넌스인데, 이는 두 가지 범주로 구분할 수 있습니다. 첫 번째는 블록체인에서 연구되고 채택된 커뮤니티 거버넌스 메커니즘(토큰 가중 투표, 유동적 민주주의, 후자는 신뢰할 수 있는 개인에게 투표권을 위임하는 기능)이고, 두 번째는 스마트 계약에 의해 거버넌스 결정이 실행되는 DAO로 대표되는 분산형 자율 거버넌스입니다.

두 범주 모두의 핵심은 커뮤니티 거버넌스와 같은 메커니즘이 작동하는 데 블록체인이 필수적인 것은 아니라는 점이며, 따라서 이를 "블록체인으로 해결되는 AI 문제"라고 부르는 것은 정확하지 않습니다. 기술적 및 성능에 민감한 AI 결정은 광범위한 투표에 적합하지 않지만, 가치 기반 결정(예: 모델 정렬)은 더 적합합니다. 주류 AI 개발자들은 이러한 접근 방식을 탐구해 왔지만, 아직 실제로 구현된 적은 없습니다.

스마트 계약(직접 실행 또는 스테이킹 페널티)을 통한 온체인 거버넌스는 안정성을 강화할 수 있지만, 온체인 투명성과 마찬가지로 기술적 장벽에 직면해 있습니다. 현재 인프라는 AI에 필요한 저장 공간과 컴퓨팅 성능을 지원할 수 없으며, 이를 구현하려면 검증 가능한 학습 방식에 상당한 진전이 필요합니다. 이는 자명한 장기적인 비전이지만, 아직은 시기상조입니다.

핵심 요점: 블록체인 자체는 알고리즘 편향을 줄일 수는 없지만, AI 수명주기의 모든 단계에서 투명성을 증진하고 AI 거버넌스에 대한 참여를 확대할 수 있습니다.

잘못된 통념 3: AI 에이전트에게 지갑을 주면 "자율적"이 된다.

'에이전트 지갑'과 결제 프로토콜을 개발하는 프로젝트들은 인공지능 에이전트에게 지갑을 제공하여 스스로 돈을 벌고 쓰고 '생존'할 수 있도록 하면 자율성을 갖게 된다고 주장하는 경우가 많습니다. 하지만 이러한 주장은 여러 가지 개념을 혼동하고 있습니다.

이러한 모호함은 우선 두 분야에서 "자율성"이라는 용어가 갖는 의미가 다르다는 점에서 비롯됩니다. 인공지능(AI)의 맥락에서 자율 에이전트란 미리 설정된 규칙을 엄격하게 따르는 것이 아니라 자신의 인식, 학습, 경험에 기반하여 행동할 수 있는 에이전트를 의미합니다. 스마트 계약 또한 자율적이라고 흔히 언급되지만, 여기서 강조하는 것은 변조, 검열, 중단에 대한 복원력입니다.

전자는 "지능형 자율성"이라고 하고, 후자는 "실행형 자율성"이라고 합니다. 최신 AI 에이전트는 상당한 지능형 자율성을 갖고 있지만, 실행형 자율성은 없을 수 있습니다. 관리자는 여전히 에이전트가 실행되는 서버를 종료할 수 있습니다.

에이전트 지갑이 제공하는 자율성은 앞서 언급한 두 가지 유형 중 어느 것에도 해당하지 않습니다. 지갑을 소유한다고 해서 AI가 더 똑똑해지거나 인간의 조작이나 차단에 더 강해지는 것은 아닙니다. 에이전트 지갑이 제공하는 것은 자동화입니다. 에이전트는 수동 승인 절차를 거치지 않고도 프로그램 방식으로 거래하고, 자금을 이체하고, 온체인 기능을 이용할 수 있습니다.

이러한 자동화는 블록체인에만 국한된 것이 아닙니다. 중앙 집중식 금융 인프라 또한 에이전트에 의해 프로그래밍 방식으로 호출될 수 있습니다. 보다 타당한 해석은 블록체인 결제 시스템 자체가 중앙 집중식 솔루션보다 더 큰 자율성을 제공한다는 것입니다(비록 에이전트를 위해 특별히 설계된 것은 아니지만). 예를 들어 에이전트 거래가 차별받지 않도록 보장하는 것, 즉 중립성과 검열 저항성을 제공하는 것입니다.

핵심 요약: 에이전트 지갑은 AI 에이전트가 금융 인터페이스에 쉽게 접근하고, 경제적 상호작용을 자동화하며, 수동 승인 절차를 없앨 수 있도록 하지만, 자동화가 곧 자율성을 의미하는 것은 아닙니다. 지갑만으로는 에이전트를 인간의 통제에서 완전히 해방시킬 수 없으며(운영자는 여전히 에이전트가 의존하는 모델이나 시설을 중단시킬 수 있음), 자동화된 결제는 블록체인 기술을 필요로 하지 않습니다. 중앙 집중식 시스템으로도 동일한 결과를 얻을 수 있습니다.

블록체인 결제의 진정한 강점은 중립성과 검열 저항성에 있으며, 이는 결제 차단이나 방해에 대한 우려가 있는 시나리오에 적합합니다.

잘못된 통념 4: 투명한 AI는 곧 신뢰할 수 있는 AI다

모델의 데이터 소스와 추론 기록을 블록체인에 저장하는 것은 AI의 신뢰성을 보장하는 이상적인 도구처럼 보입니다. 이러한 주장은 널리 인용되는 IBM 블로그 게시물에서 시작되었으며 AI 에이전트에도 적용되었습니다. 그러나 이 주장은 두 가지 계층으로 나누어 살펴볼 필요가 있습니다.

모델 계층 투명성과 관련하여, 학습 데이터 출처를 기록하는 것은 모델 생성에 대한 투명성을 제공하는 것처럼 보이지만, "데이터 출처 기록"과 "모델 동작 보장" 사이에는 큰 격차가 존재합니다.

첫째, 온체인 기록은 단순한 기록일 뿐이며 출처 증명이 아닙니다(학습 데이터 세트의 구성 증명에는 특수 기술이 필요합니다).

둘째로, 훈련 데이터에 완전히 접근할 수 있다고 하더라도 모델의 성능을 예측하기에는 충분하지 않습니다. 훈련 과정과 컴퓨팅 환경 또한 모델의 동작에 영향을 미치기 때문입니다.

셋째, 데이터에서 모델에 이르는 전체 과정을 완전히 숙달하고 모델을 재현할 수 있다고 하더라도, 무작위 학습의 본질적인 비결정성 때문에 이론적으로 "학습 과정을 사용하여 모델 가중치를 검증하는 것"은 불가능합니다.

더욱이, 가중치를 얻더라도 학습 과정에 심어진 백도어나 악의적인 조작을 탐지할 수 있는 보편적으로 효과적인 방법은 없습니다. 블록체인에 모델 데이터와 학습 정보를 저장하는 것만으로는 모델의 동작 특성이나 악의적인 조작의 부재를 직접적으로 보장할 수 없습니다.

추론 계층의 투명성과 관련하여, 모델 입력과 그에 따른 추론 결과를 블록체인에 기록하는 것은 모델 사용에 대한 투명성을 제공하는 것처럼 보입니다. 그러나 블록체인은 거래를 투명하게 만들 뿐, 추론 자체를 투명하게 만드는 것은 아닙니다. "모델 X가 입력 Y로부터 추론 Z를 얻었다"라는 온체인 기록만으로는 Z의 신뢰성을 입증하기가 거의 불가능합니다.

왜냐하면 이는 "정확한 실행"을 증명할 수 없기 때문입니다(세 쌍이 사양에 따라 모델 X에서 실제로 계산되었음을 증명하려면 TEE 또는 고가의 암호화 방법이 필요합니다). 또한 "모델이 신뢰할 만하다"는 것도 증명할 수 없습니다.

실행이 정확하다고 입증되더라도, 더 근본적인 문제는 모델 X의 전체 소스 기록만으로는 의미론적 수준에서 해당 모델이 사용자 기대나 업계 표준을 충족한다는 것을 증명할 수 없다는 점입니다. 가중 해싱을 사용하여 모델을 지정하는 방식은 모델의 정체성이 모델의 신뢰성과 동일하지 않기 때문에 더욱 약한 보장만을 제공합니다.

블록체인은 특정 신뢰도 검증 목적에 유용합니다. 예를 들어, 여러 기관에서는 오픈소스 가중 모델의 해시값을 블록체인에 변경 불가능한 참조값으로 게시하여 사용자가 수정되지 않은 실제 모델을 사용하고 있음을 확인할 수 있도록 합니다. 이와 유사한 변조 방지 로그 개념은 펌웨어 업데이트 기록 및 인증서 투명성 확보에도 사용됩니다(블록체인과 유사한 추가 전용 로그를 사용하여 공개적으로 감사 가능한 인증서 발급 기록을 유지).

핵심 요점: 모델 데이터 소스와 추론 기록을 블록체인에 저장하는 것과 "모델 및 추론의 신뢰성을 의미 있게 보장하는 것" 사이에는 여전히 상당한 격차가 존재합니다.

오해 5: 탈중앙화는 자연스럽게 AI 작업 비용을 절감한다.

일부 프로젝트 유형은 분산형 네트워크를 보다 효율적이고 비용 효율적인 AI 솔루션으로 간주합니다. 대표적인 예로는 사용자가 하드웨어(예: GPU)를 임대하는 분산형 물리적 인프라 네트워크(DePIN)가 있습니다. DePIN의 가장 큰 장점은 비용 절감입니다. DePIN에서 GPU를 임대하는 것은 유사한 클라우드 서비스 제공업체에서 임대하는 것보다 훨씬 저렴할 수 있습니다.

하지만 저렴한 장비가 반드시 작업의 총비용을 낮추는 것은 아닙니다. 분산형 노드들은 공용 네트워크를 통해 통신하며, AI 작업의 처리량 및 지연 시간 요구 사항은 총비용에 상당한 영향을 미칩니다. 특히 초대형 작업(최첨단 모델 학습과 같은)은 처리량 병목 현상으로 인해 제약을 받는 경우가 많습니다.

현재 업계에 체계적인 벤치마크 테스트가 부족하여 직접적인 비용 비교가 어렵습니다. 따라서 DePIN에서 수행되는 AI 작업의 성능 및 비용을 기존 클라우드 컴퓨팅과 동일한 규모로 비교하는 것이 불가능합니다.

핵심 요점: 분산형 네트워크는 고비용의 중앙 집중식 클라우드에 대한 매력적인 대안이지만, 현재 데이터로는 특정 작업이 중앙 집중식 클라우드보다 DePIN 또는 분산형 AI 플랫폼에서 더 저렴해질 시점을 예측하기에 충분하지 않습니다.

소규모 작업(추론, 소규모 학습)은 비용 효율성이 더 높을 가능성이 큰 반면, 대규모 작업(기본 모델 학습)은 노드 간 불안정하고 대역폭이 낮은 통신으로 인해 어려움을 겪을 수 있습니다. 이러한 장단점을 명확히 하기 위해서는 추가적인 연구가 필요합니다.

이 다섯 가지 오해의 공통점은 블록체인이 "진정성"이나 "신뢰성" 그 자체보다는 "완전성"과 "검증 가능성"을 더 많이 제공한다고 생각하는 것입니다. 암호화폐와 인공지능의 결합은 아직 초기 단계이며, 서술보다는 증거가 필요합니다.