‘주소 클러스터링’에서 ‘증거 기준’으로: Chainalysis가 블록체인 추적을 재정의하려는 이유는?

作者: 137Labs

2026년 6월 말, Chainalysis는 블록체인 분석을 위한 보다 통일된 데이터 기술 체계를 구축하기 위해 'Blockchain Tracing Ontology(블록체인 추적 온톨로지)'라는 데이터 프레임워크를 대외적으로 공개했다. 과거에 선보였던 신제품이나 신기능과 비교하면, 이 문서는 업계 표준 이니셔티브에 더 가깝다. 온체인 데이터 분석의 기본 개념을 재정의하고, 블록체인 추적을 위해 해석·검증·재현 가능한 데이터 모델을 수립하려는 시도이기 때문이다.

이 제안은 발표 직후 블록체인 분석 및 디지털 자산 컴플라이언스 분야의 주요 관심사로 떠올랐다. 현재는 공개 토론 및 업계 제안 단계에 머물러 있지만, 이는 사람들로 하여금 온체인 분석에 보다 통일되고 투명한 데이터 표준이 필요한 것은 아닌지 다시 생각하게 만들었다.

오랜 숙제: 회사마다 분석 결과가 다른 이유

블록체인 데이터는 본래 공개적이고 투명하지만, 이 데이터를 어떻게 해석할지에 대해서는 줄곧 통일된 기준이 부재했다.

현재 대부분의 온체인 분석 플랫폼은 트랜잭션 행위를 바탕으로 어떤 주소들이 동일한 주체에 의해 통제될 가능성을 추론하는 '주소 클러스터링(Address Clustering)' 기술을 사용한다. 하지만 기관마다 사용하는 알고리즘·규칙·증거 출처가 달라, 동일한 주소가 플랫폼에 따라 전혀 다른 귀속 결과로 이어질 수 있다.

예를 들어, 한 분석 기관은 특정 주소를 대형 거래소 소유로 판단하는 반면, 다른 기관은 이를 미식별 지갑으로 분류할 수 있다. 동일한 주소 집합도 플랫폼에 따라 서로 다른 클러스터로 나뉠 수 있다. 이런 차이는 시장 분석에 미치는 영향이 제한적이지만, 사법 조사·자산 동결·자금세탁방지·수사기관 증거 수집 등이 연루되면 큰 논란을 야기할 수 있다.

법원 입장에서는 단순히 '이것은 특정 거래소의 지갑'이라는 결론만 제시하는 것으로는 턱없이 부족하며, 더 중요한 것은 '왜 그렇게 판단할 수 있는가?' 라는 질문에 답하는 것이다.

Chainalysis가 내놓은 것은 새 알고리즘이 아니라 하나의 '언어'

많은 사람들이 '온톨로지(Ontology)'라는 단어를 보고 Chainalysis가 또다시 새로운 클러스터링 알고리즘을 제시했다고 오해하기 쉽다. 하지만 실제로는 그렇지 않다.

온톨로지는 지식 공학 분야의 개념으로, 서로 다른 객체 간의 정의와 그 연관 방식을 규범화하는 통일된 개념 체계 및 관계 모델을 가리킨다. 인터넷 검색·의학 지식 베이스·인공지능 지식 그래프 등에서 데이터의 통일적 이해를 보장하기 위해 온톨로지를 광범위하게 사용한다.

Chainalysis가 하려는 일은 블록체인 분석을 위해 이와 유사한 '공통 언어'를 만드는 것이다.

다시 말해, 모든 회사가 반드시 동일한 클러스터링 알고리즘을 채택하도록 강제하는 것이 아니라, 분석 결과를 통일된 데이터 구조로 표현하도록 유도하여 분석 과정의 투명성을 높이고 제삼자가 이해·검증·재현하기 쉽도록 하려는 것이다.

이제 '클러스터'로는 충분하지 않다

과거 업계에서는 일반적으로 '클러스터(Cluster, 주소 모음)'를 분석의 기본 단위로 삼아왔다. 즉, 여러 주소가 하나의 지갑 또는 하나의 개체에 공동 귀속된다고 간주하는 것이다.

이 방식은 간단하고 직관적이지만, 블록체인 인프라가 발전함에 따라 그 한계가 점점 뚜렷해지고 있다.

오늘날 대형 거래소의 지갑 체계는 수백만 개의 주소를 포함할 수 있으며, 각 주소는 입금·출금·콜드월렛·핫월렛 관리·자금 통합·거스름돈 발행 등 전혀 다른 기능을 수행한다. 이들을 여전히 단순하게 하나의 클러스터로 묶어버리면 복잡한 지갑 구조를 정확히 기술하기 어렵다.

이에 Chainalysis는 제안에서 '월렛 세그먼트(Wallet Segment, 지갑 세그먼트)' 라는 새로운 개념을 제안했다.

새로운 모델에서는 하나의 개체(Entity)가 여러 개의 지갑(Wallet)을 보유할 수 있고, 각 지갑은 다시 여러 개의 월렛 세그먼트로 나뉘며, 각 세그먼트 아래에 구체적인 주소가 포함된다. 이 계층 구조는 기존의 클러스터보다 대형 기관의 지갑 관리 방식을 더 사실적으로 반영할 수 있으며, 서로 다른 주소 간의 통제 관계도 더욱 정교하게 기술할 수 있다.

'결과의 신뢰'에서 '과정의 신뢰'로

모델 자체보다 더 중요한 변화는 두 번째 계층의 설계에서 비롯된다.

기존 온체인 분석은 주로 최종 결과에 주목했다. 주소가 누구의 것인지, 자금이 어디로 흘러가는지, 불법 활동과 연루되었는지 등이 그것이다.

반면, 새로운 온톨로지는 추론 과정 자체를 더욱 중시한다.

모든 분석 결과에 대해 다음 몇 가지 질문에 명확히 답해야 한다.

이 결론의 근거가 된 온체인 증거는 무엇인가?
어떤 분석 규칙을 사용했는가?
오프체인 정보를 인용했는가?
이 추론의 신뢰도는 얼마인가?
제삼자가 이 과정을 다시 검증할 수 있는가?

다시 말해, '무엇인지'를 알려주는 것을 넘어 '왜'를 설명해야 한다는 뜻이다.

Chainalysis는 이 부분을 증거(Evidence) 및 신뢰도(Confidence) 계층이라고 부른다.

앞으로 어떤 주소가 거래소 지갑으로 표시될 때, 그것은 단순한 태그 하나로 끝나지 않고 트랜잭션 패턴·주소 관계·공개된 정보·수사 기록 등을 포함한 완전한 추론 근거가 수반되며, 그에 상응하는 신뢰도 등급이 부여된다. 이러한 설계는 사법 증거가 갖추어야 할 설명 가능성 요건에 더 잘 부합하며, 기관 간 교차 검증을 수행하는 데에도 유리하다.

비트코인 포그(Bitcoin Fog) 사건의 시사점

사실 이 제안은 갑자기 생겨난 것이 아니라, 미국의 유명한 비트코인 포그(Bitcoin Fog) 자금세탁 사건과 깊은 연관이 있다.

비트코인 포그는 비트코인 역사상 가장 오래 지속된 믹싱 서비스 중 하나였다. 미국 법무부는 수사 과정에서 Chainalysis Reactor의 분석 결과를 핵심 증거로 대거 채택했다.

재판 과정에서 법원은 유명한 도버트(Daubert) 심리를 열어 Chainalysis의 분석 방법론을 엄격히 심사했는데, 그 내용은 다음과 같다.

주소 클러스터링에 과학적 근거가 있는지 여부
분석 방법의 반복 검증 가능 여부
설명 불가능한 '블랙박스 알고리즘'에 해당하는지 여부
다른 전문가들이 분석 과정을 독립적으로 재현할 수 있는지 여부

최종적으로 법원은 Chainalysis의 분석 방법론이 과학적 신뢰성을 충분히 갖추었으며 사법 증거로 사용될 수 있다고 인정했다.

다만, 이 사건은 전체 업계에 존재하는 문제점 역시 드러냈다. 분석 기관마다 서로 다른 기준을 사용할 경우, 향후 유사한 사건에서 더 큰 의문에 직면할 수 있다는 점이다. 따라서 통일된 데이터 표현 및 증거 프레임워크의 구축이 Chainalysis가 이 온톨로지를 추진하는 중요한 배경이 되었다.

블록체인 분석은 실제 신원을 직접 식별할 수 없다

주목할 점은, Chainalysis가 이번 제안에서 다음을 특별히 강조했다는 것이다. 바로 온체인 분석 자체만으로는 현실 세계의 개인 신원을 직접 식별할 수 없다는 사실이다.

온체인 데이터는 주소 간의 관계와 자금 흐름 경로만을 드러낼 뿐이며, 주소 이면의 실제 통제자를 알아내려면 일반적으로 거래소 KYC 정보, 법원이 확보한 자료, 법 집행 기관이 획득한 서버 로그 등 오프체인 증거에 의존해야 한다.

이는 블록체인 분석이 제공하는 것은 신원을 직접 증명하는 최종 증거가 아니라, 고품질의 데이터 추론이라는 점을 의미한다. 진정으로 완전한 사법적 증거 사슬은 온체인 데이터와 오프체인 수사가 결합되어야 완성된다.

데이터 품질에서 업계 표준으로

온톨로지 자체 외에도, 이번에 제시된 전체 프레임워크는 데이터 품질, 분석 투명성, 사법적 증거 능력을 중심으로 체계적으로 서술되었다. Chainalysis가 업계의 관심을 분석 결과 그 자체에만 두는 것이 아니라, 분석 과정이 해석·검증·재현될 수 있는 구조로 이뤄졌는지로 촉구하고자 함을 엿볼 수 있다.

이를 통해 향후 업계 경쟁의 핵심이 단순히 '누가 더 많은 주소를 커버하는가', '누가 더 많은 태그를 식별하는가'가 아니라, '누구의 데이터 품질이 더 높은가', '누구의 분석이 더 투명한가', '누구의 증거가 법원에서 더 쉽게 채택되는가'로 이동할 것임을 알 수 있다.

규제 기관·법 집행 부서·대형 금융 기관의 입장에서 분석 로직을 설명할 수 있고, 독립적인 감사를 지원하며, 반복 검증이 가능한 시스템은 결과만 출력하는 '블랙박스 모델'보다 명백히 더 높은 신뢰성을 가진다.

이 제안이 의미하는 바는?

더 긴 안목에서 보면, Chainalysis가 이번에 발표한 것은 일반적인 소프트웨어 업그레이드가 아니라 블록체인 분석 업계를 '경험 중심'에서 '표준 중심'으로 전환시키려는 움직임에 가깝다.

이 온톨로지가 업계에서 궁극적으로 폭넓게 수용된다면, 서로 다른 분석 기관·거래소·규제 부서·사법 기관까지도 통일된 데이터 모델 아래에서 분석 결과를 공유할 수 있게 되어 커뮤니케이션 비용이 절감되고 증거의 일관성이 높아지며, 국경 간 수사·자금세탁방지 조사·디지털 자산 규제에 더욱 신뢰성 있는 기반을 제공할 것으로 기대된다.

물론 표준의 수립은 단숨에 이루어지지 않는다. 영업 비밀과 투명성 사이의 균형을 어떻게 맞출지, 여러 기관이 통일된 규범을 채택하도록 어떻게 유도할지, 증거 모델을 어떻게 지속적으로 개선할지는 여전히 업계의 공동 모색이 필요한 과제다.

그러나 한 가지 분명한 점은, 디지털 자산이 점차 글로벌 금융 시스템에 통합됨에 따라 블록체인 분석의 경쟁 중점이 변화하고 있다는 사실이다. 미래에 업계의 가치를 진정으로 결정짓는 것은 단순한 알고리즘의 정확도가 아니라, 분석 과정의 설명 가능성, 데이터 품질, 그리고 증거 신뢰도가 될 것이다. 그리고 이것이야말로 Chainalysis가 Blockchain Tracing Ontology를 통해 열어가고자 하는 새로운 방향이다.