2026년 5월, 알리페이는 AI 결제 거래 건수가 3억 건을 돌파했다고 발표했습니다. 한 달 후, 위챗은 개발자들이 자사 미니 프로그램에 AI 기능을 활용할 수 있도록 허용했는데, 이 과정에서 논란을 불러일으킨 조건이 하나 있었습니다. 바로 개발자들이 플랫폼이 미니 프로그램의 소스 코드를 읽을 수 있도록 권한을 부여해야 한다는 것이었습니다.
두 시점은 30일도 채 되지 않지만, 1년 넘게 서로 다른 방향으로 나아가고 있는 두 가지 경로를 보여줍니다. LatePost에 따르면, 알리페이는 '바오 플랜(Bao Plan)'이라는 코드명의 AI 버전을 내부적으로 테스트 중인데, 이는 단순히 비서를 추가하는 것이 아니라 사용자가 단 한 번의 클릭으로 완전히 새로운 대화형 인터페이스로 전환할 수 있도록 하는 것입니다. 반면 위챗은 마틴 라우 사장이 실적 발표에서 향후 AI 에이전트를 탑재할 계획이지만, 별도의 타임라인 없이 소셜 관계, 공식 계정, 비디오 계정과 긴밀하게 통합될 것이라고 밝혔습니다.
10억 명의 사용자와 수백만 개의 미니 프로그램을 보유한 두 플랫폼이 동일한 질문에 대해 상반된 답변을 내놓았습니다. 인공지능이 사용자를 위한 서비스를 운영할 수 있게 되면, 진입점을 재작성해야 할까요, 아니면 숨겨야 할까요?
알리페이는 인터페이스뿐만 아니라 더 많은 것을 없앴습니다.
알리페이가 실제로 무엇을 하는지 이해하려면 특정 사용자 행동을 살펴봐야 합니다.
과거에는 알리페이를 통해 저당 라떼 세 잔을 주문하고 공항까지 택시를 부르는 표준적인 과정이 다음과 같았습니다. 디디 미니 프로그램을 찾아 목적지를 입력하고 차량 호출을 확정합니다. 디디를 종료하고 루킨커피 미니 프로그램을 찾아 제품 카테고리를 선택하고 설탕 함량을 변경한 후 장바구니에 담고 결제합니다. 결제를 완료하기 위해 두 미니 프로그램을 번갈아 가며 사용해야 했습니다. 각 단계마다 클릭, 페이지 이동, 그리고 대기 시간이 필요했습니다.
"바오 플랜"이 추구하는 변화는 이 모든 과정을 단 하나의 문장으로 압축하는 것입니다. 사용자가 채팅창에 "공항까지 가는 차를 불러주고, 근처에서 저당 라떼 세 잔을 주문해 줘"라고 말하면, 인공지능(AI)이 의도를 파악하고, 작업을 세분화하고, 관련 교통 및 음식 서비스를 호출하고, 주문을 통합하고, 결제까지 완료하는 등 모든 후속 단계를 처리합니다. 인터페이스는 더 이상 여러 개의 미니 프로그램 항목이 아니라 채팅창 하나로 통합됩니다.
이러한 변화의 철저함은 내부 제품 설계 프로세스에서 분명하게 드러납니다. LatePost에 따르면, 프로젝트 팀은 새로운 상호작용 모델을 결정하기 위해 100개가 넘는 제품 설계 버전을 거쳤습니다. 최종적으로 대화 중심 솔루션을 선택한 것은 자연어가 AI 상호작용의 주류 방식으로 자리 잡았으며, 서비스 제공 방식은 기존 프레임워크에 AI 요소를 단순히 덧붙이는 것이 아니라 이러한 방향으로 진입점을 재구축해야 한다는 판단을 반영한 것입니다.
이러한 혁신적인 접근 방식은 알리페이의 초기 선택이 아니었습니다. 2023년 하반기, 알리페이 경영진이 "어떻게 지능화로 나아갈 것인가"에 대한 논의를 시작했을 때, 그들이 직면한 첫 번째 질문은 기존 플랫폼을 수정할 것인가, 아니면 완전히 새로운 플랫폼을 구축할 것인가였습니다. 프로젝트 팀은 처음에는 후자를 선택했습니다. 2024년 9월 와이탄 서밋에서 알리페이는 AI 생활 도우미로 자리매김한 자체 개발 AI 애플리케이션 "즈샤오바오(Zhi Xiaobao)"를 출시했습니다.
지샤오바오는 성공하지 못했습니다. 소식통에 따르면, 독립형 앱의 일일 활성 사용자 수(DAU)는 앱 내 지능형 비서보다 훨씬 적습니다. 알리페이에 내장되어 홈페이지 트래픽을 활용하는 대화형 비서는 수백만 명의 안정적인 DAU를 유지하며 독립형 앱보다 훨씬 많은 상호 작용 데이터를 축적해 왔습니다.
또 다른 현실적인 제약 조건이 있었습니다. 당시 앤트 그룹은 건강 앱 "앤트 아푸"에 집중하고 있었고, 범용 인공지능 "링광" 개발에도 힘쓰고 있었기 때문에 컴퓨팅 파워와 개발 자원이 제한적이었습니다. 별도의 독립형 앱을 개발한다는 것은 이러한 프로젝트들과 자원을 놓고 경쟁해야 할 뿐만 아니라, 사용자들이 처음부터 다시 앱을 사용하도록 유도하는 데 막대한 비용이 소요될 것이라는 의미였습니다.
2025년 3월, 팀은 방향을 바꿔 독립 플랫폼 접근 방식을 포기했습니다. 내부적으로 점차 합의가 이루어졌는데, 알리페이의 기존 10억 사용자 기반에 AI 서비스를 제공하고 마이그레이션 비용 없이 기존 사용자에게 서비스를 제공하는 것이 플랫폼 외부에 새로운 애플리케이션을 개발하는 것보다 더 효과적이라는 것이었습니다. 2025년 12월, AI 기반 알리페이 프로젝트가 공식적으로 시작되었으며, 초기 팀은 앱 내 지능형 비서 팀에서 구성되었고, 이후 알고리즘, C-엔드 제품 및 미니 프로그램 비즈니스 팀이 합류했습니다.
최종 제품 로드맵은 독립형 네이티브 앱도 아니고 기존 애플리케이션에 내장된 어시스턴트도 아닌, 원클릭 전환 방식입니다. 새 버전 출시 후에도 기존 알리페이 앱이 기본적으로 실행되지만, 사용자는 AI 버전을 선호하는 인터페이스로 설정할 수 있습니다. LatePost는 이러한 "여유를 남겨두는" 접근 방식이 내부 용어인 "구조조정 및 업그레이드"를 의미한다고 보도했습니다.
위챗은 AI가 사람들 사이에 개입하는 것을 막아줍니다.
위챗의 AI 전략은 처음부터 완전히 다른 논리를 따릅니다.
텐센트의 마틴 라우 사장은 2025년 3분기 실적 발표에서 위챗의 차세대 AI 비서가 소셜 관계, 커뮤니케이션 기능, 공식 계정, 비디오 계정 등과 긴밀하게 통합된 독보적인 에이전트가 될 것이라고 거의 명확하게 밝혔습니다. 구체적인 출시 일정은 언급하지 않았으며, 텐센트는 AI 비서 출시 루머를 두 차례나 부인한 바 있습니다.
왜 위챗은 알리페이처럼 별도의 채팅 인터페이스를 만들 수 없을까요? 기술적 능력의 문제가 아니라 제품의 본질 때문입니다. 위챗의 핵심 인터페이스는 채팅 목록으로, 전 세계 10억 명이 매일 가장 자주 사용하는 모바일 화면입니다. 이 인터페이스에 AI 채팅 진입점을 덧씌우려는 시도는 사용자들에게 사회적 관계를 방해하는 것으로 인식될 가능성이 높습니다. 알리페이의 홈페이지는 서비스 포털이기 때문에, 이를 채팅 창으로 바꾸려면 사용자들이 새로운 사용 습관에 적응해야 합니다. 반면 위챗의 홈페이지는 사람 간의 대화에 초점을 맞추고 있습니다. AI 채팅으로 사람들의 대화를 대체하거나 밀어내는 것은 사용자들에게 중요한 심리적 영역을 침해하는 행위가 될 것입니다.
위챗의 접근 방식은 '기생적' 논리에 더 가깝습니다. AI 비서는 어떤 인터페이스도 대체하지 않고, 그룹 채팅과 공식 계정 안에 숨겨져 있다가 활성화되기를 기다리는 에이전트처럼 작동합니다. 예를 들어, 가족 위챗 그룹에서 누군가가 공식 계정의 가족 캠핑장 관련 장문의 글을 공유했다고 가정해 보겠습니다. 다른 구성원들은 글을 열어 읽을 필요 없이, 그룹 내 AI 비서에게 핵심 내용을 요약해 달라고 요청하고, 구성원들의 일정과 연동하여 글에서 추천한 캠핑장을 예약할 수 있습니다. AI 비서는 공식 계정의 콘텐츠를 처리하고, 미니 프로그램의 예약 서비스에 접속하여 그룹 채팅 구성원들의 일정을 고려한 후, 최종적으로 예약 결과를 그룹에 전달합니다.
이 과정 전반에 걸쳐 AI는 그룹 채팅의 맥락 안에서 작동하며, 사용자는 여전히 그룹, 구성원 및 대화를 볼 수 있습니다. 에이전트가 수행하는 "작업"은 별도의 인터페이스에 나타나 존재를 드러내는 대신, 사회적 관계에 자연스럽게 녹아들어 있습니다.
이러한 제약에는 대가가 따릅니다. 위챗 플랫폼에는 수백만 개의 미니 프로그램 형태로 서비스가 제공됩니다. 인공지능이 사용자를 위해 이러한 작업을 처리하려면 사용자의 의도뿐만 아니라 서비스 자체의 데이터 구조, 페이지 로직, 상호 작용 흐름까지 이해해야 합니다. 알리페이도 같은 문제에 직면해 있으며, 두 회사의 해결책은 이 분야에서 가장 근본적인 차이점 중 하나를 보여줍니다.
화면 읽기와 소스 코드 읽기 중 어느 솔루션이 더 어려울까요?
2026년 6월, 위챗 오픈 커뮤니티는 두 가지 모드를 제공하는 "미니 프로그램 AI 개발 모드(베타) 접속 가이드"를 공개했습니다.
첫 번째 모드는 "자동 모드"입니다. 개발자는 검토 과정에서 플랫폼이 미니 프로그램의 소스 코드를 읽을 수 있도록 권한을 부여합니다. AI는 소스 코드를 분석하여 페이지 구조와 작동 논리를 파악하고 미니 프로그램을 직접 제어합니다. 두 번째 모드는 "개발 모드"입니다. 개발자는 WeChat에서 정의한 프로토콜에 따라 기본 인터페이스와 구성 요소를 포함하여 서비스를 스킬로 캡슐화합니다. AI는 이러한 표준화된 인터페이스를 호출하여 작업을 완료합니다.
알리페이의 솔루션은 "이중 트랙 시스템"입니다. LatePost에 따르면, 한편으로는 자발적인 가맹점들이 서비스를 적극적으로 통합하여 AI가 직접 호출할 수 있는 MCP(미니 프로그램) 또는 스킬로 만들도록 장려하고, 다른 한편으로는 사용자의 승인을 받아 AI가 기존 미니 프로그램 인터페이스 화면을 "읽어" 아직 수정되지 않은 서비스를 호환 가능하게 만들 수 있습니다.
두 서비스의 핵심적인 차이점은 아직 완성되지 않은 기존 미니 프로그램을 수정할 때, 위챗은 개발자에게 소스 코드를 넘겨주도록 요구하는 반면, 알리페이는 AI가 이미지를 해석하고 사용자를 대신하여 작업을 수행하도록 한다는 점에 있습니다.
위챗 오픈 커뮤니티 문서에 따르면, "자동 모드"는 기술적으로 더 완벽한 해결책입니다. AI가 소스 코드를 읽은 후 페이지를 구조화하여 작업 경로를 명확하고 제어 가능하게 만듭니다. 시각적 인식과 인터페이스 시뮬레이션에 의존하는 스크린 리더와는 달리, 오류 발생 확률이 낮습니다. 그러나 이 솔루션은 개발자에게 부담을 전가합니다. 소스 코드는 미니 프로그램 개발자의 핵심 자산인데, 이를 넘겨준다는 것은 비즈니스 로직, 데이터 구조, 상호작용 디자인 등을 텐센트에 완전히 노출하는 것을 의미합니다. 미니 프로그램을 기반으로 사업을 운영하는 중소기업의 경우, 이는 보안 문제일 뿐만 아니라 상업적 위험이기도 합니다. 플랫폼이 서비스 프로세스를 완전히 장악하게 되면 트래픽 분배 및 협상에서 얼마나 많은 여지가 남게 될까요?
'자동 모드'를 선택하지 않더라도 개발은 쉽지 않습니다. 개발자는 비즈니스 프로세스를 재검토하고, 이를 핵심 기능으로 분해한 다음, 위챗이 정의한 프로토콜에 따라 스킬로 캡슐화하고, 새로운 검토 과정을 거쳐야 합니다. 레스토랑 미니 프로그램의 주문, 결제, 쿠폰 사용, 멤버십 포인트 적립 등 전체 프로세스를 분해하고 캡슐화하는 데 드는 작업량은 초기 개발보다 몇 배나 더 많을 수 있습니다. 누가 이 비용을 부담할까요? 위챗은 아직까지는 인센티브 계획을 제공하지 않고 있습니다.
알리페이의 스크린 리더 솔루션은 이러한 문제들을 해결합니다. 가맹점의 협조나 코드 수정이 필요 없으며, 가맹점은 자신의 미니 프로그램이 AI에 의해 작동되고 있다는 사실조차 알 필요가 없습니다. 사용자가 채팅 인터페이스에서 "상하이행 기차표 사주세요"라고 말하면, AI는 12306 미니 프로그램 인터페이스를 열고 출발지, 도착지, 열차 시간표, 좌석 선택 버튼, 결제 확인 페이지 등을 인식하여 사용자의 손가락 움직임을 단계별로 시뮬레이션합니다. 이미 MCP 또는 스킬 연동을 완료한 가맹점의 경우, AI는 표준화된 인터페이스를 직접 호출하여 더욱 원활한 사용자 경험을 제공할 수 있습니다. 아직 연동되지 않은 수많은 소규모 서비스의 경우, 스크린 리더는 가장 낮은 장벽의 호환성 경로를 제공합니다.
스크린 리더의 문제점은 명확합니다. 안정성이 충분히 검증되지 않았고, 미니 프로그램 인터페이스는 매우 다양합니다. 동적 로딩, 팝업 광고, 버전 업데이트로 인한 레이아웃 변경 등은 모두 AI 인식 오류 가능성을 높입니다. 결제 확인 버튼의 위치가 몇 픽셀만 어긋나도 AI가 정확하게 인식할 수 있을까요? 스크린 리더 작동 중 금액 오인이나 잘못된 배송지 선택과 같은 오류가 발생할 경우, 누가 책임을 져야 할까요? 알리페이는 관련 면책 조항이나 분쟁 해결 메커니즘을 아직 공개적으로 밝히지 않았습니다.
이 접근 방식의 핵심 논리는 우선 사용자들이 직접 사용해 보도록 유도하는 것입니다. 판매자들이 AI를 통해 향상된 주문 전환율을 확인하게 되면, 자연스럽게 표준 인터페이스에 연결하여 사용자 경험을 최적화하려는 움직임을 보일 것입니다. 이러한 소비자 중심적 접근 방식은 기업 간(B2B) 통합을 촉진합니다.
3억 건의 거래는 무엇을 증명하는가?
알리페이는 제품과 생태계를 넘어 AI가 결제를 처리하는 방식과 관련된 또 다른 중요한 일을 해냈습니다.
2026년 5월 AI 결제 생태계 컨퍼런스에서 알리페이는 AI 결제 거래 건수가 3억 건을 돌파했으며, 범용 지능형 에이전트 프레임워크의 95%를 지원한다고 발표하고 토큰 페이와 AI 지갑을 출시했습니다. 이 두 제품은 에이전트 경제의 인프라를 이해하는 데 핵심적인 역할을 합니다.
토큰페이는 극히 소액이지만 빈번하게 발생하는 결제 문제를 해결합니다. AI가 두 음식 배달 플랫폼의 가격을 비교할 때, 계정 유효성을 확인하기 위해 0.01위안의 검증 거래를 처리해야 할 수 있습니다. 또한 AI가 여러 쿠폰 중에서 최적의 조합을 선택할 때, 각 쿠폰 검증은 하나의 결제 행위로 간주됩니다. 이러한 거래는 금액은 작지만, 사람이 직접 처리하는 거래보다 훨씬 빈번하게 발생합니다. 기존 결제 시스템은 "사람의 확인 및 결제"를 기반으로 설계되었지만, 토큰페이는 이러한 과정을 에이전트에 위임합니다.
AI 지갑은 마치 에이전트에게 예산 카드를 발급하는 것과 같습니다. 사용자는 규칙과 한도를 설정하고, AI는 해당 규칙 내에서 자율적으로 결제를 완료합니다. 앤트그룹 CEO 한신이는 컨퍼런스에서 미래에는 수많은 에이전트가 경제 활동에 참여하게 될 것이며, 상호작용은 인간 대 인간 상호작용에서 인간 대 에이전트 상호작용, 그리고 에이전트 간 상호작용으로 전환될 것이라고 예측했습니다.
알리페이의 연간 총 거래량으로 보면 3억 건의 거래는 큰 숫자가 아닐 수도 있지만, 그 의미는 한 가지를 입증하는 데 있습니다. 바로 사용자들이 이제 인공지능(AI)을 단순한 검색이나 가격 비교에 그치지 않고 실제 비즈니스 거래에 활용하고 있다는 점입니다. 단 한 문장으로 차량 호출이나 음식 주문부터 AI 기반 결제까지, 이러한 서비스 순환을 위한 기술적 요소와 사용자 승인 권한이 매끄럽게 통합되었습니다.
위챗 페이는 아직 AI 기반 혁신에 대한 구체적인 계획을 공개적으로 밝히지 않았습니다. 위챗 페이 역시 방대한 사용자 기반을 보유하고 있지만, 그 활용 시나리오는 주로 소셜 송금, 세뱃돈, 가맹점 결제 시스템에 집중되어 있습니다. 에이전트 경제 모델은 이와는 다를 수 있으며, 두 서비스 간의 결제 인프라에 새로운 차이가 나타날지는 위챗 AI 어시스턴트가 공식 출시와 함께 유사한 에이전트 결제 기능을 제공할지 여부에 달려 있습니다.
생태계가 두 가지 방식으로 파괴되고 있다.
알리페이와 위챗 모두 에이전트 서비스 진입점을 지향하지만, 서로 다른 중간 경로로 인해 미니 프로그램 생태계에 두 갈래의 균열이 생겨 서로 다른 결과를 초래할 것입니다.
알리페이의 스크린 리더 솔루션은 수많은 미니 프로그램들이 AI 기능을 활용할 수 있도록 자연스럽게 지원해 왔습니다. 판매자는 별도의 조치를 취하지 않았음에도 불구하고 사용자는 이미 AI를 통해 서비스를 이용할 수 있습니다. 이는 두 가지 반응을 불러일으킬 것입니다. 일부 판매자는 AI 기반 주문량이 증가하는 것을 확인하고 사용자 경험을 최적화하고 트래픽 분산을 늘리기 위해 MCP(미니 프로그램 플랫폼) 또는 스킬을 적극적으로 통합할 것입니다. 반면, 주문 출처가 불분명해진다는 이유로 AI 도입을 꺼리는 판매자도 있을 것입니다. 이전에는 사용자가 미니 프로그램 내에서 클릭한 모든 내역을 추적할 수 있었지만, 이제 판매자는 AI 스크린 리더가 처리하는 경로 구간에 대한 사용자 행동 데이터를 얻을 수 없습니다.
알리페이는 이러한 변화를 분명히 예측했습니다. LatePost 보도에 따르면 알리페이의 AI 버전 출시 이후, 판매자와 개발자를 위한 AI 오픈 플랫폼도 곧 출시될 예정입니다. 이 플랫폼은 판매자가 AI를 통해 증가하는 주문량을 활용하면서도 서비스 프로세스, 사용자 도달 범위, 수익 분배에 대한 가시성과 통제력을 유지할 수 있도록 하는 방안을 제시할 것으로 예상됩니다.
위챗에 가해지는 압력은 다른 양상을 보입니다. 소스 코드 라이선스에 대한 높은 진입 장벽은 개발자들을 두 그룹으로 나눌 것입니다. 기술력과 협상력을 갖춘 상위 개발자들은 위챗 AI 어시스턴트의 트래픽 우선 배분을 위해 소스 코드를 제공하거나 패키징 기술에 투자할 의향이 있습니다. 그러나 많은 중소기업들은 소스 코드 제공을 꺼리고 패키징 비용을 감당할 수 없을 것입니다. 위챗 AI 어시스턴트 출시 후 트래픽이 실제로 공식 인증 가맹점으로 이동한다면, 승인되지 않은 미니 프로그램들은 AI 서비스 유통 채널에서 소외될 것입니다. 장기적으로 위챗의 미니 프로그램 생태계는 상위 업체에 더욱 집중될 수 있으며, 이는 위챗이 지속적으로 강조하는 "분산형" 생태계라는 담론과 충돌을 야기할 수 있습니다.
좀 더 미묘한 문제는 기술 표준에 있습니다. 알리페이는 자체적인 MCP(멀티채널 프로토콜)를 홍보하는 반면, 위챗은 자체적인 미니 프로그램 MCP 프로토콜 세트를 정의합니다. 이름은 비슷하지만 구현 방식은 완전히 호환되지 않습니다. 알리페이 AI와 위챗 AI 모두를 통해 주문 서비스를 이용하려는 음식점은 두 표준에 맞춰 서비스를 캡슐화해야 할 수도 있습니다. 이는 기술적인 어려움은 아니지만 비용 부담이 따릅니다. 어느 쪽이 먼저 규모의 경제를 달성하느냐에 따라 사실상의 업계 표준을 강요할 수 있는 협상력이 커질 것입니다. 현재 알리페이 AI 결제 건수가 3억 건을 넘어선 상황에서 이러한 우위는 알리페이에 있습니다.
사용자 측면에서 보면, 이러한 변화의 궁극적인 결과는 사람들과 휴대폰 간의 관계를 재정의할 수 있습니다. 알리페이의 채팅 인터페이스가 제대로 작동한다면, 사용자들이 알리페이를 여는 빈도와 상황이 바뀔 것입니다. 단순히 결제할 때만 사용하는 것이 아니라, 필요할 때나 궁금한 점이 있을 때도 알리페이를 사용하게 될 것입니다. 위챗 에이전트가 제대로 작동한다면, 그룹 채팅에서 사용자들이 소통하는 방식이 바뀔 것입니다. 서비스를 찾기 위해 채팅 인터페이스를 벗어날 필요 없이, 모든 것이 그룹 채팅 내의 에이전트를 통해 처리될 것입니다.
2014년 춘절을 앞두고 두 플랫폼 간에 벌어진 '세뱃돈 전쟁'은 사용자들이 돈을 어느 계좌에 보관할 것인지에 대한 질문을 바꿔놓았습니다. 이번 경쟁은 사용자들이 '내 일을 대신 처리해 줄 사람'을 누구로 정할 것인지에 대한 것입니다.
12년 전, 위챗의 홍바오 기능은 잭 마 회장으로부터 "진주만 공격"에 비유되었습니다. 그리고 12년 후, 위챗의 AI 메시지 기능을 둘러싼 수개월간의 추측 끝에 알리페이가 주목을 받게 되었습니다. 과연 어떤 길이 에이전트 시대의 진정한 요구를 반영할까요? 해답은 제품 출시가 아니라 수백만 개의 미니 프로그램이 어떻게 재활성화되는지, 그리고 수억 명의 사용자가 처음으로 휴대폰에 "도와주세요"라고 말하는 경험에 있습니다.



