웹페이지에서 "신호등 식별"이나 "모든 횡단보도 선택"을 클릭할 때마다, 여러분은 자신이 로봇이 아니라는 것을 증명하는 것이라고 생각할지도 모릅니다. 하지만 실제로는 구글의 AI 시스템에 무료 학습 데이터를 제공하고 있는 것입니다. 이러한 과정은 15년 이상 지속되어 왔으며, 전 세계 수억 명의 사용자가 참여하여 궁극적으로 구글 지도의 시각 인식 기능과 현재 450억 달러의 가치를 지닌 자율주행차 회사 웨이모를 구축하는 데 사용되었습니다 . 이 과정에서 누구도 여러분의 동의를 구하지 않았고, 진실을 알려주지도 않았으며, 단 한 푼의 보상도 받지 못했습니다 .
매일 50만 시간의 무상 노동이 이루어지고 있습니다. 그저 은행 계좌에 로그인하는 것뿐이라고 생각하는 사람들이 기여하고 있는 것입니다.
reCAPTCHA는 인터넷 역사상 가장 성공적인 은밀한 데이터 수집 작전입니다. 전성기에는 매일 2억 명의 사람들이 reCAPTCHA 인증을 완료했지만, 그들 중 실제로 무엇을 만들고 있는지 아는 사람은 거의 없었습니다.
구글의 자율주행차 회사인 웨이모는 현재 450억 달러의 기업 가치를 지니고 있습니다. 웨이모의 핵심 학습 데이터의 상당 부분은 바로 여러분으로부터, 그것도 무료로, 여러분이 방문하는 모든 웹사이트에서 얻습니다.
자세한 내용은 다음과 같습니다.
출발점: 기발한 아이디어
2000년, 스팸 봇들이 인터넷을 파괴하고 있었습니다. 포럼은 스팸으로 넘쳐났고, 이메일 사서함은 스팸 메일로 가득 찼습니다. 웹사이트들은 사람과 기계를 구분할 수 있는 방법을 절실히 필요로 했습니다.
카네기멜론 대학교의 루이스 폰 안 교수는 이 문제를 해결했습니다. 그는 인간만이 읽을 수 있는 변형된 문자 체계인 CAPTCHA를 발명했습니다. 로봇은 이를 통과할 수 없지만, 인간은 통과할 수 있습니다.
하지만 폰 안은 훨씬 더 큰 가능성을 보았습니다. 수백만 명의 사람들이 이러한 검증에 인지 에너지를 쏟고 있었습니다. 만약 그 에너지를 두 가지 일을 동시에 하는 데 사용할 수 있다면 어떨까요?
2007년, 그는 reCAPTCHA를 출시했습니다. 이 기술의 독창적인 점은 무작위로 의미 없는 문자열을 표시하는 대신 두 단어를 보여준다는 것이었습니다. 하나는 시스템에 알려진 단어였고, 다른 하나는 컴퓨터가 당시에는 인식할 수 없었던 실제 스캔된 책에서 가져온 단어였습니다. 당신의 답변은 디지털화 작업을 완료하는 데 도움이 되었습니다.
이 책들은 뉴욕 타임스 아카이브와 구글 북스에서 가져온 것으로, 총 1억 3천만 권입니다.
로그인을 한다고 생각하시겠지만, 실제로는 세계 최대 디지털 도서관에서 OCR(광학 문자 인식) 작업을 하고 계신 겁니다.
2009년 구글은 reCAPTCHA를 인수했습니다.
구글이 판도를 바꿨다
텍스트 왜곡 시대는 2012년경에 막을 내렸다.
구글은 새로운 문제에 직면해 있습니다. 스트리트 뷰 차량이 지구상의 모든 도로를 촬영하고 있지만, 그 사진들은 단지 가공되지 않은 원본 데이터일 뿐입니다. 인공지능이 진정으로 유용해지려면, 도로 표지판, 횡단보도, 신호등, 상점 간판 등 자신이 "보는" 것을 이해해야 합니다.
그래서 구글은 reCAPTCHA v2를 재설계했습니다. 인증 콘텐츠는 왜곡된 텍스트에서 이미지 격자로 변경되었습니다. "신호등이 있는 모든 사각형을 클릭하세요." "모든 횡단보도를 선택하세요." "상점 간판을 식별하세요."
이 이미지들은 구글 스트리트 뷰에서 직접 가져온 것입니다.
클릭 하나하나가 라벨이 됩니다. 사용자의 모든 선택은 구글의 컴퓨터 비전 모델에 정보를 전달합니다. 이 픽셀은 신호등이고, 이 모양은 횡단보도입니다.
시험에 합격하는 게 아니라 데이터셋을 구축하는 겁니다.
아무도 이야기하지 않는 규모
최고조에 달했을 때는 하루에 2억 건의 reCAPTCHA가 완료되었습니다.
각 검증에는 약 10초가 소요되므로 매일 20억 초의 인간 노동력이 투입되는데, 이는 하루 50만 시간 에 해당합니다.
전문 데이터 주석 작업에 대한 시장 가격은 시간당 10달러에서 50달러 사이입니다. 가장 낮은 가격을 기준으로 할 때, 매일 무료로 추출되는 노동력의 가치는 최대 500만 달러에 달합니다.
게다가 reCAPTCHA는 특정 애플리케이션에만 국한되지 않습니다. 모든 은행, 모든 정부 포털, 모든 전자상거래 플랫폼, 그리고 인터넷상의 모든 로그인 페이지에 존재합니다. 선택의 여지가 없습니다. 계정에 접속하고 싶으신가요? 먼저 데이터셋에 레이블을 지정하세요.
구글은 당신의 의견을 묻지도 않았고, 당신에게 돈을 지불하지도 않았으며, 심지어 이 사실을 당신에게 알리지도 않았습니다.
이 모든 것을 합치면 무엇이 될까요?
이 데이터는 두 제품 모두에 직접 전송되었습니다.
구글 지도. 세계에서 가장 널리 사용되는 내비게이션 도구입니다. 도로 표지판을 읽고, 상점을 찾고, 도시 지리를 파악하는 능력은 수십억 명의 사용자가 사이트에 접속하여 수동으로 입력한 주석을 기반으로 구축되었습니다.
웨이모도 있습니다.
웨이모는 구글의 자율주행차 프로젝트로, 2016년에 독립 자회사로 분리되었습니다. 안전한 주행을 위해 자율주행차는 신호등, 횡단보도, 보행자, 정지 표지판 등 수천 가지의 시각적 패턴을 거의 완벽한 정확도로 인식해야 합니다.
이러한 인식 기능에 필요한 실제 학습 데이터는 무엇일까요? 수백만 명의 사람들이 reCAPTCHA를 사용하여 라벨을 붙인 것인데, 이들은 자신이 라벨을 붙이고 있다는 사실조차 전혀 모르고 있습니다.
2024년 웨이모는 400만 건 이상의 유료 탑승 서비스를 완료했으며 현재 샌프란시스코, 로스앤젤레스, 피닉스에서 운영 중이고 지속적으로 확장하고 있습니다. 웨이모의 기업 가치는 450억 달러 입니다.
이 건물의 기초는 단지 이메일을 주고받기를 원했던 자유로운 인터넷 사용자들에 의해 세워졌습니다.
왜 아무도 이 모든 것을 재현할 수 없는 걸까요?
데이터 주석 작업은 비용이 엄청나게 많이 듭니다. Scale AI, Appen, Labelbox 같은 회사들은 바로 이 문제를 해결하기 위해 존재합니다. 이 회사들은 수십만 명의 직원을 고용하여 이미지에 주석을 달고, 때로는 시간당 1달러도 안 되는 임금을 지급합니다.
구글은 이 문제를 완전히 다른 방식으로 해결했습니다. 바로 라벨링을 의무화한 것입니다. 비용도, 동의도 필요 없었고, 모든 웹사이트 접속에 대한 "입장료"로 간주했습니다.
결과: 전 세계를 아우르는 수십억 장의 라벨링된 이미지, 다양한 기상 조건, 시간대, 그리고 지구상의 모든 도시를 포함합니다.
어떤 라벨링 회사도 그런 일을 할 수 없습니다. 인터넷 자체가 바로 그 공장이고, 그 안에 있는 모든 사람은 계약서에 서명한 적 없는 직원일 뿐입니다.
당신이 오늘날에도 여전히 하고 있는 일
2018년에 출시된 reCAPTCHA v3는 인증 절차를 전혀 보여주지 않습니다. 마우스 움직임, 페이지 스크롤 방식, 마우스 커서를 특정 위치에 올려놓는 시간 등을 관찰하여 사용자의 행동 패턴을 분석합니다. 이러한 행동 패턴을 통해 사용자가 사람인지 여부를 판단하는 것입니다.
이러한 행동 데이터는 구글의 AI 시스템에 다시 입력됩니다.
당신은 가입을 적극적으로 선택한 적이 없습니다. 가입 여부를 선택하는 체크박스 같은 것도 없었죠. 그런데도 지금 당신은 방문하는 대부분의 웹사이트에서 여전히 가입을 선택하고 있습니다.
이는 모든 사람에게 깊은 생각을 하게 만드는 아이러니입니다.
루이스 폰 안의 초기 아이디어는 천재적인 발상이었다. 인류가 쓸모없는 정보를 걸러내는 데 소모할 인지 에너지를 가치 있는 일, 즉 전 세계의 책을 디지털화하여 실질적인 문제를 해결하는 데 활용하자는 것이었다.
구글이 이 아이디어를 어떻게 적용했는지는 완전히 별개의 문제입니다.
그들은 사용자들이 선택의 여지가 없이 사용해야 했던 보안 메커니즘을 가져와 인터넷 전체에 배포했고, 그로 인해 수천억 달러에 달하는 상업용 제품을 만들어 이익을 거두었습니다.
사용자들은 아무것도 받지 못했고, 심지어 알 권리조차 없었다.
가장 아이러니한 점은 바로 이것입니다. 당신은 인공지능이 아직 수행할 수 없는 시각 인식 작업을 통해 수년간 자신이 인간임을 증명해 왔습니다. 그런데 인공지능이 이 기술을 습득하자, 인간의 시각 정보 주석 작업은 더 이상 필요 없어졌습니다.
당신은 스스로를 대체 가능한 존재로 만듦으로써 인간임을 증명했습니다.
출처: 카네기멜론대학교, 구글 블로그(2009), WebProNews, MakeUseOf, MIT Technology Review, 웨이모 공개 문서.

