파운더스 펀드, 판테라, 프랭클린 템플턴이 센티언트의 "아레나"에 합류하여 기업용 AI 에이전트의 스트레스 테스트를 진행합니다.

Sentient는 전 세계의 개발자와 후원자(Founders Fund, Pantera, Franklin Templeton, alphaXiv, Fireworks, OpenRouter 등)를 모아 기업 AI의 추론 능력 격차를 해소하고자 합니다.

지난 2년간 기업들은 고객 서비스 및 백오피스 운영부터 재무 및 규정 준수와 같이 고도의 의사 결정이 필요한 프로세스에 이르기까지 실제 업무 흐름에 AI 에이전트를 통합하는 속도를 높여 왔습니다. 이러한 시스템이 실제 비즈니스 운영에 점점 더 많이 도입됨에 따라 새로운 문제가 발생하고 있습니다. 에이전트는 정보를 검색할 수는 있지만, 작업이 복잡하거나, 여러 단계를 거치거나, 위험도가 높은 경우 안정적이고 설명 가능하며 재현 가능한 추론 프로세스를 제공하는 데 어려움을 겪는 경우가 많습니다.

오늘, 오픈소스 AI 연구소인 센티언트(Sentient)는 전 세계 수천 명의 AI 개발자들이 기업이 직면한 가장 까다로운 추론 문제들을 스트레스 테스트하고 개선할 수 있는 실시간 운영 환경인 아레나(Arena)를 공식 출시했습니다. 아레나의 초기 참여 기관으로는 파운더스 펀드( Founders Fund), 판테라(Pantera), 그리고 1조 5천억 달러 이상의 자산을 운용하는 프랭클린 템플턴(Franklin Templeton)이 포함되어 있으며, 이는 기관 투자자들이 "배포 전 AI 에이전트의 체계적인 평가"에 대해 초기부터 분명한 관심을 보이고 있음을 나타냅니다.

프랭클린 템플턴 디지털 자산의 매니징 파트너인 줄리안 러브는 “기업들이 연구, 운영, 고객 대면 워크플로우에 AI 에이전트를 적용할 때, 이제 관건은 이러한 시스템이 충분히 견고한지 여부가 아니라 실제 워크플로우에서 얼마나 신뢰할 수 있는지 여부입니다.”라고 말했습니다. 러브는 또한 아레나와 같은 구조화된 환경이 업계가 “잠재적인 아이디어”와 “실제로 운영 환경에서 활용 가능한 기능”을 구분하는 데 도움이 될 것이라고 덧붙였습니다.

Sentient의 공동 창립자인 히만슈 티야기는 "AI 에이전트는 더 이상 기업 내 실험 단계에 머무르지 않고 고객, 자금 조달, 운영 성과에 영향을 미치는 핵심 프로세스에 투입되고 있습니다. 이러한 변화는 기준을 바꾸고 있습니다. 데모에서 시스템이 멋지게 보이는 것만으로는 충분하지 않습니다. 기업은 실제 운영 환경에서 실패 시 막대한 손실이 발생하고 신뢰가 취약한 상황에서도 에이전트가 안정적으로 추론할 수 있는지 알고 싶어 합니다. 기업은 비교 가능성, 반복성, 그리고 기본 모델이나 툴체인에 의존하지 않고 장기적으로 신뢰성 개선을 추적할 수 있는 방법을 필요로 합니다."라고 말했습니다.

Arena는 기업 워크플로의 실제 혼란 상황, 즉 불완전한 정보, 장황한 맥락, 모호한 지침, 상충되는 출처 등을 시뮬레이션합니다. Arena는 에이전트가 "정답"을 제공하는지 여부만 판단하는 것이 아니라, 전체 추론 과정을 기록하여 엔지니어링 팀이 실패 원인을 정확히 파악하고 개선 사항의 효과를 장기적으로 검증할 수 있도록 합니다.

이는 모델 및 기술 스택 전반에 걸쳐 추론 평가를 위한 중립적이고 벤더에 구애받지 않는 벤치마크를 제공합니다. Arena는 데모 성능보다는 실제 운영 환경에서의 성능에 중점을 두어 위험도가 높은 시나리오에도 적용 가능한 검증 가능한 에이전트 기능을 제공합니다. 기업은 이러한 기능을 자체 데이터 및 내부 도구로 마이그레이션할 수도 있습니다.

첫 번째 과제에서 Arena에 합류하는 개발자들은 기업 수준의 핵심 문제인 문서 추론에 집중하게 됩니다. AI 에이전트는 복잡하고 비정형적인 데이터를 기반으로 추론하고 연산을 수행해야 하는데, 이러한 작업은 재무 분석, 근본 원인 분석, 투자 설명서 작성, 고객 서비스 등 다양한 시나리오의 기반이 됩니다.

초기 단계 참여 업체로는 alphaXiv, Fireworks, OpenHands, OpenRouter 등이 있으며, Arena가 다양한 작업, 산업 및 모델에 걸쳐 통합을 확장함에 따라 더 많은 업체가 참여할 것으로 예상됩니다.

최근 연구 결과는 Arena가 해결하고자 하는 격차를 명확히 보여줍니다. 기업의 85%가 "에이전트 기반 기업"이 되기를 희망했고, 거의 4분의 3이 자율 에이전트를 배포할 계획이었지만, 실제로 성숙한 거버넌스 시스템을 갖춘 기업은 4분의 1에도 미치지 못했습니다. 많은 기업이 파일럿 프로젝트를 대규모 프로덕션 배포로 확장하는 데 어려움을 겪었습니다. 평균적으로 기업들은 이미 12개 정도의 에이전트를 운영하고 있으며, 이들은 대개 서로 다른 시나리오에 분산되어 있습니다. 많은 기업들은 더 나은 오케스트레이션 및 협업 기능 없이는 에이전트를 추가하는 것은 복잡성만 증가시키고 가치를 감소시킬 뿐이라고 생각합니다.

오픈핸즈의 최고 과학 책임자이자 공동 창립자인 그레이엄 뉴빅은 “오픈핸즈는 항상 개발자들이 에이전트를 활용하여 실제적이고 실용적인 문제를 해결할 수 있도록 지원하는 데 주력해 왔습니다.”라고 말하며, “참가자들이 오픈핸즈 소프트웨어 에이전트 SDK를 사용하여 이러한 복잡한 과제를 해결할 수 있도록 지원하게 되어 기쁩니다.”라고 덧붙였습니다.

OpenRouter의 공동 창립자 겸 CEO인 Alex Atallah는 "Arena는 오픈 소스 AI를 발전시키는 데 필수적인 프로그램입니다. 연구자들이 개방적인 환경에서 경쟁하고, 반복하고, 혁신할 수 있도록 지원합니다. Sentient와의 협력을 강화하고 실험을 더욱 빠르고 쉽게 확장할 수 있는 인프라를 제공할 수 있기를 기대합니다."라고 말했습니다.

Arena는 전 세계적으로 출시될 예정이며, 수천 명의 AI 개발자들이 초기 참여 대기열에 지원하도록 초대할 것입니다. 또한 2026년 3월부터 샌프란시스코에서 오프라인 이벤트를 개최할 예정입니다.

편집자 참고 사항:

  1. 프랭클린 템플턴 디지털 자산의 매니징 파트너인 줄리안 러브는 "기업들이 AI 에이전트를 연구, 운영 및 고객 워크플로에 적용할 때, 이러한 시스템이 강력한지 또는 해답을 생성할 수 있는지 여부가 아니라 실제 워크플로에서 얼마나 신뢰할 수 있는지 여부가 관건입니다. 아레나와 같은 샌드박스 환경을 통해 에이전트를 실제 복잡한 워크플로에서 테스트하고 추론 과정을 검증할 수 있습니다. 이는 생태계가 유망한 아이디어와 실제 활용 가능한 기능을 구분하고 기술 통합 및 확장에 대한 확신을 높이는 데 도움이 될 것입니다."라고 말했습니다.

  2. OpenRouter의 공동 창립자 겸 CEO인 Alex Atallah는 "Arena는 오픈 소스 AI를 발전시키는 데 필수적인 이니셔티브입니다. 연구자들이 개방된 환경에서 경쟁하고, 반복하고, 혁신할 수 있도록 지원합니다. Sentient와의 협력을 강화하고 실험을 더욱 빠르고 쉽게 확장할 수 있는 인프라를 제공할 수 있기를 기대합니다!"라고 말했습니다.

  3. "OpenHands는 항상 개발자들이 에이전트를 활용하여 실제적이고 실용적인 문제를 해결할 수 있도록 적극적으로 지원해 왔습니다."라고 OpenHands의 최고 과학 책임자이자 공동 창립자인 Graham Neubig는 말했습니다. "또한 참가자들이 OpenHands 소프트웨어 에이전트 SDK를 사용하여 이러한 복잡한 과제를 해결할 수 있도록 지원하게 되어 기쁩니다."

센티언트 랩스 소개

센티언트 랩스 는 오픈소스 AI 발전을 선도하는 기술 연구 및 제품 개발 조직입니다. 센티언트 재단의 혁신 엔진으로서, 센티언트 랩스는 AI 추론, 정렬 및 에이전트 협업 분야에서 최첨단 연구를 수행합니다. 센티언트는 ROMA와 같은 고성능 프레임워크와 Dobby와 같은 오픈소스 모델의 핵심 개발사입니다. 센티언트의 목표는 오픈소스 AI를 "실험" 단계에서 "필수" 단계로 끌어올리는 것입니다. 견고하고 구성 가능한 에이전트 시스템 구축을 위한 인프라를 제공함으로써, 센티언트는 개발자들이 오픈소스 도구를 상용화하고 기업 수준의 가용성을 확보할 수 있도록 지원합니다. 센티언트는 전 세계적으로 미션 크리티컬 AI 운영의 기본 표준으로 오픈소스를 정착시키는 데 전념하고 있습니다.

공유하기:

작성자: 项目动态

이 글은 PANews 입주 칼럼니스트의 관점으로, PANews의 입장을 대표하지 않으며 법적 책임을 지지 않습니다.

글 및 관점은 투자 조언을 구성하지 않습니다

이미지 출처: 项目动态. 권리 침해가 있을 경우 저자에게 삭제를 요청해 주세요.

PANews 공식 계정을 팔로우하고 함께 상승장과 하락장을 헤쳐나가세요