PANews 6월 20일 소식, OpenAI가 실제 연구 현장에서 AI 시스템의 능력을 측정하기 위한 새로운 평가 벤치마크 LifeSciBench를 공식 발표했다. LifeSciBench는 750개의 전문가 작성 과제를 기반으로 하며, 7개 연구 워크플로우와 7개 생물학 분야를 포괄한다. 과제는 박사 학위를 보유하고 바이오테크 또는 제약 산업 경험이 있는 173명의 연구자로부터 수집되었으며, 이 벤치마크는 단순한 사실 확인 문제가 아닌 증거 통합, 실험 설계, 데이터 분석, 과학적 추론 및 연구 커뮤니케이션 등 복합적인 연구 역량 평가를 강조한다. 과제의 79% 이상이 다단계 추론을 포함하며, 과제당 평균 약 4단계의 추론이 필요하고, 논문, 차트, 시퀀스 데이터 및 구조 파일 등 실제 연구 관련 데이터 첨부 파일 1,062개가 포함되어 있다.
OpenAI, LifeSciBench 출시: 실제 연구 환경에서 AI 시스템의 능력 측정
공유하기:
작성자: PA一线
이 내용은 시장 정보 제공만을 목적으로 하며, 투자 조언을 구성하지 않습니다.
PANews 공식 계정을 팔로우하고 함께 상승장과 하락장을 헤쳐나가세요
추천 읽기
PANews 앱
24시간 블록체인 업계 소식을 추적하고 심층 기사를 분석합니다.


