OpenAI發佈LifeSciBench:衡量AI系統在真實科研場景中的能力

PANews 6月20日消息, OpenAI官方發布全新評測基準LifeSciBench,旨在衡量AI系統在真實科研場景中的能力。據悉,LifeSciBench基於750道專家編寫任務,覆蓋7類科研工作流與7個生物學領域,任務來源於173名具有博士背景並具備生物科技或製藥行業經驗的科研人員,該基準強調複雜科研能力評估,包括證據整合、實驗設計、數據分析、科學推理與科研溝通等能力,而非單一事實性問題。超過79%的任務包含多步驟推理,平均每道題需約4個推理步驟,並包含1,062個真實科研相關數據附件(如論文、圖表、序列數據及結構文件等)。

分享至:

作者:PA一线

本內容只為提供市場資訊,不構成投資建議。

關注PANews官方賬號,一起穿越牛熊
PANews APP
Axelar Network回應安全事件:漏洞源於第三方代幣合約「無限鑄造」問題
PANews 快訊