PANews 1月5日消息,隨著2026 年的到來,AI 安全領域迎來了首個重量級基準測試。 LISABench 今日宣布啟動2026 第一季評估,旨在透過實戰測試,決出在Web3 智能合約漏洞檢測領域表現最強的前沿AI 模型。此外,LISABench同步開展了社區投票預測的獎勵活動。
本次評測陣容豪華,集結了KIMI K2 (Moonshot AI)、DeepSeek V3.2 (深度求索)、QWen 3 30b-a3b (阿里雲)、GLM 4.6 (智譜AI)、GPT-5.2 (OpenAI)、Gemini-3-pro-preview (Google) 全球最尖/55753-pro-prot.大前沿模型(Frontier Models) 同台競技。
目前,針對Q1 季度獲勝者的預測投票通道已經開啟。同時,LISABench 的評測標準程式碼庫已在GitHub 開源,供開發者查閱和重現。
