a16z領投3,300萬美元種子輪，Yupp如何基於區塊鏈與激勵重塑AI評估模式？

作者：ShenZhen，PANews

編輯：Zen，PANews

隨著AI應用深入各行各業，如何精確評估模型效能與提升用戶信任成了當下亟待解決的難題。傳統評測多依賴集中化機制，既難以涵蓋多樣化場景，也無法反映真實使用者偏好；同時，模型「幻覺」問題頻出，使用者在選擇時常陷入資訊繭房。

在這一背景下，Yupp作為一個新晉平台，憑藉其獨特的眾包模式和激勵機制，正試圖重塑AI模型的發現、比較與使用方式，並為AI評估領域帶來一場範式變革。本文將深入剖析Yupp的核心機制、技術亮點、團隊背景及其對AI生態的潛在影響。

團隊背景與融資：科技巨頭經驗加持

Yupp立足於解決AI領域長期存在的評估難題，致力於建構一個「去信任」（trustless）的AI回饋市場－讓多元化的用戶回饋在區塊鏈和加密經濟激勵的保障下自由流通，從而形成一個可擴展、公平且透明的模型評估層。透過對高品質人工標註資料的激勵分發，Yupp可以及時捕捉真實用戶在不同場景下的需求和偏好，幫助AI開發者以迭代的方式優化模型效能。

此計畫由Pankaj Gupta（共同創辦人兼CEO）和Gilad Mishne（共同創辦人兼AI負責人）於2024年6月創立，首席科學家Jimmy Lin（滑鐵盧大學教授）亦參與核心團隊。三人早在2010年於Twitter共事，曾打造並優化大規模推薦與搜尋系統，後來在Google和Coinbase累積了豐富經驗。

因去中心化、資料價值透明化的願景能夠切中AI廠商對可信評估和用戶參與的雙重訴求，以及得益於核心團隊的豐富履歷，Yupp贏得了科技行業知名人士和頂級風投的高度認可。

上週，Yupp宣布完成3,300萬美元種子輪融資，A16z合夥人Chris Dixon領投，其他投資方還包括Google首席科學家Jeff Dean、Twitter聯合創始人Biz Stone、Pinterest聯合創始人Evan Sharp、Perplexity CEO Aravind Srinivas、史丹佛大學Dan Boneh、Chris Re、Nick McKeown和Balaji Praa、Balaji等高管。

核心功能與使用者體驗：建構“AI議會”

作為一個中心化的AI評估平台，Yupp秉持「人人共享的AI（Every AI for everyone）」理念，讓使用者輕鬆發現、比較並使用最新的AI模型。與傳統單一回應不同，Yupp針對每個提示同時返回兩個（乃至更多）模型的答案，形成一個「AI議會」。這種設計不僅滿足了使用者對多樣化選擇的需求，更能有效甄別模型可能出現的“幻覺”，幫助使用者透過對比做出更明智的決策。正如Yupp CEO Pankaj Gupta所言，並排輸出對於關註生成錯誤的用戶尤其有益，因為他們可以藉此交叉驗證結果。

平台現已支援逾500款AI模型，涵蓋文字與圖像生成領域，包括ChatGPT、Claude、Gemini、DeepSeek、Grok、Llama等知名模型，以及許多新興模型。為進一步優化體驗，Yupp還推出了「QuickTake」功能，可將冗長回應提煉為一條簡潔的推文。

此外，Yupp高度重視使用者隱私：所有聊天記錄預設私密，除非使用者主動公開；即使公開分享，也不透漏任何個人資訊。用戶可隨時控制分享內容及範圍。

經濟模型與誘因機制：數據勞動價值化

Yupp將免費使用與用戶回饋結合，透過「Yupp積分」系統衡量模型使用。新用戶註冊秒獲5000積分，後續可透過對模型回覆評分、選擇偏好並闡述理由來賺取更多積分。回饋品質越高，獎勵越豐厚，確保用戶可持續免費使用包括Claude Opus 4或OpenAI o3等高階模型。平台承諾，積分只增不減，且目前所有模式皆能免費體驗。

每次提問後，用戶會獲得兩份模型回答，並透過回饋贏取“數字刮刮卡”，獎勵0~250不等的Yupp積分。每1000點可兌換1美元，用戶每日最高可提領10美元、月最高50美元。積分支持兌換美元、歐元等20餘種貨幣，合作夥伴包括Stripe、PayPal、Coinbase。同時，平台整合了Base Ethernet L2和Solana穩定幣，為全球用戶提供即時、免手續費的獎勵。

正如Pankaj Gupta所說，使用者產生的高品質回饋對於AI公司的模式微調與強化學習價值遠遠超過獎勵本身。雖然用戶每月收益或僅相當於幾杯咖啡，但這些付費標註數據對AI迭代至關重要。

為激勵更多人參與，Yupp也設立推薦獎勵：推薦人獲5000積分，被推薦人獲1000積分；目前新註冊用戶可獲5000積分，被推薦人額外獲得2500積分。

Yupp VIBE評分：AI評估的新範式

針對現有排行榜透明度不足、公平性欠缺、評估數據獲取不均等問題，Yupp推出了測試版AI排行榜和「Yupp VIBE (Vibe Intelligence Benchmark) Score」評分系統。該系統匯集全球用戶在自然互動中產生的偏好數據，力求提供穩健且可信賴的評估結果。

Yupp的評估原則包括：

穩健性（Robust）：保證代表性（涵蓋多元場景）、真實性（反映使用者關切）、抗作弊性（抵禦惡意行為）；
可信賴性（Trustworthy）：公平中立（對模型不偏不倚）、透明公開（詳細揭露排名演算法）、嚴謹科學（遵循評估規範）。

平台不僅收集二元偏好，也鼓勵使用者指出回覆的優缺點（如「切中要害」、「速度快」、「風格佳」等），並依照使用者的年齡、教育、職業等資訊進行分組分析，展現不同群體的偏好差異。

在技術層面，Yupp正在探索利用區塊鏈、密碼學原語及零知識證明等技術，確保評估過程的公正、透明和可驗證。同時，平台已與專業AI資料提供者合作，透過檔案驗證和多層品質檢測校準評分員，清除惡意資料。

近期名單已更新，展示了GPT‑4.5 Preview、Claude Opus 4、Claude Sonnet 4等模型的VIBE得分及其勝率、不喜歡率、速度、延遲、上下文視窗和成本指標。

發展歷程與未來展望

Yupp於2025年6月13日正式上線，前期進行了六個月內部測試。自上線以來，產品持續迭代：

多模態支援：接取Dall‑E、Flux、Stable Diffusion、Luma Photon、Google Imagen 4等模型，並支援使用者上傳影像/PDF提問；
互動方式拓展：新增語音輸入與語音朗讀功能；
模型更新：陸續引入DeepSeek R1/V3、Mistral Small 3、OpenAI o3‑pro、Hermes 3、Amazon Nova Pro v1、Microsoft Phi系列及「MAX模型」類別；
即時資訊：將線上查詢要求路由至Perplexity和Google Gemini Live，並附帶超連結引用；
支付升級：新增美國PayPal、Venmo提現及24種貨幣PayPal支援；
分享匯出：支援格式保留的複製、PDF/文字/Markdown匯出，按需分享單一回覆或整段對話；
社群活動：舉辦「AI提示挑戰賽」等活動，獎品最高可達數萬積分；新增個人資料頁、AI自動產生的聊天名稱等功能。

Yupp的使命是「賦能人類塑造AI的未來」。 Pankaj Gupta認為，AI發展需要每個人的參與與貢獻。透過多視角AI回應與使用者回饋，Yupp不僅協助使用者更好決策，也為AI進化提供源源不絕的動力。

值得一提的是，Yupp的主要競爭對手之一是開放AI模型評測平台LMArena（網址：https://lmarena.ai/），該網站在AI業內人士中非常受歡迎，但該平台目前正處於商業化探索階段，並沒有借用區塊鏈技術對用戶參與提供直接的物質獎勵或積分激勵機制。

總的來說，Yupp以眾包模式、激勵機制與真實使用者偏好驅動的評估系統，開啟了AI評估的新路徑。它不僅為用戶提供免費、多元的AI互動體驗，更將用戶回饋轉化為高價值訓練數據，推動模型持續優化。憑藉著經驗豐富的團隊和頂級資本加持，Yupp有望在未來AI生態中扮演關鍵角色，實現「人人皆享AI，人人塑造AI」的願景。

然而，對於剛上線的Yupp而言，如何在大規模用戶參與下，持續確保資料品質、抵禦潛在的作弊行為，以及在商業化與用戶激勵之間取得平衡，仍將是其未來發展中需要不斷探索和優化的方向。