小米開源覆蓋600多語言的語音克隆TTS模型OmniVoice | PANews

小米開源覆蓋600多語言的語音克隆TTS模型OmniVoice

PANews 5月7日訊息，小米AI實驗室推出多語言語音克隆TTS模型OmniVoice，採用單一雙向Transformer極簡架構，支援646種語言語音合成，在中英文場景的合成品質和推理速度優於主流模型。該模型基於約58萬小時、50個開源資料集訓練，對低資源語種使用動態上採樣策略，在24種與102種語言測試中語音相似度和可懂度超越多款商用系統，部分指標接近甚至優於真實語音。 OmniVoice支援跨語言語音複製、自訂音色、帶噪參考音訊適配、副語言控制和發音糾錯，並已在Github和Huggingface等平台開源訓練、推理程式碼及模型權重。

分享至：

作者：PA一线

本內容只為提供市場資訊，不構成投資建議。

關注PANews官方賬號，一起穿越牛熊

PANews微信群

Telegram交流群

Telegram資訊頻道

推薦閱讀

PA一线

4 小時前

沃勒定調週二CPI含金量：通膨火熱將支持近期升息

PA一线

4 小時前

聯準會理事沃勒：若本週核心通膨再次出現高位數據，聯準會將需要考慮近期升息

PA一线

4 小時前

比特幣礦企Hut 8將於8月4日公佈2026年第二季度財報

PA一线

4 小時前

數據：Robinhood Chain上線首週已吸引31億美元DEX交易量

PA一线

5 小時前

谷歌向輝達腹地發起進攻：TPU正式瞄準AI晶片市場霸主地位

PA一线

5 小時前

分析：美伊局勢點燃避險情緒，比特幣承壓逼近6.2萬美元

相關專題

Web3新人科普：零基礎如何入門？

區塊鏈、比特幣、NFT一頭霧水？別慌！從錢包註冊到防騙指南，手把帶你拆解Web3核心概念，踏出入門第一步。

142篇文章

从银幕到街头，人形机器人落地大战开打

从银幕中的科幻角色，到街头巷尾的现实身影，人形机器人正以惊人速度冲出实验室，掀起一场全球产业落地大战。

21篇文章

AI Agent的N个平行世界

一个属于Agent的平行经济，正在悄无声息地成形。

177篇文章

熱搜:比特幣以太坊穩定幣預測市場川普 RWA USDT DeFi AI 聯準會主席

熱門文章

世界盃出局第 15 天，韓國國運股崩了

狂攬188億美金融資，AI人才湧向具身智能「新賭局」

PA日報 | 霍爾木茲海峽再度被關閉；Robinhood Chain上線10天總交易筆數超3872萬筆

對話Multicoin合夥人：加密市場已觸底，本輪週期看好三種加密貨幣

華爾街早報：美股期指齊跌，警惕SK海力士引發存儲踩踏，美股財報季開啟

华尔街早报

行業要聞

市場熱點

精選讀物

PANews APP

24小時追蹤區塊鏈行業資訊，行業深度文章解析。

下載 PANews App

App Store Google Play

美股三大指數集體收跌，加密概念股普跌

PANews 快訊42 分鐘前