Xiaomiは、600以上の言語に対応した音声クローン技術であるOmniVoiceをオープンソース化した。 | PANews

Xiaomiは、600以上の言語に対応した音声クローン技術であるOmniVoiceをオープンソース化した。

PANewsは5月7日、Xiaomi AI Labsが多言語音声クローニングTTSモデル「OmniVoice」を発表したと報じた。ミニマルなシングル双方向Transformerアーキテクチャを採用したこのモデルは、646言語での音声合成をサポートし、中国語と英語の両方のシナリオにおいて、合成品質と推論速度の両面で主流モデルを凌駕している。50のオープンソースデータセットから約58万時間分のデータで学習されたこのモデルは、リソースの少ない言語に対して動的なアップサンプリング戦略を採用している。24言語と102言語でのテストでは、音声類似性と明瞭度が多くの商用システムを上回り、一部の指標では実際の音声に匹敵するか、あるいはそれを上回っている。OmniVoiceは、クロス言語音声クローニング、カスタム音色、ノイズのある参照音声の適応、サブ言語制御、発音補正をサポートしている。トレーニングおよび推論コード、ならびにモデルの重みは、GitHubやHuggingfaceなどのプラットフォームでオープンソースとして公開されています。

原文リンク

共有先：

著者：PA一线

この内容は市場情報の提供のみを目的としており、投資助言を構成しません。

PANews公式アカウントをフォローして、強気・弱気相場を一緒に乗り越えましょう

PANews WeChatグループ

Telegram交流グループ

Telegram情報チャンネル

おすすめ記事

PA一线

30 分前

米国株の評価額はドットコムバブルのピークに近づいており、シラー株価収益率は42.18に上昇している。

新智元

1 時間前

初日に108％の急上昇！2026年最大のAIダークホースが登場し、ウルトラマンが再び巨額の富を築き上げた。

PA一线

1 時間前

Hyperliquidが仮想通貨市場を牽引し、アルトコインはビットコインを上回るパフォーマンスを見せている。

PA一线

2 時間前

TRONの取引総額が140億件を突破

PA一线

2 時間前

ブルームバーグ：AIによるハッキングの脅威が、1300億ドル規模のDeFi業界を危機的状況に追い込んでいる。

168X

2 時間前

ゴールドマン・サックスの元FICC幹部へのインタビュー：半導体不足は追いつこうとしている企業にとって有利に働く！光モジュールはできるだけ多く購入しよう！

関連トピック

先駆者の視点：暗号通貨業界の有名人のインタビュー

暗号通貨業界の有名人との単独インタビューを通じて、ユニークな観察と洞察を共有します。

151件の記事

ミムコインスーパーサイクル：興味のあるトークン化によって引き起こされた熱風

単純なユーモア現象から数十億ドル規模の産業に成長したミミコインは、暗号通貨市場の重要な要素となりました。これらのミミコインスーパーサイクルでは、私たちはどのように機会を捉えることができますか？

34件の記事

Web3の初心者のための知識: ゼロファンデーションから始める方法か。

ブロックチェーン、ビットコイン、NFTが混乱していますか？心配しないでください！ウォレット登録から詐欺防止ガイドまで、Web3の核心概念をお知らせし始めるための第一歩を踏み出すようお手伝いします。

136件の記事

人気検索:ビットコインイーサリアムステーブルコイン予測市場トランプ RWA USDT DeFi AI 連邦準備制度理事会議長

人気記事

a16zは、米国中間選挙における最大の資金提供者です。

稳定币怎么买美股？五大平台深度横评

从Gas Limit到Keyed Nonces，如何理解以太坊可扩展性的下一站？

半导体世纪：2026 AI狂飙下的投资路线图

ケビン・ウォーシュ氏が連邦準備制度理事会議長の「選ばれし者」と見なされているのはなぜか？今後6ヶ月間の政策が極めて重要となる。

業界ニュース

市場ホットスポット

厳選読み物

購読をクリック

PANewsアプリ

24時間ブロックチェーン業界情報を追跡し、深掘り記事を解析。

PANewsアプリをダウンロード

App Store Google Play

Strategy社は、発行済み債券のうち13億8000万ドル相当を買い戻した。

PANews 速報9 分前