ジェネレーティブスピーチの次の時代

マーズ8の紹介

MARS8はプロダクショングレードの音声読み上げモデルのファミリーで、数百万人が聴いている場合でも、あらゆるユースケース、言語、音声プロファイルが同じ確かな信頼性を得られるように構築されています。

すべてのトップコンピューティングプラットフォームでネイティブに起動
ニュースとメディア
違いを聞いてみよう

ライブレディボイス vs その他すべて

ほとんどの音声合成モデルは、会話デモ用に構築されています。MARS8 は、タイミング、感情、明快さが欠かすことのできない瞬間を想定して作られています。
TTSバトルグラウンドでテスト
「わくわくする」ことで痛みを感じるようになり、その瞬間、痛みや痛みがひどく感じられます。しかし、私たちの激しい運動は、私たちの労力を犠牲にしても、とても嬉しい結果です(笑)。
「わくわくする」ことで痛みを感じるようになり、その瞬間、痛みや痛みがひどく感じられます。しかし、私たちの激しい運動は、私たちの労力を犠牲にしても、とても嬉しい結果です(笑)。
タイトル 2
CAMB.AI と Broadcom は、世界規模向けに設計された、何百万台もの次世代デバイスに、超高速で超プライベートな音声と多言語 AI を提供します。
もっと読む →
5x
指標名
2x
指標名
タイトル 3
CAMB.AI と Broadcom は、世界規模向けに設計された、何百万台もの次世代デバイスに、超高速で超プライベートな音声と多言語 AI を提供します。
もっと読む →
5x
指標名
2x
指標名
タイトル 4
CAMB.AI と Broadcom は、世界規模向けに設計された、何百万台もの次世代デバイスに、超高速で超プライベートな音声と多言語 AI を提供します。
もっと読む →
5x
指標名
2x
指標名
「わくわくする」ことで痛みを感じるようになり、その瞬間、痛みや痛みがひどく感じられます。しかし、私たちの激しい運動は、私たちの労力を犠牲にしても、とても嬉しい結果です(笑)。
「わくわくする」ことで痛みを感じるようになり、その瞬間、痛みや痛みがひどく感じられます。しかし、私たちの激しい運動は、私たちの労力を犠牲にしても、とても嬉しい結果です(笑)。
タイトル 2
CAMB.AI と Broadcom は、世界規模向けに設計された、何百万台もの次世代デバイスに、超高速で超プライベートな音声と多言語 AI を提供します。
もっと読む →
5x
指標名
2x
指標名
タイトル 3
CAMB.AI と Broadcom は、世界規模向けに設計された、何百万台もの次世代デバイスに、超高速で超プライベートな音声と多言語 AI を提供します。
もっと読む →
5x
指標名
2x
指標名
タイトル 4
CAMB.AI と Broadcom は、世界規模向けに設計された、何百万台もの次世代デバイスに、超高速で超プライベートな音声と多言語 AI を提供します。
もっと読む →
5x
指標名
2x
指標名
世界初のTTSモデルファミリー

MARS8 ファミリー
各ユースケースに特化したモデル

リサーチブログの投稿全文を読む →
マーズ・フラッシュ
会話型 AI エージェント向けの低遅延多言語 TTS
パラメーター:600M
当社の API で試してみてください
ユースケース:
リアルタイム音声エージェント
コンタクトセンター
ライブ会話型 AI
マーズ・プロ
スピードだけでなく感情的なリアリズムも重要な用途に適しています。
パラメーター:600M
当社の API で試してみてください
ユースケース:
表現力豊かな吹き替え
オーディオブック
デジタルメディア
マーズ・インストラクト
話者のアイデンティティに関係なく、感情、タイミング、スタイルをきめ細かく制御できます。
パラメーター:1.2B
当社の API で試してみてください
ユースケース:
映画とテレビの吹き替え
正確なプロソディコントロール
クリエイティブ編集ワークフロー
マーズ・ナノ
メモリとコンピューティングには制約があるが、生産品質は依然として重要な場合。
パラメーター:50M
ユースケース:
自動車システム
組み込みデバイス
エッジデプロイ
マーズ8 ファミリー
ベンチマーク結果

TTS における新しいベースラインの再定義

ベンチマークを自分で実行 →
PQ ↑

MetaのAudiobox‑Aestheticsモデルによって予測された、1〜10のスケールでのオピニオン平均スコアの概算値。PQが高いほど制作品質が高いことを示します。

WavLM とコサインの類似性↑

wavlm-base-sv埋め込みモデルを使用して、生成されたオーディオと参照オーディオの間の平均コサイン類似度として測定されたスピーカー類似度メトリック。

CAM++ コサイン類似度↑

CAM++ 埋め込みモデルを使用して、生成されたオーディオと参照オーディオの間の平均コサイン類似度として測定されたスピーカー類似度メトリック。

エース↑

MetaのAudiobox‑Aestheticsモデルによって予測された、1〜10のスケールでのオピニオン平均スコアの概算値。CEが高いほど、コンテンツをより楽しむことができます。

エイサー ↓

Whisper ASRで測定した、生成された出力で正しくない文字の割合。

マーズ・エイト・プロ
火星8号フラッシュ
ソニック3
スピーチ-2.6-HD
多言語_v2
マルチリンガル_v3
7.4498
7.4523
6.9471
6.9468
7.4516
7.1934
0.8676
0.8666
0.8420
0.8666
0.8109
0.8253
0.7097
0.7066
0.5134
0.5878
0.3912
0.336
5.4308
5.4299
5.0445
4.9877
5.4146
5.1816
5.77%
5.67%
8.54%
11.30%
4.39%
14.62%
生産経済学

デモウェアから実際のプロダクション環境へと導く音声AI。

音声システムは、規模が大きくなると動作が大きく異なります。レイテンシー予算が厳しくなり、使用量が急増し、コンプライアンスが導入されると、アーキテクチャ上の決定が結果を左右し始めます。MARS8 は API の利便性のためではなく、こうした現実世界の制約を考慮して構築されています。

世界の 99% の言語サポート

グローバル言語対応

MARS8は、視聴者の話し方や聞き方をネイティブに把握しながら、世界の 99% をカバーできる多言語バックボーンです。
英語
ヒンディー語 (インド)
フランス語 (フランス)
スペイン語 (スペイン)
ドイツ人
日本人
モダンスタンダードアラビア語
韓国語
中国語 (簡体字)
イタリアの
スペイン語 (メキシコ)
ポルトガル語 (ポルトガル)
ポルトガル語 (ブラジル)
インドネシア人
オランダの
ロシア人
アラビア語 (サウジアラビア)
タミル語
テルグ語
ベンガル語 (インド)
アラビア語 (エジプト)
アラビア語 (シリア)
アラビア語 (モロッコ)
マラーティー語
カンナダ語
ベンガル語 (バングラデシュ)
アッサム語
マラヤーラム語
フランス語 (カナダ)
ポーランド語
トルコ語

技術的な詳細を知りたいですか?

MARS8のアーキテクチャ、導入パターン、およびパフォーマンス特性の詳細については、ブログの技術記事全文をご覧ください。

構築、拡張、またはパートナーシップ
あなたの条件で
MARS8は、スタートアップ、企業、インフラストラクチャプロバイダーにまたがって拡張できるように設計されています。

製品を開発する場合でも、他のユーザーに開発を許可する場合でも、すぐに始められます。