TEXT ZU SPRACHE

Text-to-Speech in Produktionsqualität für jedes Gerät, jede Sprache

Die MARS8-Modellfamilie von CAMB.AI bietet natürliche, ausdrucksstarke Sprachsynthese in über 150 Sprachen, mit speziellen Modellen für Konversation in Echtzeit, Inhaltsproduktion und Bereitstellung auf dem Gerät.

WARUM CAMB.AI

Was macht CAMB.AI Text-to-Speech anders?

Text-to-Speech von CAMB.AI wandelt geschriebenen Text in natürliche, menschlich klingende Sprache in über 150 Sprachen um und deckt damit 99% der weltweit sprechenden Bevölkerung ab. MARS8 ist die erste serienreife TTS-Modellfamilie mit speziell für unterschiedliche Anwendungsfälle entwickelten Modellen. Jedes Modell ist für ein bestimmtes Gleichgewicht zwischen Latenz, Genauigkeit und Bereitstellungsanforderungen optimiert. MARS-Pro erreicht eine WavLM-Lautsprecherähnlichkeit von 0,87 und eine CAM-Ähnlichkeit von 0,71. Dies entspricht einer Verbesserung von 38% gegenüber dem nächstgelegenen Mitbewerber. Dies wurde anhand des MAMBA-Benchmarks, dem Open-Source-Bewertungsframework von CAMB.AI für TTS-Modelle, gemessen.

Die wichtigsten Funktionen

Wichtige Text-to-Speech-Funktionen

P: falls erforderlich
Natürliche Sprache in über 150 Sprachen
Sprachen der Premiumklasse (Englisch, Hindi, Französisch, Spanisch, Deutsch, Japanisch, Arabisch, Koreanisch, Chinesisch, Italienisch, Portugiesisch, Indonesisch, Niederländisch) werden anhand von über 10.000 Stunden an Daten trainiert.
Klonen von Stimmen
Klonen Sie die Stimme eines beliebigen Sprechers aus einem kurzen Referenzbeispiel und reproduzieren Sie sie sprachübergreifend. MarsPro bietet eine Sprecherähnlichkeit von 0,87 WavLM.
Emotions- und Prosodiekontrolle
MARS-Instruct (1.2B-Parameter) bietet Emotionskontrollen auf Direktorenebene für präzise emotionale Übertragung, Tempo und Betonung.
Bereitstellung auf dem Gerät
Mars-Nano ist auf 12 Milliarden Geräten einsetzbar, darunter Smartphones, Automobilsysteme, Ohrhörer und IoT-Hardware. Kein Internet erforderlich.
FÄHIGKEITEN
BRANCHEN

Für wen ist Text-to-Speech konzipiert?

P: falls erforderlich
Technologieunternehmen und Plattformentwickler
Entwicklungsteams, die sprachgestützte Anwendungen, Konversationsschnittstellen und mehrsprachige Benutzererlebnisse entwickeln.
KATZE →
OEMs und Gerätehersteller
Hardwareunternehmen, die Sprache in Smartphones, Automobilsysteme, Ohrhörer, Smart-Home-Geräte und Wearables einbetten.
KATZE →
Unternehmensorganisationen
Globale Unternehmen, die mehrsprachige Sprachfunktionen für Schulungsinhalte, IVR-Systeme und Support-Workflows mit Kundenkontakt benötigen.
KATZE →
ANWENDUNGSFÄLLE

Text-to-Speech in Aktion

p: falls erforderlich
Sprachsysteme für die Automobilindustrie
Integrieren Sie Navigationsanweisungen und Assistenten im Auto mit dem auf dem Gerät integrierten TTS von MarsNano, ohne dass eine Mobilfunkverbindung erforderlich ist.
5x
Name der Metrik
2 x
Name der Metrik
Inhalt, Erzählung und Voiceover
Generieren Sie mehrsprachige Voiceovers für Produktdemos, Schulungsmaterialien und Marketinginhalte mithilfe des Sprachklonens von MarsPro.
5x
Name der Metrik
2 x
Name der Metrik
IVR und Telekommunikationsautomatisierung
Ersetzen Sie statische Aufzeichnungen durch dynamisches, mehrsprachiges TTS. Erschließen Sie sich neue Märkte, indem Sie Sprachen hinzufügen, ohne die Aufnahme erneut vornehmen zu müssen.
5x
Name der Metrik
2 x
Name der Metrik
IoT und tragbare Geräte
Fügen Sie mithilfe des 50M-Parameter-Modells von MARS-Nano Sprachausgabe zu Geräten mit eingeschränkten Ressourcen hinzu.
5x
Name der Metrik
2 x
Name der Metrik
Konversations-KI und Sprachagenten
Unterstützen Sie Kundenservice-Bots und Sprachassistenten mit dem 100-Ms-TTFB von MarsFlash in über 150 Sprachen.
5x
Name der Metrik
2 x
Name der Metrik
WIE ES FUNKTIONIERT

In vier Schritten vom Text zur Sprache

SCHRITT 1
Wähle dein Modell
MARS-Flash für Echtzeit (100 ms TTFB). MARS-Pro für Inhalte in Produktionsqualität (0,87 Sprecherähnlichkeit). MARS-Instruct für emotionsgesteuerte Ausgabe. MARS-Nano für das Gerät (50 ms TTFB, 50 M Parameter).
SCHRITT 2
Über API integrieren
Stellen Sie eine Verbindung zur TTS-API von CAMB.AI her, übergeben Sie die Texteingabe, wählen Sie eine Zielsprache aus (über 150 verfügbar) und stellen Sie optional ein Sprachreferenzbeispiel zum Klonen bereit.
SCHRITT 3
Sprache und Sprache konfigurieren
Wählen Sie aus der Sprachbibliothek oder klonen Sie eine benutzerdefinierte Stimme aus einem kurzen Referenzbeispiel. Verwenden Sie Wörterbücher, um die Aussprache markenspezifischer Begriffe zu kontrollieren.
SCHRITT 4
Bereitstellen und Skalieren
Stellen Sie cloudbasiertes TTS per API für Web- und Serveranwendungen bereit oder verpacken Sie MARS-Nano für die Integration auf dem Gerät. Skalieren Sie sprachübergreifend, ohne erneut aufnehmen zu müssen.
FAQs

Häufig gestellte Fragen

Was ist der Unterschied zwischen MARS8-Modellen?
MARS-Flash (600 M Parameter, 100 ms TTFB) für Konversations-KI in Echtzeit. MARS-Pro (600 M Parameter, 800 ms bis 2 s TTFB) für die Produktion von Inhalten. MARS-Instruct (1.2B-Parameter) für Emotionskontrollen auf Direktorenebene. MARS-Nano (50 Mio. Parameter, 50 ms TTFB) für den geräteinternen Einsatz auf 12 Milliarden Geräten.
Kann ich eine bestimmte Stimme klonen?
Ja. Stellen Sie eine kurze Referenz-Hörprobe zur Verfügung und geben Sie die Identität des Sprechers sprachübergreifend wieder. MARS-Pro erreicht eine WavLM-Lautsprecherähnlichkeit von 0,87.
Kann TTS offline laufen?
Ja. MARS-Nano läuft nativ auf Smartphones, Automobilsystemen, Ohrhörern, Wearables und IoT-Geräten ohne Internetabhängigkeit.
Wie schneidet CAMB.AI TTS im Vergleich zu Wettbewerbern ab?
MARS-Pro erreicht eine WavLM-Lautsprecherähnlichkeit von 0,87 und eine CAM-Ähnlichkeit von 0,71, was laut MAMBA-Benchmark einer Verbesserung von 38% gegenüber dem nächsten Konkurrenten entspricht.
Ist eine API verfügbar?
Ja. Entwickler-APIs sind verfügbar, wobei die Schlüssel in DubStudio generiert werden.
Kann ich die Emotionen der generierten Sprache kontrollieren?
Ja. MARS-Instruct bietet Steuerungen auf Regieebene für die emotionale Entfaltung, das Tempo und die Betonung.