Amazon Polly – KI-Sprachgenerator

Setzen Sie hochwertige, natürlich klingende menschliche Stimmen in Dutzenden von Sprachen ein.

Was ist Amazon Polly?

Amazon Polly ist ein vollständig verwalteter Service, der On-Demand-Sprache generiert und jeden Text in einen Audiostream umwandelt. Verwendung von Deep-Learning-Technologien zur Konvertierung von Artikeln, Webseiten, PDF-Dokumenten und anderen Text-zu-Sprache (TTS). Polly bietet Dutzende lebensechter Stimmen in einer Vielzahl von Sprachen, mit denen Sie sprachgesteuerte Anwendungen erstellen können, die ansprechen und konvertieren. Erfüllen Sie die unterschiedlichen Sprach-, Zugänglichkeits- und Lernbedürfnisse von Benutzern in allen Regionen und Märkten. Leistungsstarke neuronale Netzwerke und generative Sprachmaschinen arbeiten im Hintergrund und synthetisieren Sprache für Sie. Integrieren Sie die Amazon-Polly-API in Ihre vorhandenen Anwendungen, um schnell sprachbereit zu sein. 

Funktionsmöglichkeiten

Amazon Polly verfügt über eine Vielzahl von Funktionen, darunter einige der unten aufgeführten

Lebensechte Stimmen

Konversationelle Benutzererlebnisse in gleichbleibend schnellen Reaktionszeiten bieten

Wenn Sie eine Amazon-Polly-Ausgabe anfordern, können Sie aus Dutzenden lebensechter Stimmen und verschiedenen Sprachen wählen. Jede Stimme wird von Muttersprachlern erstellt, wobei es auch innerhalb derselben Sprache Variationen von Stimme zu Stimme gibt. Die meisten Sprachen enthalten eine oder mehrere Männer- und Frauenstimmen, sodass Sie die für Ihren Anwendungsfall am besten geeignete Sprache auswählen können.

Frau in gelber Jacke mit Telefon auf der Brücke

Individuell anpassbare Ausgabe

Sprachausgabe nach Bedarf anpassen und steuern

Mit Amazon Polly können Sie benutzerdefinierte Text-zu-Sprache-Ausgaben erstellen, die die Aufmerksamkeit Ihres Publikums wecken und halten. Verwenden Sie benutzerdefinierte Lexika, um die Aussprache von Akronymen, Firmennamen, interner Terminologie oder anderen Wörtern Ihrer Wahl zu ändern. Mit den Speech Synthesis Markup Languages (SSML)-Tags von Amazon Polly können Sie auch Betonung, Intonation, Phrasierung und Stil anpassen. Generieren Sie eine KI-Sprachausgabe, die am besten zu Ihrem Unternehmen passt.

Bild von Männern, die in einem Büro arbeiten

Leistung der generativen KI

Zu einem Bruchteil der Kosten auf integrierte Generative-KI-Funktionen zugreifen

Amazon Polly unterstützt mehrere Sprach-Engines, aus denen Sie wählen können, um Text-zu-Sprache zu konvertieren. Die Engine verwendet einen Transformer mit Milliarden Parametern, um Stimmen schrittweise und streambar zu erzeugen. Dieser KI-Sprachgenerator erzeugt synthetische Sprache, die selbstbewusst, emotional engagiert und sehr umgangssprachlich ist, ähnlich einer echten menschlichen Stimme.

Junge Geschäftsleute arbeiten zusammen an einem neuen Projekt

Kontrolle und Sicherheit

Sicheres Speichern und Verteilen von Sprache in Standardformaten 

Speichern Sie Ihre Text-zu-Sprache-Ausgabe in Standard-Audiodateien wie MP3 und OGG zur Verbreitung, Analyse, Archivierung oder für andere Anwendungsfälle ohne zusätzliche Kosten. Zwischenspeichern Sie Ihre Dateien, um sie bei Bedarf schneller abrufen zu können. Die Sicherheit, das Vertrauen und der Datenschutz Ihrer Inhalte haben für AWS höchste Priorität. Amazon Polly speichert den Inhalt Ihrer Textübermittlungen nicht.

Bild der Hände einer Person bei der Arbeit am PC

Anwendungsfälle

Fügen Sie Anwendungen mit einem globalen Publikum Sprache hinzu, z. B. RSS-Feeds, Websites oder Videos. Machen Sie Ihre Mobil- und IoT-Anwendungen sprachbereit für die Zukunft.

Weitere Informationen zur Sprachgenerierung.

Speichern Sie die Sprachausgabe von Amazon Polly und geben Sie sie wieder, um Anrufer mit interaktiven oder automatischen Sprachdialogsystemen zu informieren. Nutzen Sie KI-Funktionen, um Stimmen zu generieren, die Ihre Kundschaft emotional ansprechen.

Weitere Informationen zu Sprach-Engines

Erstellen Sie Voiceover für Animationen, Spiele und andere Medien direkt aus Ihren Skripten. Verwenden Sie SSML, eine W3C-Standard-XML-basierte Markup-Sprache, um Phrasierung, Betonung und Intonation an die jeweilige Szene anzupassen. Passen Sie die Sprachdauer automatisch an, um mehrsprachiges Synchronisieren zu erleichtern.

Mehr über SSML erfahren

Häufig gestellte Fragen

Ja. Amazon Polly bietet nach Ihrer Anmeldung ein Jahr lang kostenlose Text-zu-Sprache-KI-Services an – bis zu einer Mindestnutzungsschwelle. Der Schwellenwert variiert je nach der von Ihnen ausgewählten Sprach-Engine zwischen 100 000 Zeichen und 5 Millionen Zeichen. Weitere Informationen finden Sie unter Amazon-Polly-Preise.
Amazon Polly bietet über 60 männliche und weibliche Standardstimmen in über 40 Sprach- und Sprachvarianten. AWS aktualisiert und erweitert unsere Sprachfunktionen ständig.
Amazon Polly produziert MP3-, OGG- und andere Standard-Audiodateiformate, die mit 8 000 Hz, 16 000 Hz und 22 050 Hz gesampelt wurden.
Nein. Alexa und Amazon Polly sind unterschiedliche Technologien. Alexa ist ein virtueller Sprachassistent, der direkt mit dem Benutzer kommuniziert. Amazon Polly ist ein Text-zu-Sprache-Konverter, den Unternehmen verwenden, um Sprach-KI-Apps in großem Maßstab zu entwickeln.
Nein. Amazon Polly ist ein vollständig verwalteter Cloud-KI-Service. Sie kommunizieren damit über APIs in Ihrem Code. Sie können den Amazon-Polly-Quellcode nicht herunterladen oder in Ihrer Umgebung bereitstellen. Sie können Amazon Polly jedoch ab Ihrem Start 12 Monate lang kostenlos nutzen (bis zu einem vorab festgelegten Nutzungsgrenzwert). Weitere Informationen finden Sie unter Amazon-Polly-Preise.

Mehr von AWS erkunden