Zum Inhalt springen

Text to Speech (TTS) für Videos

Text to Speech TTS Free Online Anbieter kostenlos im Vergleich

Kennst du das Problem: Du hast einen Text und möchtest ihn online in gesprochenes Wort (Audio) für Videos umwandeln? Du hörst deine eigene Stimme ungern und ein:e professionelle:r Sprecher:in ist dir zu teuer? Dann sind künstliche Stimmen bzw. Text to Speech (TTS) deine erste Wahl.

Vorab: Dies ist meine persönliche Erfahrung mit Text to Speech (TTS). Es gibt viele Anbieter und Plattformen, aber ich grase den Markt „nur“ etwa einmal jährlich ab. In der Regel werden KI Voices im Bahn-Umfeld, in Warteschleifen oder bei Sprach-Chatbots eingesetzt. Mein Fokus liegt auf einem „wertigeren“ Consumer-Feld wie bspw. YouTube-Videos, TikTok oder Twitch. Wichtig ist mir dabei eine App bzw. Online-Version, die kostenlos erreichbar und ohne Software nutzbar ist sowie eine MP3 auf deutsch ausspuckt. Kritik aufgrund von fehlenden Features richtest du am besten direkt an die Plattformen. 🙂 Ergebnisse bzw. Beispielvideos aus der Praxis findest du ganz am Ende dieses Blogartikels.

Inhaltsverzeichnis


TTSMP3

Hinter TTSMP3 steckt die Voice Engine „Polly“ von Amazon. Täglich kannst du maximal 3.000 Zeichen inklusive Leerzeichen kostenlos „sprechen“ lassen, was etwa 450 Wörtern entspricht. Leider wird dein Kontingent an Zeichen bereits bei der Umwandlung „abgezogen“ und nicht erst beim Download. Falls du also bspw. Schreibfehler im Text hast, „kostet“ dich das erneut Zeichen. Die MP3s, die daraus entstehen, darfst du sowohl für private Projekte als auch für geschäftliche Aufträge nutzen. Kostenpflichtiges Upgrade möglich.

TTSMP3 lässt dich Text free konvertieren
TTSMP3 setzt auf AWS Polly
  • rhetorische Pausen, flüstern und betonen möglich
  • 28 Sprachen; darunter Walisisch, Isländisch und Rumänisch
  • kostenlos ohne Anmeldung oder Registrierung nutzbar
  • auf 3.000 Zeichen/Tag limitiert
  • ziemlich „grobe“ Oberfläche
  • nur eine männliche, deutsche Stimme

Google Cloud Text-to-Speech

Viele Google-Produkte sind durchaus nützlich und haben ihre Daseinsberechtigung. In Sachen TTS findest du vor allem als privater Nutzer, der bspw. eine künstliche Stimme für YouTube-Videos sucht, ehr nicht dein Glück. Google nähert sich dem Thema Text-to-Speech auf seiner Cloud-Plattform meiner Meinung nach viel zu „mechanisch“. Eine Free Demo ist zwar möglich, aber nur zum Abhören und nicht zum Download. Hinter Google Cloud TTS steckt die AI Engine von DeepMind mit Stimmen, „die fast wie Menschen klingen“. Naja.

Google Cloud Text to Speech
Google Cloud TTS richtet sich weniger an uns Consumer
  • mittels API gut für ein Business-Umfeld geeignet
  • Technologie von Google im Hintergrund
  • mehr als 200 Stimmen und 40 Sprachen
  • viel zu technischer Auftritt
  • kostenloser Download ohne Anmeldung nicht möglich
  • in der Demo nur nur eine deutsche Stimme (weiblich)

Free TTS

Hinter Free TTS steht die Google Machine Learning Engine. Die Oberfläche ist in meinen Augen ziemlich nutzerfreundlich: Text einkopieren, Sprache wählen, Sprecher/in aussuchen und direkt konvertieren bzw. als MP3-Datei herunterladen. Für deutsche, künstliche Stimmen hast du sogar fünf Optionen zur Auswahl. Aufpassen musst du nur, dass du die maximale Zeichenzahl pro Download (5.000 Zeichen = ca. 800 Wörter) nicht überschreitest. Bei insgesamt „nur“ 6.000 kostenlosen Zeichen pro Woche kommst du selbst als Privatnutzer recht schnell an deine Grenzen.

Free TTS Text to Speech Free Online MP3
Free TTS ist sehr gut für erste Gehversuche geeignet
  • ansprechende, easy Oberfläche
  • Anzahl an Text/Zeichen wird instant angezeigt
  • rhetorische Pausen, flüstern und betonen möglich
  • auf 6.000 Zeichen/Woche limitiert
  • pro Umwandlung/Download auf 5.000 Zeichen limitiert
  • 1 Million (Extra-)Zeichen kosten 6 Dollar für 24 Stunden

ReadSpeaker

Schon alleine die Seite von ReadSpeaker wirkt super professionell und strotzt nur so vor Agenturleistungen und individueller Software. Die versprochenen „lebensechten Text-to-Speech Optionen für Ihre Kunden“ klingen leider nicht so natürlich wie andere TTS-Stimmen. Da du deinen eigenen Text zwar vorlesen, aber weder downloaden noch (kommerziell) nutzen darfst, ist ReadSpeaker für mich eine unnütze Plattform. Als sinnvolles Einsatzgebiet sehe ich hier „nur“ das Vorlesen von Websites, aber keine „richtigen“ Videoprojekte.

ReadSpeaker wirbt mit lebensechten TTS Stimmen
ReadSpeaker bietet ziemlich viele Extra-Lösungen an
  • schön aufgebaute, professionelle Website
  • Website auf Deutsch
  • mehr als 90 Stimmen in über 30 Sprachen
  • kein Download ohne Registrierung möglich
  • deutsche Stimmen: 2x männlich, 1x weiblich
  • nichts für qualitativ hochwertige Projekte

Nuance

Das Unternehmen Nuance verschreibt sich voll und ganz dem Thema Künstliche Intelligenz (KI), darunter fallen natürlich auch KI-Stimmen. TTS scheint hier auf den ersten Blick nur eine kleine Rolle zu spielen, wird aber auf der Seite sehr groß „aufgeblasen“ – inklusive Datenblätter, Whitepaper und Landingpages. Als End User wirst du hier vermutlich nicht happy, denn Nuance scheint auf (zahlungsbereite) Unternehmen zu setzen. Mit welcher Voice Engine die Plattform arbeitet, konnte ich auf die Schnelle nicht herausfinden.

TTS Technologie von Nuance
Nuance ist noch recht neu im Spiel mit TTS-Stimmen
  • Full-Service-Anbieter mit scheinbar hoher Expertise
  • sehr, sehr professionelle Website
  • deutsche Stimmen: 2x weiblich, 3x männlich
  • Captcha-Abfrage vor jedem Abspielen
  • kein Free Download möglich
  • Probleme beim Abspielen mit Safari

TTS Reader

Die Website von TTSReader scheint in einer Zeit stehengeblieben zu sein, in der noch Grammophone den Sound der Zeit geliefert haben. Warum auch sonst ist es das grafische Hauptelement der Seite? Oder es ist ein Gag des Programmierers, was dann auch den Look des TTS-Players „rechtfertigt“? Leider ist auch der TTS Output inhaltlich eher mau. Letztlich kannst du „nur“ die Sprache auswählen und auf Wiedergabe klicken, das war’s. Der Mehrwert von TTS Reader erschließt sich mir leider auch beim fünften Hinschauen nicht.

TTS Reader ist auch online und kostenlose Software
Als Grammophone noch analoge Stimmen statt KI Voices produzierten
  • kostenlos
  • online
  • ohne Installation von Software
  • gruselige Oberfläche
  • kein Download möglich
  • keine wirkliche Auswahl an Stimmen

IBM Watson

IBM muss ich vermutlich nicht unbedingt erklären, aber dass der Konzern sich mit Text to Speech beschäftigt, war mir bis dato neu. Du benötigst den sogenannten „Lite Plan“, um Watson kostenlos nutzen zu können – aber auch dann wird es nicht einfacher. Viel zu kompliziert, viel zu komplex, so mein erstes und auch zweites Fazit. Und sobald du mit „Birgit“, „Dieter“ oder „Erika“ zusammenarbeitest, wirst du erkennen müssen, dass sich der Aufwand nicht wirklich lohnt. Vor allem TTS-Dieter ist alles andere als „vorzeigbar“.

TTS von IBM Watson
Die TTS-Stimmen von IBM Watson sind recht schwach auf der Brust
  • grundsätzlich profitierst du von den Möglichkeiten der IBM Cloud
  • eher für professionelles Umfeld sinnvoll
  • (Upgrade-)Kosten für deinen Text schätzen lassen
  • „nur“ 10.000 Zeichen pro Monat sind kostenlos
  • umständliche Anmeldung und Registrierung
  • bei Upgrade werden (Cent-)Gebühren pro 1.000 Zeichen fällig

So sollten Text to Speech (TTS) Stimmen 2022 klingen

Grundsätzlich werden künstliche Stimmen von Jahr zu Jahr besser, doch viele Plattformen bleiben oft auf ihrem „alten“ TTS-Stand stehen. Text to Speech wird in meinen Augen immer wichtiger – vor allem für Content Creator, die immer mehr Videos für YouTube, Instagram, Twitch oder TikTok produzieren. Da ich lange nach einer kostenlosen Online-Software bzw. App suche und mit keiner so richtig zufrieden bin, habe ich mir selbst ein Tool „gebastelt“. Die Ergebnisse siehst du in den Erklärvideos etwas weiter unten.

Grundsätzlich sei gesagt, dass fast jede Sprache der Welt möglich ist, aber dabei klingen englische TTS Voices (amerikanisch und britisch) wesentlich besser als deutsche. Meiner Erfahrung nach sind weibliche Stimmen – vielleicht auch „nur“ für mich als Mann – besser in der Sprachmelodie getroffen als männliche. In den folgenden Beispielen sind es männliche TTS-Exemplare. Falls du – unabhängig von Text to Speech – ein Erklärvideo für dich, dein Produkt oder deine Dienstleistung benötigst, wende dich gerne jederzeit an mich. Gerne produziere ich dir eine MP3 mit deinem individuellen Text. Was hälst du vom Thema KI-Stimmen bzw. Text to Speech?

Haben dir diese Infos geholfen oder hast du noch Fragen zum Thema Text to Speech (TTS) oder generell zu deutschen KI-Stimmen? Hast du denn selbst welche im Einsatz? Freue mich über deinen Kommentar. LG Jan

*eventuell findest du im Text Verlinkungen, die Affiliate-Links sind. Das heißt, wenn du darüber kaufst, bezahlst du nicht mehr für den Artikel, aber ich bekomme eine kleine Provision. Damit unterstützt du meine Arbeit und motivierst mich noch mehr, nützliche Tipps an dich rauszuhauen. 🙂

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

DSGVO Cookie Consent mit Real Cookie Banner