Nachrichten aus dem Off: Text-to-Speech und der Trend zum Audio

Audio Anja Kollruß 14 Januar 2021

Lesezeit: Etwa achteinhalb Minuten.

Artikelbild: Nachrichten aus dem Off: Text-to-Speech und der Trend zum Audio — © @freetousesoundscom (Unsplash)

Audio hat das Potenzial zum wichtigsten Medium zu werden. Das liegt nicht nur am Podcast-Boom. Immer häufiger werden News mit Text-to-Speech-Option angeboten. Wir stellen den Trend zum Vorlesen vor.

2020 gab es bei der Verleihung des Pulitzer-Preises, also so etwas wie die Oscar-Verleihung für Journalist:innen, gleich zwei Premieren: Zum einen war die traditionelle Preisverleihungszeremonie abgesagt worden. Stattdessen las die Journalistin und Administratorin des Komitees, Dana Canedy, die Namen der Gewinner:innen in ihrem Wohnzimmer vor; der Livestream war im Internet zu verfolgen. Zum anderen vergab eben jenes Komitee erstmals einen Preis in der neu geschaffenen Kategorie "Audio-Reporting". Das klingt logisch, gilt Audio doch als Trend der Stunde im Online-Journalismus. Einzig: Audio hat bereits eine lange Erfolgsgeschichte. Das Radio ist eines der ersten Massenmedien. Die Pulitzer-Jury spricht jedoch von einer "Renaissance im Audio-Journalismus". Und tatsächlich: Neue Möglichkeiten und Formen des auditiven Storytellings ziehen ein stetig wachsendes Publikum an. Dass dies in der Branche langsam wahrgenommen wird, zeigt nicht zuletzt der neu ausgelobte Pulitzer-Preis.

Hörer:innenschaft für Audio-Inhalte wächst

Nicht nur zuletzt bedingt durch die Corona-Pandemie nehmen besonders die Nutzungszahlen von Podcasts zu. Hören statt lesen und sehen, das entspricht scheinbar immer mehr dem heutigen Konsumverhalten. Mit Smartphones und Tablets sind Abspielgeräte jederzeit und überall verfügbar. Kaum noch ein Fahrgast morgens in der U-Bahn, der oder die nicht Kopfhörer im Ohr statt Zeitung in der Hand hat. Ob alle von ihnen gerade Nachrichten oder eine Reportage hören? Vermutlich nicht aber es werden mehr. Der Spoken Word Audio Report von Oktober 2020 kommt zu dem Ergebnis, dass der Anteil an Wort-Beiträgen in den USA in den vergangenen sechs Jahren um 30 Prozent gestiegen ist (alleine 2020 um acht Prozent). Im gleichen Zeitraum sank der Anteil an Musik um acht Prozent. Schon jetzt hören 43 Prozent, also ca. 141 Millionen, der US-Amerikaner:innen täglich im Durchschnitt zwei Stunden Wort-Beiträge. Laut dem Digitalisierungsbericht der Medienanstalten von 2020 steigt die Online-Audionutzung in Deutschland auf 50 Millionen, das sind 70,8 Prozent der Menschen hierzulande ab 14 Jahren. Ein direkter Vergleich zu den USA ist das nicht, da hier nicht alleine Wort-Beiträge gemeint sind, sondern auch Musik, Hörbücher und Podcasts. Allerdings untersuchten die Autor:innen der Studie, welche Angebote besonders beliebt sind. Ergebnis: Das Musikangebot steht hier noch an erster Stelle. Wort-Beiträge nehmen aber weiter zu.

Medienbranche hat den Ruf nach mehr Audio gehört

Auf beiden Seiten des Atlantiks nimmt die Zahl der Hörer:innenschaft zu. Eine Entwicklung, die natürlich längst in den Medienunternehmen angekommen ist. Da das Angebot nach Hörbarem alleine mit Podcasts nicht gesättigt werden kann und auch deren Produktion oft zu umfangreich ist, hat sich in der Branche der Trend zum vorgelesenen Artikel etabliert. Ausgewählte Online-Artikel erscheinen mehr und mehr mit einer Text-to-Speech-Option, also einer Vorlesefunktion, meist erkennbar durch ein entsprechendes Symbol zu Beginn des Beitrags. So etwas ist nicht neu und gibt es bereits im angelsächsischen Raum. Seit 2007 bietet The Economist, die englischsprachige Wochenzeitung aus London, ausgewählte Texte mit Vorlesefunktion an. In den vergangenen Jahren sind weitere namhafte Zeitungen hinzugekommen. Wie die Medienhäuser Text-to-Speech anbieten, ist allerdings unterschiedlich.

Zeitungen nutzen verschiedene Modelle zum Vorlesen

Einige lassen ausgewählte Beiträge von professionellen Sprecher:innen vorlesen, andere nutzen automatisierte Verfahren. So entwickelte die Washington Post eine eigene Applikation für Android und iOS. Im Sommer 2020 verkündete das Medium nach einer kurzen und erfolgreichen Testphase, dass fortan alle Post-Artikel als Hör-Version verfügbar sein werden. Ein Zeichen, für die enorme Nachfrage. Die Regel ist das nicht. Noch treffen die meisten Zeitungen eine kleine Auswahl an Stücken, die es in die Vertonung schaffen und nutzen dafür, ähnlich wie die Post, eigene Apps, die kostenpflichtig bzw. im Abo-Modell enthalten sind.

Einen anderen, nicht auf ein Medien zugeschnittenen Zugang bieten Text-to-Speech-Plattformen. Eine der bekanntesten in den USA, Audm, wurde im Frühjahr 2020 von der New York Times gekauft - ein weiteres Zeichen für die enorme Bedeutung von Audio in den Medienhäusern. Mit Audm lassen sich lange journalistische Texte in eine Audio-Form umwandeln und Hörer:innen über eine App anbieten. Die Texte werden dabei von professionellen Hörbuch-Sprecher:innen vorgelesen. Die App ist mit einem Flatrate-Modell hinterlegt: Nutzer:innen zahlen monatlich 7,99 Dollar für den Zugriff auf die Inhalte. Angeboten werden Artikel von einer Reihe bekannter US-Publikationen, darunter The New Yorker, The Atlantic und natürlich die New York Times. Andere bekannte Plattformen sind derzeit Noa und Curio. Auf dem deutschsprachigen Markt ganz frisch erschienen ist Articly*. Laut Gründer Wolf Weimer soll Articly so etwas "wie das Spotify für Audio-Artikel" sein und folgt damit dem Geschäftsmodell von Audm. Angeboten werden beispielsweise Beiträge von der Süddeutschen Zeitung, dem Handelsblatt und The Guardian. Die Plattform nutzt dafür professionelle Sprecher:innen, darunter zum Teil auch Schauspieler:innen. Der Preis liegt bei 6,99 Euro im Monat.

Das dänische Start-up Zetland bietet ein persönlicheres Hörerlebnis. Jeder Artikel wird von dem oder der Journalist:in vorgelesen, die oder der ihn geschrieben hat. Die Macher:innen wollten ein menschlicheres Produkt kreieren, das weniger professionell, dafür authentischer klingt. Audio bietet auch für kleinere Medien und Start-ups ein neuen und vielversprechenden Zugang zu mehr Publikum. Mehr Authentizität versprechen sich auch die Briten. Mit dem BBC-Projekt Songbird soll das Webangebot der britischen Rundfunkanstalt mehr auditive Features erhalten. Der Clou: eine Software, die es möglich macht, in Klang und Dialekt der Roboter-Stimmen zu variieren - je nach Genre und Handlungsort. Dazu sagt Errol Baran, zuständig für das internationale Innovationsgeschäft bei der BBC:

“Our plans will also see us develop an infinite scroll of content for users, offer soundscape and background effects to heighten the listening experience – think of a report about a street market in India delivered with the added depth of street market sounds, or a report from a football stadium with a back drop of fans.”

Die Vorteile liegen auf der Hand: Mehr Individualität kommt den individuellen Nutzungswünschen entgegen und bindet auf eine persönliche Weise das Publikum an das Medien.

Mit Audio steigt der Nachrichtenkonsum

Nicht nur das: Die automatisierten Text-to-Speech-Optionen ermöglichen eine Produktion an Audio-Inhalten, die alleine mit menschlichen Ressourcen nicht zu leisten und vor allem zu bezahlen wäre. Nicht unbedingt ein Grund, in den vertonten Artikel einen weiteren Anlass für Stellenabbau im Journalismus zu suchen. Leila Siddique, Senior-Product-Managerin bei der Washington Post, berichtet von dem erstaunlichen Ergebnis, nachdem die Testphase mit der App beendet war:

“What we’ve learned from users is that they listen to the news while doing other things, and are consuming far more content than they would normally. We plan to continue iterating on the feature to provide the best quality experience.”

Nutzer:innen der Washington Post konsumieren also mehr journalistische Beiträge, als sie es ohne Hörangebot tun würden. Und das dänische Magazin Zetland berichtet sogar von einer totalen Transformation zu mehr Abonnent:innen und Reichweite. Heute entscheidet sich ihr Publikum sogar zu 70 Prozent den Artikel lieber zu hören, als zu lesen, beschreibt Sara Alfort von Zetland die jüngste Entwicklung. Die Dänen beschreiben ihr hörendes Publikum als besonders loyal und stellen fest: Diese Nutzergruppe konsumiert viel mehr Beiträge als diejenigen, die nur lesen.

Audio wird zum ständigen Begleiter

Eine weiterer interessanter Trend lässt sich von den Erfahrungen der Washington Post ableiten. Eigentlich sind die Macher:innen davon ausgegangen, dass die Aufrufe während der Corona-Krise zurückgehen, da die Menschen weniger im Auto oder Nahverkehr sind - klassische Orte zum Zuhören. Tatsächlich stiegen die Zahlen bei der Post sogar während der Pandemie, in einer Zeit also, wo viele Menschen öfter denn je zu Hause waren. Auch dies entspricht dem neuen Nutzungsverhalten. 2020 haben in den USA knapp mehr als die Hälfte (54 Prozent) der regelmäßigen Hörer:innen von Wort-Beiträgen diese zu Hause abgerufen. In einer Welt, in der auf immer mehr Kanälen mehr Beiträge erscheinen, ist es schwer, mit dem Tempo der Nachrichtenlage Schritt zu halten. Audio ermöglicht es, beim Kochen, beim Putzen oder auf dem Weg zum Supermarkt, News zu jedem Thema zu hören. "Zeitung hören" wird also zum Nebenprodukt, das sich dank On-Demand-Angebote individuell in den Alltag integrieren lässt. Was diese Entwicklung ebenfalls begünstigt: Smart Speakers. In Deutschland gibt ein Drittel der Online-Audio-Nutzer:innen an, dass sie mehr Zeit mit Radiohören verbringen, seitdem sie einen Smart Speaker haben - und das sind in Deutschland ca. 12,4 Prozent der Bevölkerung. Auch hier nimmt das Abrufen von Wort-Beiträgen zu. Woran es noch hapert: Nicht immer erscheint der gewünschte Inhalt, wenn ein Angebot per Sprachbefehl aufgerufen wird. Die Suchmaschinenoptimierung für die Stimme ist anders als für den Text. Und so befassen sich immer mehr Medienunternehmen mit dem Thema Voice Search SEO. In naher Zukunft wird es an Bedeutung noch weiter zunehmen.

Wird Audio bald zum wichtigsten Medium? Sicherlich bleibt das Hörbare in unserem täglichen Medienkonsum weiterhin sichtbar und wird an Präsenz zu nehmen. Noch allerdings überwiegen die Nutzungszahlen von gelesenen Beiträgen. Dem Auditiven kommt im Online-Journalismus derzeit auch eine Pionierrolle zu. Viele Entwicklungen haben erst begonnen und das Publikum ist längst nicht übersättigt. Der Audio-Markt wird weiter rasant wachsen, so viel steht fest.

Dieser Beitrag endet, wie sollte es auch anders sein, mit einem Hör-Tipp: Den eingangs erwähnten ersten Pulitzer-Preis für Audio-Beiträge haben 2020 die Macher:innen des Podcasts "This American Life" erhalten. Ausgezeichnet worden ist die Folge "The Out Crowd" über die Folgen der Mexiko-Politik der Trump-Regierung. Wer möchte, kann sogar eine "Beeped Version" abrufen, in der Schimpfwörter gepiept werden. Alles ist möglich in der Welt der Töne.

*Bei Erscheinen des Artikels hieß die App noch Audicle. In der Zwischenzeit haben wir den Artikel aktualisiert.