Fraunhofer hilft mit Audio-Mining

Wahlkampf-Duell im ARD-Web

09.09.2009 von Johannes Klostermeier
Die ARD hilft Wählern bei der Wahlentscheidung am 27. September, indem sie mithilfe von Audio-Mining-Technik des Fraunhofer IAIS ihre Mediathek nach Politikeraussagen durchsuchbar macht. Sie nennt das Ganze "Webduell".
ARD Webduell, Ring Frei für den Bundestagswahlkampf.

Derzeit ist es eher eine Spielerei, doch eine ausbaufähige. Beim "Webduell" können Politikinteressierte die öffentlichen Aussagen von deutschen Spitzenpolitikern zu den wichtigsten Themen des Wahlkampfs aus der Vergangenheit leicht wieder finden und gegenüber stellen. Alle in der Mediathek der ARD verfügbaren Hörfunk- und Fernsehsendungen werden dazu herangezogen. Die Auswahl der Politiker ist auf zwanzig begrenzt. Die Idee, die erst im März geboren wurde, verantwortet der Südwestrundfunk (SWR) in Stuttgart. Realisiert wurde die Anwendung von der Redaktion ARD.de zusammen mit dem Fraunhofer Institut für Intelligente Analyse und Informationssysteme IAIS.

So kann man beim "Webduell - Ring frei für den Bundestagswahlkampf", wie der vollständige Name lautet, beispielsweise erfahren, welche Positionen Bundeskanzlerin Angela Merkel und ihr Herausforderer Frank-Walter Steinmeier zum Thema "Soziale Gerechtigkeit" haben oder was Guido Westerwelle und Cem Özdemir zur Finanzkrise gesagt haben. "Webduell" greift dabei auf die das gemeinsame Archivangebot der ARD und der Deutschen Welle zu.

"Das Web-Duell macht den Wahlkampf auf medienspezifische Weise transparent und ist ein Instrument zur politischen Meinungsbildung. Die ARD stellt mit dieser neuartigen Anwendung zugleich ihre Innovationskraft unter Beweis", sagte die ARD Online-Koordinatorin Heidi Schmidt.

Ein Crawler durchsucht täglich die ARD Mediathek nach neu eingehenden Audios und Videos aus den Ressorts Nachrichten und Politik. Die Audio-Mining-Technologie zerlegt die Clips in Abschnitte einzelner Sprecher. Die genutzte Audio-Mining-Software erkennt die gesprochenen Laute und schlägt sie in einem Wörterbuch nach. Findet sie das Wort dort, wird es in Text umgesetzt. Ist dies nicht der Fall, so schlägt das System zusätzlich noch in einem Silbenwörterbuch nach und vergleicht anhand des Kontextes, um welches Wort es sich wahrscheinlich handelt. Dadurch können, so die Macher, binnen Minuten sämtliche O-Töne der Spitzenpolitiker markiert werden.

Per AudioMining Sprachaufzeichnungen durchsuchen

Diese werden dann mit Hilfe von Spracherkennung automatisch indiziert und stehen anschließend sofort im "Web-Duell" zur Verfügung. Die Tags werden zusätzlich geclustert und ermöglichen somit auch eine assoziative Suche. "Durch AudioMining können Sprachaufzeichnungen jetzt genau so leicht durchsucht werden wie Webseiten", sagte Stefan Wrobel, Institutsleiter des Fraunhofer IAIS. Die ARD will das Projekt auch nach der Bundestagswahl im September fortführen.