Big Data Analytics

Social-Media-Lügen automatisch identifizieren

20.01.2014 von Simon Hülsbömer
Wie vertrauenswürdig viral über soziale Medien verbreitete Informationen wirklich sind, soll das EU-geförderte Forschungsprojekt "Pheme" an der privaten Wiener MODUL-Universität ergründen.

Gemeinsam mit Partnern in England, Deutschland, der Schweiz, Bulgarien, Spanien und Kenia forschen die österreichischen Wissenschaftler seit Anfang 2014 in dem auf drei Jahre angelegten EU-Projekt. Um falsche von richtigen Informationen unterscheiden zu können, sollen linguistische und grafische Methoden mit Technologien zur Big-Data-Analyse kombiniert werden. Mit zwei Fallstudien in Medizin und Journalismus sollen die Ergebnisse in der Praxis überprüft werden.

Die Wiener MODUL-Universität möchte den ersten Social-Media-Lügendetektor entwickeln.

Die technologischen Grundlagen des Pheme-Projekt legte die Wiener Privatuniversität mit dem im Dezember abgeschlossenen Projekt DIVINE, welches sich mit der dynamischen Integration und Visualisierung von Informationsräumen beschäftigte.

"Traditionelle Medien - ob digital oder analog - verlieren derzeit ihre Informationshoheit. Social-Media-Nutzer übernehmen diese immer mehr und verbreiten Informationen in ungeahnter Geschwindigkeit. Da wird aus einer Mücke rasch auch mal ein Elefant - oder aus einem Nieser die Angst vor einer globalen Pandemie", erläutert Arno Schal, der das Institut für Neue Medientechnologie an der MODUL-Universität leitet. Solche als "Meme" bezeichneten Themen stellten sowohl Unternehmen als auch Regierungen zunehmend vor große Herausforderungen, denen es zu begegnen gelte.

Gerücht oder Fakt?

Das Forscherteam konzentriert sich auf die Identifikation von vier Arten von fragwürdigen Wahrheiten oder sogenannten "Gerüchten": die Spekulation, die Kontroverse, die Falschinformation und die Desinformation. In welche Kategorie eine Information letztlich fällt, hängt auch davon ab, wie gut sich diese Einordnung vornehmen lässt. Das wiederum hängt stark von der Qualität der Information und damit von deren sozialem Kontext ab - diesen automatisiert erfassen und interpretieren zu können, ist das Ziel der Forscher.

Dafür arbeiten Wissenschaftler in Sprachtechnologien, Web Science und der Analyse sozialer Netzwerke zusammen mit Experten für Informations-Visualisierung. Gemeinsam nutzen sie drei Aspekte zur Analyse der Vertrauenswürdigkeit: zunächst die einem Dokument eigene Information - also lexikalische, semantische und syntaktische Information. Diese wird vernetzt mit Datenquellen, die als besonders vertrauenswürdig gelten. Für medizinische Informationen also zum Beispiel PubMed, die weltgrößte Online-Datenbank für medizinische Originalpublikationen. Schließlich wird die Art der Verbreitung einer Information analysiert - wer erhält welche Information, und wie und wann wird diese an wen weitergesendet?

Wie praxistauglich die Ergebnisse sind, soll schließlich in zwei Fallstudien herausgefunden werden. Zum einen wird im Bereich medizinischer Informationssysteme die so genannte "Rumour Intelligence" erprobt - also die Fähigkeit, Gerüchte wie den Ausbruch einer hoch ansteckenden Erkrankung, beispielsweise der Schweinegrippe, und deren Verbreitung frühzeitig zu identifizieren. Zum anderen gibt es eine Kooperation mit der britischen BBC und dem Südwestrundfunk, um für den Bereich des digitalen Journalismus die Glaubwürdigkeit nutzergenerierter Inhalte zu verifizieren.

Social Media - eine Entwicklung verändert die Welt
Heute ist klar: Social Media kann Gesellschaften ebenso auf den Kopf stellen wie Geschäftsprozesse radikal ändern. Einen Weg zurück gibt es nicht.
Was im Internet in 60 Sekunde passiert
Quellen: www.pcmag.com, www.go-gulf.com, www.businessinsider.com, www.dailymail.co.uk, www.4mat.com, www.scoop.intel.com, IDC, Gartner, eigene Recherche
Genutzt Internet-Dienste
n = 6.739; Mehrfachnennungen; Angaben in Prozent
Die 20 Firmen mit den meisten Fans bei Facebook im Oktober 2013
Weltweit; Angaben Millionen Fans
Die Top 10 der deutschsprachigen Leitmedien der Social-Network-Nutzer im September 2013
Welche Magazine, Nachrichten-Websites und Blogs werden bei Facebook, Twitter und Google+ am häufigsten empfohlen, geliket, verlinkt?

Business kontra IT: 3 Top-Gründe
Angaben in Prozent; Untersuchung von Experton bei 309 deutschen Unternehmen mit mindestens 100 Mitarbeitern.

Welche sozialen Medien besuchen Nutzer am häufigsten?
Unique Visitors pro Monat in Tausend vom Dezember 2012 bis Mai 2013
Haben sich Ihre Social-Media-Aktivitäten für Ihr Unternehmen bisher gelohnt?
2012In Prozent (Anteil der Befragten); Deutschland; Basis 2012: n = 124, Basis 2011: n = 13;Forschungswerk; Business Intelligence Group; 2011 und 2012

Nutzer von sozialen Netzwerken von 2011 bis 2017 weltweit
Internet-Nutzer, die ein soziales Netz mit irgendeinem Gerätetyp mindestens einmal im Monat besuchen.

Internet und Gewalt
n = 1.953; Angaben in Prozent; Kategorie „weiß nicht“ wurde nicht berücksichtigt

Welche sozialen Netze nutzen die Fortune 500-Unternehmen?
Prozentanzeil der Nutzung von jedem der sozialen Netze im Juli 2013

Welche der folgenden Social-Media-Marketing-Instrumente setzen Sie ein?
Anteil der Befragten in Prozent; Deutschland; n 0 536 Unternehmen
Warum sind Sie "Fan" oder "Follower" von einem Unternehmen oder einer Marke?
In Prozent

Wenn Facebook eine Nation wäre ...

Welche genauen Ziele verfolgen Sie mit Ihrem Social-Media-Marketing-Maßnahmen?
Anteil der Unternehmen in Prozent; Deutschland; n = 616 Unternehmen
Wichtigstes Medium
In Prozent; alle Befragten (n = 3.050; 70.214 Mio. Personen ab 14 Jahre); 2011: 3.076 Befragte; 2009: 2.000 Befragte; In Prozent; alle Befragten (n = 3.050; 70.214 Mio. Personen); Max. VS / HS: n = 589; 26,706 Mio.); Mittlerer Bildungsab-schluss (n = 1.039; 23,760 Mio.); (Fach-) Hochschule (n= 1.388; 18,312 Mio.)