Was denken die Kunden über unser Produkt? Verstehen sie unsere Anleitungen? Sind unsere Anweisungen eindeutig? Wenn nein, was sollten wir ändern? Solche Fragen beantworten zu können, wirkt sich häufig unmittelbar positiv für ein Unternehmen aus. An Antworten herrscht hierbei auch absolut kein Mangel, wenn man an den richtigen Stellen sucht. Genau hier hilft die Sentiment-Analyse.
Wie schaut es bei Ihnen aus? Orientieren Sie sich selber auch an Bewertungen bei Google oder Amazon, Blogs, Kommentaren oder auch Twitterbeiträgen? Als Verbraucher sind das alles wertvolle Quellen, um Produkte, Dienstleistungen oder Veranstaltungen einzuschätzen. Die Zeiten, in denen man nur Familie und Freunde bezüglich Kaufentscheidungen fragen konnte, sind vorbei, weil es Unmengen an Bewertungen und Diskussionsforen gibt.
Umgekehrt bilden diese Bewertungen auch für den Anbieter eine wertvolle Quelle an – im besten Fall – echten, unverzerrten Rückmeldungen. Dass diese Meinungen allerdings nicht immer unverzerrt sind, dürfte jedem klar sein. Dazu komme ich noch. Nichtsdestotrotz ist die Auswertung von Reviews aller Art ein bedeutsames Marketing-Tool geworden. Darum wurde die sogenannte Sentiment-Analyse zur Disziplin in vielen wissenschaftlichen Zweigen, unter anderem der Wirtschaft, Informatik und Sozialwissenschaft.
Nun, was Sentiment-Analyse eigentlich ist und wie es uns genau hilft, diesen überquellenden Meinungsfluss zu bezwingen, dazu im Folgenden eine kurze Einführung.
Was ist Sentiment-Analyse?
Bei einer Sentiment-Analyse wird eine Nachricht auf deren Stimmung (Sentiment) untersucht. Sie wird als positiv, negativ oder neutral klassifiziert. So kann Lob und Kritik aus geschriebenen (Kunden-) Meinungen automatisiert herausgelesen und ausgewertet werden.
Die Sentiment-Analyse ist eine Unterdisziplin des Data Minings (darunter auch Web- und Text-Mining, siehe Infokasten). Aufgrund der sehr breit gefächerten Anwendungsmöglichkeiten, wird dieser Bereich umfassend untersucht und gut finanziert. Sentiment-Analyse wird unter anderem auch dazu benutzt, um z.B. politische Stimmungen wahrzunehmen oder Erfolgschancen von Produkten wie Filmen, Aktien oder Dienstleistungen einzuschätzen. Auch im Bereich der Technischen Dokumentation ließen sich Trends erkennen, wie der Verbraucher komplexe Inhalte am besten vermittelt bekommt.
Data Mining
Der Sammelbegriff Data Mining beschreibt das Verfahren, bei dem Informationen in großen Mengen gesammelt und gefiltert werden, mit dem Ziel, daraus bestimmte Muster zu erkennen.
Text Mining bezieht sich lediglich auf meist längere Text-Dokumente, Web Mining dagegen auch auf kurze Texte und Beiträge im Internet.
Es gibt unterschiedliche Arten von meinungstragenden Beiträgen, daher gibt es auch unterschiedliche Level, auf denen die Sentiment-Analyse greift:
- Dokumenten-Ebene: Erfassung der Stimmung eines gesamten Dokuments, nützlich bei z.B. Blogs
- Satzebene: Erfassung der Stimmung eines jeden Satzes, nützlich bei z.B. Twitterbeiträgen
- Entity-Aspect-Ebene: Die Meinung (Aspect) zu jeder genannten Sache (Entity) wird erfasst, nützlich bei z.B. Produkt-Reviews
Es gibt einige gute Tools für die Auswertung von Beiträgen z.B. aus sozialen Medien. So lässt sich dann etwa nach Meinungen filtern, die nur ein bestimmtes Objekt betreffen, wie die Verständlichkeit der neuen Video-Anleitung.
Stolpersteine der Sentiment-Analyse
Von Bewertungen im Internet hängen häufig Kaufentscheidungen ab. Je teurer das Produkt, desto wertvoller sind die Meinungen derer, die es bereits getestet haben. Es ist also nicht schwer, den Markt zu erkennen, der hinter der strukturierten Beeinflussung von Bewertungen steckt.
Deswegen sind auch Tools der Sentiment-Auswertung mit Vorsicht zu genießen. Spammer im Web, die unwahre Rezensionen schreiben oder eine ungerechtfertigte Anzahl an Sternen vergeben (sogenannte „Opinion Spammer“), sind für Maschinen nicht so leicht zu erkennen wie (teilweise) für uns Menschen. Manche Programme erkennen bereits fake-reviews anhand verschiedener Kriterien. So werden etwa Metadaten wie ein Zeitstempel oder Nutzer-IDs dazu genutzt, Spam zu erkennen.
Noch in Arbeit ist die Mustererkennung auf Sprachebene, wie Schreibstil und Wortwahl. Doch Sprache ist weitaus trickreicher als einfache Zahlen und Daten. Hinter der „einfachen“ Analyse eines Satzes verbergen sich immer noch viele Herausforderungen. Die Verarbeitung natürlicher Sprache (Natural Language Processing, NLP) ist ein Knackpunkt, der auch nach heutigem Forschungsstand noch nicht ganz gelöst ist.
Fazit
Sentiment-Analyse ist eine feine Sache mit einem durchaus gewinnbringendem Ergebnis, doch ist sie noch nicht perfekt und bedarf noch weiterer Forschung. Die Tools, die heute schon auf dem Markt sind, haben sich auf die verschiedenen Ebenen der Sentiment-Analyse (s.o.) spezialisiert und können einen klaren Anhaltspunkt für Verbesserung bieten.