10. April 2018 Heiko Beier

Von Big Data zu Smart Data – Daten mit Sinn und Verstand

Der Begriff Big Data ist durch die voranschreitende Digitalisierung zahlreicher Lebensbereiche in den letzten Jahren auch außerhalb der IT in aller Munde. Und „smart“ ist heutzutage auch fast alles.

Ob Smartphone, Smart Home, Smart City. Doch was unterscheidet Big Data denn nun wirklich von „Smart Data“? Die oft gelesene Aussage, es komme nicht auf viele (Big) Daten an, sondern auf genau die richtigen, ist dabei nur die halbe Wahrheit.

Die Sammelleidenschaft vieler Unternehmen im Bereich von Big Data bezieht sich zu großen Teilen auf strukturierte Daten, idealerweise kundenbezogene Daten. Klickverhalten auf Webseiten, Profil- und Adressdaten, … alles zusammen ergibt häufig ein sehr umfassendes Bild. Dabei wird häufig außer Acht gelassen, dass mehr als 80 Prozent aller Daten zunächst einmal unstrukturiert sind und somit einer Big Data Analyse gar nicht zugänglich sind. Insbesondere für alle Schnittstellen vom Unternehmen zum Kunden gilt, dass das Wissen über die aktuellen Bedürfnisse potenzieller Kunden vor allem in Textform vorliegt. Ob Feeds, eingehende E-Mails, Webformulare oder Posts in sozialen Netzwerken.

Smart Data schaffen Relevanz

An dieser Stelle ist der erfolgreiche Brückenschlag von Big Data zu Smart Data entscheidend. Es kommt primär nicht auf die Menge der gesammelten Kommunikationsdaten der Zielgruppe an, sondern vielmehr auf deren Relevanz. Smart Data Analysen haben das Ziel, die „richtigen“ Daten zu identifizieren, das wirklich Wichtige schnell herauszufiltern und in den richtigen Bezug zu den eigenen Aufgaben und Zielen zu setzen. Für Zwecke einer kundenorientierten Kommunikation ist es dabei entscheidend mittels Analysen, die auch die linguistischen Besonderheiten einer Sprache berücksichtigen, die Besonderheit der Sprache und Ausdrucksweisen ausgewählter Zielgruppen zu identifizieren und die externe Kommunikation entsprechend zu optimieren.

Dank gewaltiger Fortschritte in der Entwicklung von Technologien des Natural Language Processing in Verbindung mit Verfahren des Machine Learnings (insbesondere des sogenannten Deep Learnings) ist es heutzutage möglich, Inhalte mit hoher Qualität automatisiert auf ihre wesentliche Bedeutung hin zu entschlüsseln.

Smart Data Analysen erkennen, was in einem Dokument wichtig ist und reichern es automatisiert mit zusätzlichen Meta Daten an. Man kann auch sagen: sie werden automatisch verschlagwortet und klassifiziert.

Das Smart Data Prinzip

Das Smart Data Prinzip – Automatisierte Anreicherung strukturierter, bedeutungstragender Meta Daten

Dank eines vor-trainierten Verständnisses der menschlichen Sprache und wichtiger Konzepte und deren Kontexte sind Smart Data Plattformen wie die CONTEXTSUITE der MORESOPHY prinzipiell in der Lage, Inhalte aus unterschiedlichsten fachlichen Domänen vollständig ohne Eingriff des Menschen zu interpretieren und entsprechend anzureichern. Die Anreicherung nach dem Smart Data Prinzip beinhaltet im Standard das Erkennen von folgenden Arten von Objekten oder Daten in den Inhalten:

  • Themen oder Konzepte: z. B. Nachhaltigkeit, Risikomanagement, Dienstleistung).
  • Personen (über ihren Namen, also z. B. Richard Müller oder Freiherr von Stauffenberg)
  • Orte und Regionen: z. B. Kanada, Ontario, Bonn-Beuel, sowohl anhand des Namens wie aber auch über PLZ oder andere Codes
  • Organisationen: z. B. Siemens AG, FC St. Pauli Hamburg, Ministerium für Bildung und Wissenschaft
  • Themenbereiche: z. B. Gesellschaft, Ernährung, Gesundheitswesen, …
  • Stimmungen: im Sinne einer eher positiven oder negativen Stimmung in einem Dokument

Wichtig ist dabei zu verstehen, dass die Verfahren nicht rein keywordbasiert arbeiten, sondern auf einer begrifflichen Ebene. Verschiedene Schreibweisen, Synonyme, Verallgemeinerungen oder Spezialisierungen eines Begriffs werden dabei genauso berücksichtigt wie verschiedene Kontexte, in denen Begriffe vorkommen. Die Maschine ist somit auch in der Lage zu erkennen, ob es in einem Text um eine Linse im Sinne eines Objektivs oder um das stärkehaltige Nahrungsmittel geht.

Neben den oben genannten Standard Smart Data können – nach entsprechendem Training der CONTEXTSUITE – auch weitere Smart Data (custom data types) aufgebaut werden. Dies sind entweder ganz spezifische, für einen Use Case entscheidende Datentypen oder eine Ausdifferenzierung von bestehenden Datentypen nach individuellen Rollen:

Custom Smart Data Typ Beschreibung Beispiel
Person
(in individueller Rolle)
Während der Standard Personen anhand ihrer Namen erkennt, kann zusätzliche eine Unterscheidung nach Rollen erfolgen.
  • Geschäftsführer
  • Aufsichtsrat
  • etc.
Organisation
(in spezifischer Rolle)
Während der Standard Organisationen (Firmen, Vereine, Institute etc.) anhand ihrer Namen erkennt, kann zusätzliche eine Unterscheidung nach Rollen sinnvoll sein.
  • Wettbewerber
  • Zulieferer
  • etc.
Locations Während der Standard geographisch Länder und Orte differenziert, kann in manchen Use-Cases ein spezifisches Verständnis von Orten sinnvoll sein
  • Orte an einem Gerät (für Bedienhinweise)
  • Orte als Point of Interest
  • Orte innerhalb von Räumen
Verkaufssignale Je nach Zielgruppe und Industrie können verschiedene Hinweise in der Kommunikation als Verkaufssignal gewertet werden
  • Investitionen (im Bankenumfeld)
  • Änderung der Lebenssituation wie Heirat, Umzug (Versicherungen)
  • Orte und Stimmungen für die Identifikation von Reisezielen (Tourismus)
User-Intent Aus dem Bezug auf ein Produkt in Verbindung mit einer konkreten Handlung entsteht ein Verständnis der beabsichtigten Intention eines Users
  • Produkt konfigurieren (im Kundenservice)
  • Gerät abschalten (für sprachgesteuerte Bedienungshinweise)

 

Nach dem Smart Data Prinzip werden beliebige Daten und Informationen in Echtzeit automatisiert analysiert und mit strukturierten, ausdrucksstarken semantischen Meta-Daten (Smart Data) versehen. Diese Smart Data sind mehr als Big. Denn sie stiften Sinn und bringen verständnisvolle Einblicke in das, was Menschen wichtig ist.

Bildquelle: royalty / Depositphotos.com

, , , , , , , , , , ,