Big Data

Der Krake weiß Bescheid über Big DataFinn, der wissbegierige Fuchs, war unzufrieden, wenn er etwas nicht verstand. So ging es ihm mit dem Begriff „Big Data“. Egal, wie viele Leute er auch fragte – keiner konnte – oder wollte, wie Finn mutmaßte – ihm erklären, was „Big Data“ war.
Natürlich hatte er begriffen, dass das Thema etwas mit vielen oder großen Daten zu tun haben musste – aber worum es wirklich ging, blieb für ihn unklar. Bis er eines Tages in einem Garten einen Kraken sitzen sah.
Auch ihn fragte Finn wieder nach einer Erklärung für „Big Data“ – und die Augen des königsblauen Achtarms leuchteten auf. Voller Elan drückte er den überraschten Finn an sich und rief: „Toll, endlich interessiert sich jemand für meine Arbeit. Ich speichere nämlich Daten und werte sie aus. Das mache ich für Anwendungen im Internet – wie beispielsweise Shops. Was genau willst du denn wissen?“
„Alle reden von „Big Data“, aber niemand konnte mir bisher erklären, was das genau bedeutet. Dabei wüsste ich so gerne, was sich hinter diesem Begriff verbirgt“, erläuterte Finn sein Anliegen.  „Lass mich kurz ausholen und dir beschreiben, wie sich das Datenaufkommen verändert hat und noch weiter verändert“, fing der Krake an zu erklären. „Früher waren Daten meist gut strukturiert. Man legte sie in sogenannten relationalen Datenbanken ab.“
„Relationale Datenbanken kenne ich“, sagte Finn. „Da definiert man eine Datenstruktur und sortiert alle Daten hinein. Anschließend kann man die strukturierten Daten wieder abfragen. Recht schnell sogar.“
„Richtig!“, bestätigte der Krake. „Die relationalen Datenbanken kommen heute allerdings durch zwei Phänome an ihre Grenzen:
Zum einen gibt es immer mehr Daten. Denk einfach mal an Klicks von Internet-Usern, die im Web-Controlling erfasst werden. Diese riesigen Datenmengen passen häufig nicht mehr in eine zentrale Datenbank.
Zum anderen sind die Daten heute ganz häufig unstrukturiert. Ein Beispiel sind E-Mails, die man untersuchen möchte, um Spam zu filtern.
Wenn man solche großen, unstrukturierten Datenmengen schnell auswerten will, kommt man mit der bislang üblichen Technologie nicht mehr klar. Deshalb musste man sich etwas Neues ausdenken – eben die Big-Data-Technologie.“
„Ah, jetzt wird mir das langsam klarer“, sagte Finn erfreut. „Wer hat das denn erfunden?“ Auch darauf wusste der Krake eine Antwort: „Google hat viel für die Entwicklung von Big-Data-Lösungen getan. Die brauchen für ihre Suchmaschine Systeme, die beliebige Datenmenge aufnehmen und analysieren können, ohne dass sie langsamer werden. Außerdem sollen diese Systeme kostengünstig erweiterbar sein. ‚Big Data‘ ist da in der Suchmaschine drin. Und im E-Commerce ist immer dort, wo hohes Datenvolumen, heterogene Daten und Geschwindigkeitsanforderungen aufeinandertreffen, die Big-Data-Technologie häufig die einzige Lösung.“
„Kann ich die Big-Data-Technologie auch im Detail verstehen?“, wollte Finn wissen. – „Nun ja“, antwortete der Krake, „um die genaue Logik zu verstehen, brauchst du schon sehr viel mathematisches Fachwissen. Im Grunde ist es aber so, dass die Daten auf ganz vielen sogenannten Knoten verteilt gespeichert werden. Dabei können einzelne Knoten wegfallen und neue hinzukommen, ohne dass das System sich daran stört. Das Speichern dauert auch dann nicht signifikant länger, wenn mehr Daten im System sind. Und all´ diese Knoten können zeitgleich bei der Auswertung der Daten zusammenarbeiten. Dafür nutzen sie einen Algorithmus, der „MapReduce“ heißt und von Google patentiert ist. Damit können riesige Datenmengen schnell analysiert werden.“
„Das wird mir dann doch zu verflixt technisch“, stellte Finn fest. „Dafür gibt es sicher Profis, die die Technik beherrschen. Ich würde lieber noch ein paar weitere Anwendungsfälle kennen.“
Der Krake ließ sich nicht lange bitten und erklärte mit stolzer Miene: „Jedes E-Commerce-Unternehmen wird lernen, den Wert in den gesammelten Daten zu erkennen. Daraus lassen sich so viele Zusammenhänge ableiten und nutzen. So können aus den Daten, die über das Surf-Verhalten eines Shopbesuchers vorliegen, zum Beispiel Produktempfehlungen generiert werden. Aber auch Risiken für den Shop-Betreiber können durch die Datenauswertung aufgedeckt und minimiert werden. Zum Beispiel beim Rechnungskauf. Immer wieder gibt es Leute, die per Rechnungskauf beliefert werden, aber dann nicht bezahlen. Einige Shops werten nun die „Laufwege“ aus, die diese Betrüger bei ihrem  Einkauf im Shop genommen haben, und suchen nach Gemeinsamkeiten. Das könnte das zielstrebige Zugreifen auf besonders teure Produkte sein. Wenn es solche Gemeinsamkeiten gibt, wird zukünftig Kunden, die sich ähnlich verhalten, kein Rechnungskauf mehr angeboten. Außerdem gibt es noch viele weitere Anwendungen von Big Data im E-Commerce. Beispielsweise  die Vorhersage, wie hoch die Retourenquote sein wird. Damit kann im Lager der Personaleinsatz vorgeplant werden…“
„Danke, danke!“, unterbrach Finn den Redefluss des kommunikativen Kraken, weil ihm der Kopf schwirrte. „Das reicht mir an Beispielen. Jetzt kann ich mir endlich etwas unter ‚Big Data‘ vorstellen.“

Veröffentlicht in Begriffe (Technik und Prozesse), Zahlungen, Betrug und Risiken Getagged mit: , , , , ,

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

*