Datenmanagement
12.10.2020, 16:55 Uhr
Dark Data - die grosse Verschwendung
Berge nicht nutzbarer Daten verursachen unnötig hohe Kosten und neue Risiken. Deutschland gehört zu den traurigen Spitzenreitern im internationalen Vergleich bei ungenutzten Daten.
Daten gelten als das Öl des 21. Jahrhunderts. Unzählige Hersteller und Medien haben in den vergangenen Jahren immer wieder betont, wie wichtig ihre Bedeutung sei und wie kostbar Daten seien. Das ist sicher auch richtig, man kann es aber auch anders formulieren: Einmal gespeicherte Daten kosten sehr viel Geld und sind es nicht immer wert. Das ist die hässliche Seite von Big Data, also dem festen Glauben daran, dass man nur so viele Daten wie möglich sammeln muss, um verborgene Reichtümer darin zu finden. Der Irrglaube hat dazu geführt, dass Unternehmen (und Behörden) alles speichern, dessen sie habhaft werden können. Trends wie fallende Kosten für Storage und Rechenleistung haben die Entwicklung weiter angefeuert.
Während die Datenberge expontiell wachsen, hängt jedoch die Fähigkeit hinterher, sie zu analysieren und nutzbringend zu verwerten, sagen Kritiker wie Professor Daniel J. Grimm vom Georgetown University Law Center. «Es besteht eine Kluft zwischen Daten, die gespeichert wurden, und Daten, die leicht analysiert und verstanden werden können», schreibt Grimm in einem Artikel für die juristische Fachzeitschrift American University Law Review. Angetrieben durch das Versprechen, aus den gespeicherten Daten künftig einen geschäftlichen Nutzen ziehen zu können, häufen Unternehmen immer grössere Datenmengen an, die sich allerdings schon lange nicht mehr effektiv verwalten lassen.
Weniger als die Hälfte der in einem Unternehmen gespeicherten strukturierten Daten werden überhaupt für geschäftliche Entscheidungen herangezogen, ergänzen Leandro DalleMule und Thomas H. Davenport in der Harvard Business Review. Bei den unstrukturierten Daten liege der Anteil der genutzten Informationen sogar bei unter einem Prozent. Dazu komme, dass mehr als 70 Prozent der Mitarbeiter in Unternehmen auf Daten zugreifen können, die sie nicht nicht für ihre Aufgaben benötigen. Das Marktforschungsunternehmen IDC hat errechnet, dass bis zum Jahr 2025 rund 80 Prozent der weltweit gespeicherten Daten unstrukturiert und damit kaum nutzbar sein werden.
Daten klassifizieren
Experten wie der Berater und «Data Doc» Thomas C. Redman von Data Quality Solutions gehen von drei Kategorien aus, wenn es um Daten in Unternehmen geht. Da sind zunächst die geschäftskritischen Daten, die für das wirtschaftliche Weiterbestehen und Wachstum eines Unternehmens unverzichtbar sind. Sie wurden bereits strukturiert. Das britische Marktforschungsunternehmen Vanson Bourne hat im Auftrag des Software-Herstellers Veritas in einer Studie ermittelt, dass weltweit im Schnitt nur 14 Prozent aller in Unternehmen gespeicherten Daten als geschäftskritisch eingestuft werden können. Die zweite Gruppe sind sogenannte ROT-Daten. Die Abkürzung steht für «redundant, obsolet und trivial», also für Informationen, die doppelt oder noch öfter vorhanden sind, die aus anderen Gründen nicht (mehr) benötigt werden und die damit wertlos sind.
Diese Daten können meist bedenkenlos gelöscht werden, um Speicherplatz und Kosten zu sparen. Dabei sollte allerdings auf eine sichere Löschung geachtet werden, damit später keine unautorisierte Wiederherstellung mehr möglich ist. Laut Vanson Bourne liegt der Anteil der überflüssigen ROT-Daten in Unternehmen im Durchschnitt bei 32 Prozent aller gespeicherten Informationen. Das bedeutet, dass nahezu jede dritte Datei bekannt überflüssig ist und nur noch Kosten verursacht.
Bleibt noch die dritte Gruppe, die sogenannten «dunklen Daten» (im englischen Sprachgebrauch «Dark Data»). Diese Gruppe wird laut Vanson Bourne immer grösser. Bei Dark Data handelt es sich ebenfalls um bereits gesammelte und gespeicherte Daten. Sie wurden aber noch nicht klassifiziert, sind also unstrukturiert. Ein meist kleiner Teil dieser Informationen hat durchaus einen geschäftlichen Wert für das Unternehmen, sie dürfen daher nicht einfach gelöscht werden. Der grosse Rest hat aber keine echte Bedeutung und ist damit ebenso wie die ROT-Daten überflüssig. Sie sind also ebenfalls «redundant, obsolet und trivial».