Kommentar von Gregor Bieler, Aparavi Unstrukturierte Daten – von der teuren Risikoquelle zum Optimierungsfaktor

Von Gregor Bieler

Anbieter zum Thema

Unstrukturierte Daten begleiten Unternehmen vom Start-up bis zu Großkonzernen. Die Flut an Dateien, Präsentationen, Bildern und Videos bis hin zu E-Mails und Chat-Verläufen ist jedoch nur in den seltensten Fällen kanalisiert, beherrschbar und nutzbringend. Viel eher trifft häufig das Bild vom vermeintlich organisierten Chaos zu. Und das kann richtig teuer werden.

Der Autor: Gregor Bieler ist CEO EMEA bei Aparavi
Der Autor: Gregor Bieler ist CEO EMEA bei Aparavi
(Bild: Aparavi)

Das Problem mit unstrukturierten Daten klingt vordergründig erst einmal abstrakt. Es bekommt aber spätestens dann ganz reale Brisanz, wenn es um konkrete Anwendungsfälle geht, in denen unstrukturierte Daten gefunden, wieder zugänglich und nutzbar gemacht werden müssen. Praktisch kein Unternehmen, keine Organisation und keine Behörde ist frei von solchen Situationen. Sie reichen von rein technischen Projekten wie der Cloud-Migration über unternehmenskritische Sicherheitsaspekte wie den Schutz vor Breaches bis hin zur strafbewehrten Erfüllungspflicht rechtlicher Vorschriften im Kontext von DSGVO und ESG.

In all diesen Szenarien können sich Texte, E-Mails, Bilder, Präsentationen, Audio- oder Videodateien zu einem veritablen Problemfall ausweiten, wenn sie nicht transparent und beherrschbar gemacht werden. Und das wird oft genug teuer, wenn nicht gar existenzbedrohend.

Cloud-Migration

Ein typischer technischer Use Case für das Handling unstrukturierter Daten ist die Cloud-Migration. Sie wirft Fragen auf, die sich Unternehmen im laufenden On-premises-Betrieb nur selten stellen. Sie müssen sich einen umfassenden Überblick über ihren Datenbestand und dessen Zustand verschaffen und dann entscheiden, welche Daten in die Cloud migriert werden sollen – und welche nicht. Dabei stellt sich oft heraus, dass bis zu 80 Prozent der Daten unstrukturiert sind.

Sie müssen vor der Migration analysiert und konsolidiert werden. Viele unstrukturierte Daten erweisen sich entweder als redundant, obsolet oder trivial (ROT) oder sogar als Dark Data. Das sind unbekannte, ungenutzte und ungelöschte Daten. Entsprechende Tools filtern sie heraus, um das Datenvolumen und die damit verbunden Kosten zu reduzieren und die Datenmigration zu beschleunigen. Zusätzlich empfiehlt es sich, die Daten zu komprimieren.

Mit den besten Tools ist eine Kompressionsrate von bis zu 40 Prozent möglich. Vor dem Umzug in die Cloud werden die dafür ausgewählten Daten idealerweise analysiert und klassifiziert, um den späteren Zugriff und automatisiertes Daten-Management im Cloud-Betrieb zu erleichtern.

Data Breach

Typische Verteilung von strukturierten und unstrukturierten Daten in Unternehmen
Typische Verteilung von strukturierten und unstrukturierten Daten in Unternehmen
(Bild: Aparavi)

Wer glaubt, vor Datendiebstahl geschützt zu sein, wiegt sich in trügerischer Sicherheit. Die Frage ist nicht „ob“, sondern „wann“ ein solcher Fall eintritt. Ursache dafür muss nicht einmal ein böser Hacker sein, manchmal reicht auch ein vergessenes Smartphone im Imbiss oder liegengelassenes Notebook am Flughafen mit sensiblen unverschlüsselten Daten. Dazu kommt die Flut an Cyber-Attacken wie Malware, Phishing oder Ransomware, geknackten Passwörtern und nicht zuletzt dem gezielten Diebstahl von Geräten.

Für die Opfer solcher Vorfälle machen sich die Kosten dafür doppelt schmerzhafte bemerkbar. Erstens in den Strafen wegen Verstößen gegen die DSGVO-Vorschriften und zweitens in den wirtschaftlichen Schäden. Wer sich dagegen schützen will, muss seine unstrukturierten Daten finden, verstehen, bearbeiten und Prozesse automatisieren können. Denn in diesen stecken oft sicherheitssensible oder -kritische Informationen, wie etwa Passwörter, PINs oder Kreditkartennummern. Für Hacker sind sie ein gefundenes Fressen.

Dementsprechend wichtig ist das Sicherheits-Management unstrukturierter Daten. Wie bei der Cloud-Migration ist auch zum Schutz vor Data Breaches die Identifikation und Eliminierung von ROT-Daten im Daten-Set wichtig, hier allerdings als laufende Aufgabe. Händisch ist sie nicht zu bewältigen, deshalb sollte sie als automatisierter ständiger Prozess samt Reportfunktionen implementiert werden.

DSGVO-Konformität

Die DSGVO gilt für alle, ebenso wie die Strafen bei Verstößen. Und die Büßerliste ist lang: International reicht sie von Amazon über Google bis WhatsApp, die bekanntesten bislang Betroffenen in Deutschland sind unter anderem 1&1 Internet, AOK und Deutsche Wohnen. Und dabei geht es nicht um Kleingeld: Allein Amazon Europe musste 746 Millionen US-Dollar zahlen. 2021 wurde mit insgesamt knapp 1,3 Milliarden Euro an Bußgeldern und rund 500 Fällen in der EU erstmals die Milliarden-Hürde geknackt.

Zu den Strafzahlungen kommen in der Regel zusätzlich die Kosten für Reputationsverluste, Schadenersatzansprüche und die Beseitigung der Ursachen. Um die regulatorischen Anforderungen zu erfüllen und teuren Strafen zu entgehen, sind Transparenz und schneller Zugriff auf personenbezogene Informationen essenziell. Sie sind häufig als unstrukturierte Daten in einem meist unüberschaubaren Mix aus internen und externen IT-Systemen abgelegt. Mit einem intelligenten und automatisierten Datenmanagement können sie schnell identifiziert, verfügbar gemacht und dokumentiert werden. Gleiches gilt für die Beantwortung von DSGVO-Anfragen sowie die Erstellung von Löschkonzepten.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Big Data, Analytics & AI

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung.

Aufklappen für Details zu Ihrer Einwilligung

ESG-Reporting

Ab dem kommenden Jahr werden ESG-Reportings für Unternehmen mit mehr als 250 Mitarbeitern EU-weit obligatorisch. ESG (Environmental Social Governance) steht für die Offenlegung von Umwelt-, Sozial- und Corporate-Governance-Informationen. Rund 49.000 Unternehmen in Europa sind ab 2023 verpflichtet, spätestens vier Monate nach Geschäftsjahresende Nachhaltigkeitsinformationen im Lagebericht des Geschäftsberichts zu veröffentlichen. Ähnlich wie bei DSGVO-Verstößen sind auch beim ESG-Reporting Zuwiderhandlungen strafbewehrt. Es kann also wieder einmal teuer werden.

Und die Rechenschaftspflichten sind umfangreich. Sie betreffen unter anderem die sechs Umweltziele der Europäischen Union: Klimaschutz (Mitigation), Anpassung an den Klimawandel (Adaption), Wasser- und Meeresressourcen, Kreislaufwirtschaft, Umweltverschmutzung sowie biologische Vielfalt und Ökosysteme. Da kommt also eine Menge Arbeit auf die betroffenen Unternehmen zu. Sie eröffnet ihnen aber auch die Chance, sich Kunden, Partnern und Investoren als nachvollziehbar nachhaltige, verantwortungsbewusst handelnde Organisation zu präsentieren.

Das können sie aber nur, wenn sie die dafür notwendigen Informationen im Griff haben. Und auch die stecken häufig in unstrukturierten Daten. Am Anfang eines datenbezogenen Nachhaltigkeitskonzepts steht daher die Evaluierung und Analyse des kompletten Datenbestandes, um wirklich alle unstrukturierte Daten zu finden, zu verstehen und zu strukturieren. Gleichzeitig liefert ein sauberer, reduzierter Datenbestand ohne Dubletten und sonstige Altlasten einen Beitrag zur CO2-Reduktion.

Durch die Beseitigung von ungenutzten und überflüssigen, sowie die Komprimierung der verbleibenden Daten können Unternehmen viele Tonnen CO2 einsparen. Sie müssen dann nicht mehr aufwendig anderweitig reduziert, oder über teure Zertifikate finanziert werden. Von der Reduzierung der Energiekosten und dem höheren Sicherheitsniveau ganz zu schweigen. Das clevere Management unstrukturierter Daten lohnt sich also gleich mehrfach.

Artikelfiles und Artikellinks

(ID:48739476)