E-Book von BigData-Insider Data Preparation

Von Michael Matzer

Anbieter zum Thema

Der Prozess der Datenaufbereitung (engl. Data Preparation) umfasst die Zusammenführung, Reinigung, Normalisierung, Umwandlung und Mischung von Daten, damit sie für analytische und andere Aufgaben in optimaler Qualität bereitstehen. Das E-Book „Data Preparation“ von BigData-Insider zeigt auf: Nur mit erstklassigen Daten lassen sich beispielsweise Lösungen für Machine Learning und Künstliche Intelligenz effizient, sicher und zuverlässig versorgen.

Das E-Book „Data Preparation“ steht ab sofort für alle registrierten Leserinnen und Leser von BigData-Insider kostenlos zum Download bereit.
Das E-Book „Data Preparation“ steht ab sofort für alle registrierten Leserinnen und Leser von BigData-Insider kostenlos zum Download bereit.
(Bild: Vogel IT-Medien)

Schon kleine Redundanzen und Lücken in Datensätzen können zu großen Problemen führen. Zumindest ist dann langwierige Handarbeit bei der Korrektur oder zusätzlicher Entwicklungsaufwand notwendig. Im schlimmeren Fällen kann es dazu kommen, dass sich die Einführung von neuen Systemen verzögert, Budgets falsch geplant oder die ganze Unternehmensstrategie mit falschen Daten in die falsche Richtung gelenkt wird. Im Extremfall wird sogar die Wettbewerbs- und Zukunftsfähigkeit des Unternehmens bedroht. Es lohnt sich also, nicht nur die Qualität bestehender Daten zu untersuchen, sondern auch dafür zu sorgen, dass künftige Daten im Unternehmen von hoher Qualität sind. Letzteres wird als Data Quality Management bezeichnet.

Data Preparation ist für alle IT-Nutzer, die geeignete Informationen für eine Aufgabe wie etwa eine Marketingkampagne suchen, eine lästige, aber notwendige Angelegenheit, eine Hürde, die sie von echter Produktivität abhält. Doch auf vielen IT-Konferenzen ist zu hören, dass diese leidgeprüften Anwender bis zu vier Fünftel ihrer kostbaren Zeit darauf verwenden, Daten zu suchen, aufzubereiten und bereitzustellen. Und damit sind nicht einmal die Excel-Jockeys gemeint, sondern Nutzer von moderneren Informations-Suiten. Seit dem Jahr 2018 haben mehrere neue Anbieter wie Trifacta interessante Ansätze zur Lösung des Problems Data Preparation veröffentlicht, und seit 2020 gibt es auch von Cloud-Anbieter Amazon Web Services den entsprechenden On-demand-Service Amazon Glue DataBrew.

Der Mehrwert einer Data-Preparation-Lösung ist beträchtlich, denn er kommt nicht nur den Prozessen zugute, sondern auch Business-Aspekten wie Data Governance, Compliance und Vertrauenswürdigkeit der wirtschaftlichen Aussagen. Im Bereich der Business Intelligence beschleunigen und demokratisieren solche Lösungen die Prozesse für das Erlangen von Erkenntnissen, das Fällen von Entscheidungen und die entsprechenden Handlungen. Das Reinigen usw. von Daten ist kein Selbstzweck, sondern vielmehr lassen sich vorhandene Daten derart mit wirtschaftlichen Aspekten anreichern, dass sie zunehmend an Wert für das Unternehmen gewinnen.

Nicht zuletzt sind angereicherte und vertrauenswürdige Daten von höchster Bedeutung für die Anwendungsentwicklung. Nur wer Umfang, Standort und Besitzer von Daten kennt, kann mit ihnen auch entsprechend verlässliche Apps entwickeln und testen – das gilt insbesondere für Big Data und Streaming Data, etwa im Internet of Things (IoT) und in Industrie 4.0. Anders als erwartet ist Data Preparation also auch ein Thema für Entwickler und Sicherheitsexperten.

Das E-Book „Data Preparation“will einen Überblick über das Thema, seine Bedeutungsaspekte bis hin zum Qualitätsmanagement, aber auch über den Markt, ausgewählte Produkte und ein oder zwei Anwender verschaffen.

Artikelfiles und Artikellinks

(ID:48583603)

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Big Data, Analytics & AI

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung.

Aufklappen für Details zu Ihrer Einwilligung