Von Christine Schlütz - 9. März 2020
Data Science ist ein interdisziplinäres Bündel aus Informatik, Mathematik, Betriebswirtschaftslehre und Statistik. Im Allgemeinen geht es um die Auswertung von Daten unter Anwendung von wissenschaftlichen Methoden, um diese im Kontext von Unternehmen und Organisationen einzusetzen. Ein Data Scientist beschäftigt sich mit Datenquellen, die betriebswirtschaftliche Zusammenhänge erfassen und Handlungsmöglichkeiten ableiten lassen.
Data Science entstand aus wirtschaftlichen Entwicklungen, die unter Einfluss der Digitalisierung immer mehr digitale Geschäftsfelder hervor gerufen haben. Diese Verlagerung förderte die Produktion von Daten, die für unternehmerische Zwecke verwendet werden können. So konnten sich auch neue Berufsbilder wie die des Data Scientist, Data Analyst oder Data Engineers entwickeln.
Neben dem Data Scientist nimmt der Data Engineer eine wichtige Rolle bei der systematischen Auswertung von unternehmensbezogenen Daten ein, oft wird er auch als Big Data Engineer oder Architekt bezeichnet: Er kümmert sich um den Aufbau und die Überwachung der Hardware- und Software Infrastruktur im Rahmen der Datenanalyse. Hierzu zählt die Ermittlung und Speicherung von Daten sowie die Pflege, Aufbereitung und Weitergabe. Nicht nur die Arbeit mit der Verwendung von Daten macht den Job des Data Engineers aus, auch die Schaffung einer geeigneten Infrastruktur wie die Konzeption, der Einkauf und die Errichtung aller nötigen Komponenten liegt in seinem Verantwortungsbereich. Er muss für das Management von Daten ebenfalls Kenntnisse in der Erstellung und Pflege von Datenbanken mit SQL haben.
Oft unterschätzt wird auch der zwischenmenschliche, kommunikative Aspekt. Ein Data Engineer arbeitet mit Menschen zusammen, die sich nicht mit hochtechnischen, komplexen Sachverhalten auskennen. Hier muss er als Übersetzer fungieren und Vorgänge verständlich und greifbar darstellen. Der Data Engineer ist also ein Allrounder, der sowohl die Management-Komponente, die technische Affinität als auch zwischenmenschliche Fähigkeiten mitbringen muss. Somit ist er ein wichtiger Bestandteil einer jeden Data-Science Teams.
Mathematik & Statistik
Machine Learning
Statistisches Modellieren
Design-Affinität
überwachtes Lernen: Entscheidungsbäume, logistische Regression, ..
unbeaufsichtigtes Lernen: Clustering, Beschränkung der Dimensionalität
Optimierung: Gradienten-Abstieg & Varianten
Programmierung & Datenbanken
Programmiersprachen, z.B. Python
Statistische Berechnungssprachen, z.B. R
Datenbanken Management, z.B. SQL & NoSQL
relationale Algebra
..
Fachwissen & Soft Skills
Problemlöser
Interesse an Daten & Erkenntnissen
Strategisch, proaktiv, kreativ, innovativ, kollaborativ
..
Kommunikation & Visualisierung
Übersetzung von datengetriebenen Erkenntnissen in Entscheidungen und Handlungen
Storytelling Fähigkeiten
Visuelle Kunstgestaltung
R packages wie: ggplot oder lattice
..
Du findest Data Science spannend und möchtest dich darin weiterbilden? Hier gibt es mehr Infos zu unseren Kursen für Beginner im Thema Data Analytics!