Data Mining & Datenwissenschaften

Was macht ein* Data Scientist*?

Das Arbeitsfeld eines* Data Scientists* ist unglaublich vielfältig. Sie kennen sich mit Methoden des Maschinellen Lernens aus und beherrschen quantitative Analyseverfahren.  

 

Die Basis bildet ein Studium der Statistik oder der Mathematik mit entsprechender Spezialisierung auf Statistik sowie zusätzlich das Studium einer Realwissenschaft wie Ökonomie. Gleichzeitig ist aber auch die praktische Erfahrung wesentlich, welche als empirischer* Forscher* an einer Hochschule oder an einer Universität erlangt wurde.


Häufig verwendete Methoden eines* Data Scientists* sind:

Lineare Regression

Sie ist besonders geeignet, um Beziehungen zwischen einer abhängigen und einer oder mehreren unabhängigen Variablen herzustellen. Ziel der linearen Regression ist es immer,  das Ausmaß der Korrelation zwischen zwei Variablen herauszufinden.

Zeitreihen-analysen

Hier werden bestimmte Merkmale über einen bestimmten Zeitraum analysiert. Wesentliches Ziel ist es, auf Basis vorhandener Daten Aussagen für die Zukunft treffen zu können.

Monte-Carlo-Simulation

Die Monte-Carlo-Simulation wird verwendet um Hypothesen zu überprüfen, Parameter zu schätzen, Szenarien vorherzusagen und Modelle zu überprüfen. Mit dieser Simulationsmethode kann man sehr schnell große Stichproben simulieren.

Modellierung von Geodaten

Geodaten sind nicht beliebig und zufällig, sondern ortsabhängig, weshalb es für deren Analyse spezielle geostatistische Verfahren bedarf. Kriging und Krige sind statistische Methoden, die zur Modellierung von Geodaten verwendet werden können.

 


 
© Picture "Schleswig Holsteinisches Wattenmeer" by Michael Schroeren