Predictive Analytics im Big Data Kontext

Kursübersicht

Schulungsart: Classroom-Training, Dauer: 2 Tage
Predictive Analytics im Big Data Kontext
ist ein zweitägiger Kurs, der sich auf Data Science Techniken zum Umgang mit großen Datenmengen konzentriert. Dazu geben wir zunächst einen Überblick über verfügbare Technologien und bringen Schlagwörter wie Data Lake, In-Memory und Hadoop in einen sinnvollen Gesamtkontext. Die Teilnehmenden lernen danach, wie Big Data Technologie für die Lösung von Data Science Problemen genutzt werden kann. 
In der Schulung wird das Szenario aus den Grundlagenschulungen fortgeführt und auf den Big Data Maßstab skaliert. Hierfür wird RapidMiner Radoop verwendet, womit große Datenmengen analytisch im gewohnten Umfeld von RapidMiner Studio verarbeitet werden können. Durch die verteilte Ausführung auf Hadoop Clustern können beliebig große Datenmengen verarbeitet werden.

Die Teilnehmenden haben nach dem Kurs ein fundiertes Wissen über die Vor- und Nachteile von Big Data Technologien und wissen, wie große Datenmengen mittels RapidMiner auf Hadoop verarbeitet werden können. Die Übungsaufgaben werden auf den persönlichen Laptops der Teilnehmenden bearbeitet, sodass sie das Wissen und die beispielhaften Lösungen aus dem Kurs mitnehmen und als Grundlage für ihre eigenen Big Data Herausforderungen verwenden können.

Der Kurs ist so gestaltet, dass sich die Vermittlung theoretischer Grundlagen und bewährter Best Practices mit der praktischen Anwendung des vermittelten Wissens stetig abwechseln. Die Teilnehmenden bilden dabei ein Data Science Team, dass die Aufgaben des Ausbilders gemeinsam löst.

Kursziele

Zu den Fähigkeiten, welche die Teilnehmer in der Schulung erwerben, gehören:

  • Verständnis von Big Data Infrastruktur mit Möglichkeiten und Limitierungen
  • Verbindung eines Desktoprechners mit einem Hadoop Cluster
  • Exploration großer Datenmengen
  • Extrahieren und Laden von Daten
  • Erstellung von Big Data Analysen mit RapidMiner
  • Kenntnisse über Methoden zur effizienten Verarbeitung großer Datenmengen

Schulungsinhalte

Was ist Big Data und wann macht es Sinn?

Wann können Analysen von Big Data profitieren?

Einführung in Hadoop

  • Generelle Infrastruktur
  • Hadoop Integration mit RapidMiner: Radoop
  • Einführung in die Radoop Benutzungsoberfläche
  • Verbindungen von Desktoprechnern oder Laptops mit einem Hadoop Cluster

Datenexploration

  • Durchsuchen von Tabellen
  • Statistiken und Datenaggregation für High Level Informationen

Extrahieren und Laden von Daten

  • Formulierung von Anfragen/Queries
  • Daten in Hadoop einpflegen

Analyseprozesse auf Hadoop

  • In-Hadoop Training
  • Profilbildung und natürliche Aggregation
  • In-Memory Training, In-Hadoop Scoring

Jenseits natürlicher Aggregation

  • Chunking
  • Voting
  • In-Hadoop Modellierung
  • Clustering

Batchorientierte Verarbeitung großer Datenmengen

Benötigte Vorkenntnisse

Für diese Schulung benötigen Sie das Vorwissen aus den Schulungen Grundlagen 1 & 2 und Deployment - Produktiver Einsatz von Predictive Analytics. Falls Sie bereits über äquivalente Vorkenntnisse aus vergleichbaren Schulungen verfügen, sprechen Sie uns bitte an.

Zielgruppe

Data Scientists, fortgeschrittene Analysten

Zertifizierung

Nachdem Sie die Schulungen Deployment - Produktiver Einsatz von Predictive Analytics, Predictive Analytics im Big Data Kontext sowie die Schulung zu Text und Web Mining besucht haben, können Sie durch Ablegen einer Prüfung das Zertifikat „RapidMiner Expert“ erwerben, mit dem Sie Ihre neue Qualifizierung nach außen sichtbar machen.

Preis

Predictive Analytics   2000 € pro Teilnehmendem
Zertifikat                      für Teilnehmende kostenlos
*Eine spätere Prüfung ist gegen einen Aufpreis von 200 € jederzeit online möglich.

Bei der Anmeldung von mindestens zwei Teilnehmenden gilt ein Preis von 1440 € pro Teilnehmende.

Hier gibt es Informationen zu Unterkunft, Verpflegung und Anfahrt.