Data Engineering und Big Data

Fakult?t

Wirtschafts- und Sozialwissenschaften

Version

Version 10.0 vom 08.02.2019

Modulkennung

22M0989

Modulname (englisch)

Data Engineering and Big Data

Studieng?nge mit diesem Modul

Wirtschaftsinformatik (Master) (M.Sc.)

Niveaustufe

4

Kurzbeschreibung

Das Modul vermittelt den Umgang mit strukturierten, semi-strukturierten, polystrukturierten und unstrukturierten Daten durch eine nachhaltige Datenbewirtung sowohl für klassische Anwendungsgebiete als auch für Big Data-Anwendungen, bei denen Volume, Variety und Velocity besondere Relevanz haben.

Lehrinhalte
  • Notwendigkeit und Herausforderungen klassischer Datenbewirtschaftung und Big DataDatenhaltung (Objektrelational und NoSQL)Datenhaltungsarchitekturen (einschl. Replica, Sharding, Scale-out , Scale-up Konzepte)
  • Cluster-Datenbanken
  • F?derierte Datenbanken
  • Parallele und verteilte DatenbankenDatenbewirtschaftungsarchitekturen
  • Data Warehousing (einschl. ETL-Prozesse)
  • Data Lakes (einschl. ELT-Prozesse)
  • Datenbewirtschaftung und Internet of Things / Industrie 4.0
  • Datenbewirtschaftung für WearablesDatenintegrationsans?tzeAusgew?hlte Aspekte der Big Data LandscapeAktuelle, etablierte Big Data FrameworksDatenstrommanagementsystemeDatenvorverarbeitung in Datenanalyseprozessen
Lernergebnisse / Kompetenzziele

Wissensverbreiterung
Studierende, die dieses Modul erfolgreich studiert haben, kennen grundlegende Konzepte und Verfahren zur Datenhaltung, -bewirtschaftung, -integration und -vorverarbeitung, auch unter Berücksichtigung von Big Data. Sie sind in der Lage, Datenbewirtschaftungsarchitekturkonzepte hinsichtlich ihrer Eignung zu bewerten und ausgew?hlte Aufgabenstellungen zu bearbeiten.
Wissensvertiefung
Die Studierenden, die dieses Modul erfolgreich studiert haben, verfügen über detailliertes Wissen zu Aufgaben und M?glichkeiten moderner Datenbewirtschaftungsans?tze. Darüber hinaus verfügen Sie über Spezialwissen hinsichtlich der Verarbeitung von Daten aus verschiedenen Quellen.
K?nnen - instrumentale Kompetenz
Die Studierenden k?nnen die Einführung und den Betrieb (datengetriebener), zeitgem??er und nachhaltiger Datenhaltung begleiten. Sie sind in der Lage, Daten aus vielf?ltigen Quellen zu integrieren und die Daten nachgelagerten Systemen, z.B. der Datenanalyse, integriert, transformiert und ggf. aufgabengerecht bereitzustellen.
K?nnen - kommunikative Kompetenz
Die Studierenden sind in der Lage, gemeinsam mit Dom?nenexperten L?sungsans?tze zu diskutieren. Ihre sozio-kommunikative Kompetenz bef?higt sie, ihre Standpunkte und Erkenntnisse sprachad?quat gegenüber Fach- und Dom?nenexperten zu vertreten und zu begründen.
K?nnen - systemische Kompetenz
Die Studierenden sind in bef?higt, Datenhaltung, -integration und -bereitstellung ganzheitlich zu betrachten, um eine konsistente, effiziente Datenbewirtschaftung zu erm?glichen. Sie sind in der Lage, sich in neue Datenverarbeitungsframeworks selbst?ndig einzuarbeiten, diese auf der Basis der vermittelten Konzepte zu bewerten und ggf. in eine Datenhaltungslandschaft zu integrieren

Lehr-/Lernmethoden

In seminaristischen Vorlesungen werden die theoretischen Grundlagen vermittelt und in zunehmend komplexeren ?bungen anhand von Fallbeispielen behandelt.

Empfohlene Vorkenntnisse

(relationale) Datenbanken, Programmierkenntnisse sind von Vorteil

Modulpromotor

Tapken, Heiko

Lehrende

Tapken, Heiko

Leistungspunkte

5

Lehr-/Lernkonzept
Workload Dozentengebunden
Std. WorkloadLehrtyp
24Vorlesungen
7Teletutorien
Workload Dozentenungebunden
Std. WorkloadLehrtyp
50Veranstaltungsvor-/-nachbereitung
69?bungen
Literatur

Big Data in der Praxis: L?sungen mit Hadoop, Spark, HBase und Hive. Daten speichern, aufbereiten, visualisieren, Jonas Freiknecht, 2018

NoSQL: Einstieg in die Welt nichtrelationaler Web 2.0 Datenbanken, Stefan Edlich und Achim Friedland, 2011

Data Mining: Concepts and Techniques, 3rd Edition, Jiawei Han, Micheline Kamber, Jian Pei, 2011

Big Data: Entwicklung und Programmierung von Systemen für gro?e Datenmengen und Einsatz der Lambda-Architektur, Nathan Marz und James Warren, 2016

Verteiltes und Paralleles Datenmanagement: Von verteilten Datenbanken zu Big Data und Cloud, Erhard Rahm und Gunter Saake, 2015

Prüfungsleistung
  • Hausarbeit
  • Portfolio Prüfung
  • Projektbericht, schriftlich
Bemerkung zur Prüfungsform

Die Portfolio Prüfung umfasst insgesamt 100 Punkte. Sie setzt sich zusammen aus einem Referat (40 Punkte) und einer Hausarbeit (60 Punkte).

Dauer

1 Semester

Angebotsfrequenz

Nur Sommersemester

Lehrsprache

Deutsch