Beschreibung
In diesem Kurs für Fortgeschrittene lernen Sie, robuste Batch-Datenpipelines auf Google Cloud zu entwerfen, zu erstellen und zu optimieren. Über die grundlegende Datenverarbeitung hinaus lernen Sie umfangreiche Datentransformationen und eine effiziente Workflow-Orchestrierung kennen, die für zeitnahe Business Intelligence und kritische Berichte unerlässlich sind.nnSie erhalten praktische Übungen zur Implementierung von Dataflow für Apache Beam und Serverless für Apache Spark (Dataproc Serverless) und befassen sich mit wichtigen Überlegungen zur Datenqualität, Überwachung und Alarmierung, um die Zuverlässigkeit der Pipeline und die operative Exzellenz sicherzustellen. Grundlegende Kenntnisse in Data Warehousing, ETL/ELT, SQL, Python und Google Cloud-Konzepten werden empfohlen.
