Jetzt Kurs bewerten

Microsoft Implement a Data Analytics Solution with Azure Databricks

In diesem Kurs wird erläutert, wie Sie Databricks und Apache Spark auf Azure verwenden, um Datenprojekte von der Erkundung bis zur Produktion zu nutzen. Sie lernen, wie Sie mit Spark DataFrames, Spark SQL und PySpark groß angelegte Datensätze einlesen, transformieren und analysieren und gleichzeitig Vertrauen in die Verwaltung verteilter Datenverarbeitungsprozesse gewinnen.

Vor Ort
2 Termine
1 Tag

Unser Angebot richtet sich ausschließlich an Unternehmer (§ 14 BGB), Gewerbetreibende, Freiberufler sowie öffentliche Auftraggeber. Kein Verkauf an Verbraucher (§ 13 BGB).

Artikelnummer: MS-DP-3011 Kategorien: , Marke:

Kursdetails & Termine

Kursbeschreibung

In diesem Kurs wird erläutert, wie Sie Databricks und Apache Spark auf Azure verwenden, um Datenprojekte von der Erkundung bis zur Produktion zu nutzen. Sie lernen, wie Sie mit Spark DataFrames, Spark SQL und PySpark groß angelegte Datensätze einlesen, transformieren und analysieren und gleichzeitig Vertrauen in die Verwaltung verteilter Datenverarbeitungsprozesse gewinnen. Dabei sammeln Sie praktische Erfahrung mit dem Databricks-Arbeitsbereich, indem Sie in Clustern navigieren sowie Delta-Tabellen erstellen und optimieren. Außerdem werden Sie sich mit den Datentechnikpraktiken vertraut machen, einschließlich des Entwerfens von ETL-Pipelines, der Behandlung der Schemaentwicklung und der Erzwingung der Datenqualität. Der Kurs verlagert den Schwerpunkt dann auf die Orchestrierung und zeigt Ihnen, wie Sie Workloads mit Lakeflow Jobs und Pipelines automatisieren und verwalten können. Um die Dinge abzurunden, erkunden Sie Governance- und Sicherheitsfunktionen wie Unity Catalog und Purview-Integration, um sicherzustellen, dass Sie mit Daten in einer sicheren, gut verwalteten und produktionsfähigen Umgebung arbeiten können.

Seminarinhalte

  • Erkunden von Azure Databricks
  • Durchführen einer Datenanalyse mit Azure Databricks
  • Verwenden von Apache Spark in Azure Databricks
  • Verwalten von Daten mit Delta Laken
  • Erstellen von Lakeflow Declarative Pipelines
  • Bereitstellen von Workloads mit Lakeflow Jobs

Zielgruppe

Dieser Kurs richtet sich an Datenprofis, die ihre Fähigkeiten beim Erstellen und Verwalten von Datenlösungen auf Azure Databricks stärken möchten. Es ist gut geeignet, wenn Sie Dateningenieur, Datenanalyst oder Entwickler mit einer früheren Erfahrung in Python, SQL und grundlegenden Cloudkonzepten sind und sie über eine kleine Analyse in skalierbare, produktionsfähige Datenverarbeitung hinausgehen möchten. Ganz gleich, ob Ihr Ziel darin besteht, Analyseworkflows zu modernisieren, Pipelines zu optimieren oder Daten im großen Maßstab besser zu verwalten und zu steuern, dieser Lernpfad bietet Ihnen die praktischen Fähigkeiten, um erfolgreich zu sein.

Voraussetzungen

Bevor Sie mit diesem Lernpfad beginnen, sollten Sie sich bereits mit den Grundlagen von Python und SQL vertraut machen. Dazu gehört die Möglichkeit, einfache Python-Skripts zu schreiben und mit allgemeinen Datenstrukturen zu arbeiten sowie SQL-Abfragen zum Filtern, Verknüpfen und Aggregieren von Daten zu schreiben. Ein grundlegendes Verständnis gängiger Dateiformate wie CSV, JSON oder Parkett hilft auch beim Arbeiten mit Datasets.

Darüber hinaus ist die Vertrautheit mit dem Azure-Portal und den Kerndiensten wie Azure Storage wichtig, zusammen mit einem allgemeinen Bewusstsein für Datenkonzepte wie Batch- und Streamingverarbeitung und strukturierte und unstrukturierte Daten. Obwohl nicht zwingend erforderlich, kann vorherige Erfahrung mit Big Data-Frameworks wie Spark und der Arbeit mit Jupyter-Notizbüchern den Übergang zu Databricks erleichtern.

Lernziele

Anfrage zum Firmenseminar

Anfrage Firmenseminar

Kursname
Vorname
Nachname
Firma
Telefonnummer
Ihre Nachricht

Termine & Buchung

Terminfilter

Durchführungsart

Ihre Auswahl

Verfügbare Termine

Kursdetails & Termine

In diesem Kurs wird erläutert, wie Sie Databricks und Apache Spark auf Azure verwenden, um Datenprojekte von der Erkundung bis zur Produktion zu nutzen. Sie lernen, wie Sie mit Spark DataFrames, Spark SQL und PySpark groß angelegte Datensätze einlesen, transformieren und analysieren und gleichzeitig Vertrauen in die Verwaltung verteilter Datenverarbeitungsprozesse gewinnen. Dabei sammeln Sie praktische Erfahrung mit dem Databricks-Arbeitsbereich, indem Sie in Clustern navigieren sowie Delta-Tabellen erstellen und optimieren. Außerdem werden Sie sich mit den Datentechnikpraktiken vertraut machen, einschließlich des Entwerfens von ETL-Pipelines, der Behandlung der Schemaentwicklung und der Erzwingung der Datenqualität. Der Kurs verlagert den Schwerpunkt dann auf die Orchestrierung und zeigt Ihnen, wie Sie Workloads mit Lakeflow Jobs und Pipelines automatisieren und verwalten können. Um die Dinge abzurunden, erkunden Sie Governance- und Sicherheitsfunktionen wie Unity Catalog und Purview-Integration, um sicherzustellen, dass Sie mit Daten in einer sicheren, gut verwalteten und produktionsfähigen Umgebung arbeiten können.

  • Erkunden von Azure Databricks
  • Durchführen einer Datenanalyse mit Azure Databricks
  • Verwenden von Apache Spark in Azure Databricks
  • Verwalten von Daten mit Delta Laken
  • Erstellen von Lakeflow Declarative Pipelines
  • Bereitstellen von Workloads mit Lakeflow Jobs

Dieser Kurs richtet sich an Datenprofis, die ihre Fähigkeiten beim Erstellen und Verwalten von Datenlösungen auf Azure Databricks stärken möchten. Es ist gut geeignet, wenn Sie Dateningenieur, Datenanalyst oder Entwickler mit einer früheren Erfahrung in Python, SQL und grundlegenden Cloudkonzepten sind und sie über eine kleine Analyse in skalierbare, produktionsfähige Datenverarbeitung hinausgehen möchten. Ganz gleich, ob Ihr Ziel darin besteht, Analyseworkflows zu modernisieren, Pipelines zu optimieren oder Daten im großen Maßstab besser zu verwalten und zu steuern, dieser Lernpfad bietet Ihnen die praktischen Fähigkeiten, um erfolgreich zu sein.

Bevor Sie mit diesem Lernpfad beginnen, sollten Sie sich bereits mit den Grundlagen von Python und SQL vertraut machen. Dazu gehört die Möglichkeit, einfache Python-Skripts zu schreiben und mit allgemeinen Datenstrukturen zu arbeiten sowie SQL-Abfragen zum Filtern, Verknüpfen und Aggregieren von Daten zu schreiben. Ein grundlegendes Verständnis gängiger Dateiformate wie CSV, JSON oder Parkett hilft auch beim Arbeiten mit Datasets.

Darüber hinaus ist die Vertrautheit mit dem Azure-Portal und den Kerndiensten wie Azure Storage wichtig, zusammen mit einem allgemeinen Bewusstsein für Datenkonzepte wie Batch- und Streamingverarbeitung und strukturierte und unstrukturierte Daten. Obwohl nicht zwingend erforderlich, kann vorherige Erfahrung mit Big Data-Frameworks wie Spark und der Arbeit mit Jupyter-Notizbüchern den Übergang zu Databricks erleichtern.

Anfrage Firmenseminar

Kursname
Vorname
Nachname
Firma
Telefonnummer
Ihre Nachricht

Termine & Buchung

Terminfilter

Durchführungsart

Ihre Auswahl

Verfügbare Termine

Kursbewertungen

Rezensionen

Es gibt noch keine Rezensionen.

Hinterlassen Sie eine Kursbewertung

Ihre E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Wir sind persönlich für Sie da

Nicht jeder Kurs passt sofort auf Anhieb. Wir helfen Ihnen dabei, aus Themen, Formaten und Anforderungen die passende Lösung zu finden – persönlich, praxisnah und mit Blick auf Ihren tatsächlichen Bedarf.

  • Persönliche Unterstützung bei der KursauswahlPersönliche Unterstützung bei der Kursauswahl
  • Passende Formate für Teams und EinzelpersonenPassende Formate für Teams und Einzelpersonen
  • Hilfe bei offenen Fragen vor der AnfrageHilfe bei offenen Fragen vor der Anfrage
  • Telefon+49 (911) 9523 – 260
  • Emailtrainings@sandata.de

Planen Sie einen Kurs oder Seminar und möchten sich vorab informieren?

Nicole Mühlbauer

Leiterin / Key Account Managerin

Haben Sie bereits einen Kurs gebucht und noch Fragen zum Ablauf vor Ort oder Online?

Alison Kreis

Seminarorganisation /
Trainer:innen Management

Haben Sie Fragen zu einer Raumvermietung oder unseren Räumlichkeiten vor Ort?

Anouk Mendoza

Seminarorganisation / Raumvermietungen

Fragen & Antworten

Hier beantworten wir die häufigsten Fragen zu unseren Kursen, Abläufen und Formaten. Sollten Sie weitere Fragen haben, unterstützen wir Sie gerne persönlich.

Microsoft Implement a Data Analytics Solution with Azure Databricks im Überblick