Data Processing at Scale

Apache Spark
Data Analytics

Data is kennis en kennis is macht. Maar het efficiënt verwerken van data kan een uitdaging zijn bij het opschalen. Deze training duikt diep in een van de populairste en meest schaalbare tools voor de transformatie van grote hoeveelheden Data: Apache Spark.

In deze Data Processing at Scale training leer je alles wat je moet weten over hoe Apache Spark werkt. Door een combinatie van theorie en hands-on oefeningen krijg je ook de vaardigheden om efficiënte ETL Spark jobs te schrijven om grote datasets te verwerken.

Wil je je team(s) of organisatie trainen?

Nico helpt je graag verder met op maat gemaakte trainingsoplossingen voor jouw organisatie.

Nico de Jonge
Adviseur Data- en AI-training

+31 6 2147 5162
nico.dejonge@xebia.com
linkedin.com/in/nico-de-jonge/

Neem contact op

Wat ga je leren?

Na de training ben je in staat om:

Apache Spark en de geavanceerde functies te gebruiken.

Efficiënte ETL-jobs te schrijven.

De API te gebruiken om data te transformeren op basis- en geavanceerd niveau.

Te denken in termen van gedistribueerde systemen bij het schrijven van Spark-taken.

Belangrijkste leerdoelen

  1. Werking van Apache Spark.
  2. Data laden vanuit verschillende formaten.
  3. Basis- en geavanceerde dataframe operations.
  4. Window en user-defined functions.
  5. Unit testing.
  6. Praktijkoefening om logs op grote schaal te analyseren om trending topics te vinden.

Programma

  • Hoe werkt Apache Spark.
  • Gegevens laden vanuit verschillende formats.
  • Basis- en geavanceerde dataframebewerkingen, Window- en user-defined functions.

Voor wie is de training?

Deze training is perfect voor jou als je als data- of machine learning engineer te maken hebt met het transformeren van grote hoeveelheden data.

Requirements

Deze training vereist basiservaring met Python. Heb je die ervaring nog nodig? Kijk dan eens naar Python for Data Analysis.

Waarom zou ik deze training volgen?

Optimaal gebruik van Spark

Apache Spark en zijn geavanceerde functies gebruiken en efficiënte ETL-taken schrijven

Geavanceerd

Leer meer over de werking van Apache Spark, het laden van data vanuit verschillende formats en basis- en geavanceerde bewerkingen met dataframes.

Data sets verwerken

De vaardigheden verwerven die nodig zijn om grote data sets te verwerken

Wat moet je nog meer weten?

Na registratie voor deze training ontvang je een bevestigingsmail met praktische informatie. Een week voor de training vragen we je naar eventuele dieetwensen en delen we literatuur uit als je je moet voorbereiden.

We kijken uit naar je deelname!

Trainingsinformatie

Alle literatuur en trainingsmaterialen zijn bij de prijs inbegrepen.

Een heerlijke lunch en snacks zijn bij de training inbegrepen.

Nadat je je hebt ingeschreven voor deze training, ontvang je een bevestigingsmail met praktische informatie.

Aankomende trainingen

View all trainings
Advanced Power BI – DAX and Data Modeling

Vergroot nu jouw Power BI-kennis met DAX en Data Modeling.

Juan Manuel Perafan

Data Analytics
Microsoft
PowerBI
2 days
Virtual

Next:

13 – 14 mei, 2024

From:

€1310

Bekijk training
A/B Testing and Experiments

In de A/B-Testing and Experiments-training leer je alles om je eigen experimenten succesvol uit te voeren.

Data Analytics
4 days
Virtual

Next:

8 okt, 2024

From:

€1355

Bekijk training
Deep Learning for Natural Language Processing 

Leer het volledige potentieel van Deep Learning kennen met onze Deep Learning for Natural Language Processing training.

Data Analytics
Data Science
Gegevens en AI
Bekijk training
Analytics for Executives

Bouw aan je Data en AI vaardigheden en het maken van data-gedreven business forecasts met de Analytics for Executives training.

Data Analytics
Bekijk training
Advanced Analytics Translation 

Verdiep jouw Analytics Translation skills voor ideation, business case building en de samenwerking met stakeholders.

Steven van Duin

Data Analytics
2 days
In Person

Next:

23 – 24 mei, 2024

From:

€2095

Bekijk training

Kun je de training die je zoekt niet vinden? Er is nog meer!