Data Processing at Scale

Apache Spark

Data Analytics

Data is kennis en kennis is macht. Maar het efficiënt verwerken van data kan een uitdaging zijn bij het opschalen. Deze training duikt diep in een van de populairste en meest schaalbare tools voor de transformatie van grote hoeveelheden Data: Apache Spark.

In deze Data Processing at Scale training leer je alles wat je moet weten over hoe Apache Spark werkt. Door een combinatie van theorie en hands-on oefeningen krijg je ook de vaardigheden om efficiënte ETL Spark jobs te schrijven om grote datasets te verwerken.

Wil je je team(s) of organisatie trainen?

Nico helpt je graag verder met op maat gemaakte trainingsoplossingen voor jouw organisatie.

Nico de Jonge
Adviseur Data- en AI-training

+31 6 2147 5162
nico.dejonge@xebia.com
linkedin.com/in/nico-de-jonge/

Neem contact op

Wat ga je leren?

Na de training ben je in staat om:

Apache Spark en de geavanceerde functies te gebruiken.

Efficiënte ETL-jobs te schrijven.

De API te gebruiken om data te transformeren op basis- en geavanceerd niveau.

Te denken in termen van gedistribueerde systemen bij het schrijven van Spark-taken.

Belangrijkste leerdoelen

Werking van Apache Spark.
Data laden vanuit verschillende formaten.
Basis- en geavanceerde dataframe operations.
Window en user-defined functions.
Unit testing.
Praktijkoefening om logs op grote schaal te analyseren om trending topics te vinden.

Programma

Dag 1

Hoe werkt Apache Spark.
Gegevens laden vanuit verschillende formats.
Basis- en geavanceerde dataframebewerkingen, Window- en user-defined functions.

Dag 2

Voor wie is de training?

Deze training is perfect voor jou als je als data- of machine learning engineer te maken hebt met het transformeren van grote hoeveelheden data.

Requirements

Deze training vereist basiservaring met Python. Heb je die ervaring nog nodig? Kijk dan eens naar Python for Data Analysis.

Waarom zou ik deze training volgen?

Optimaal gebruik van Spark

Apache Spark en zijn geavanceerde functies gebruiken en efficiënte ETL-taken schrijven

Geavanceerd

Leer meer over de werking van Apache Spark, het laden van data vanuit verschillende formats en basis- en geavanceerde bewerkingen met dataframes.

Data sets verwerken

De vaardigheden verwerven die nodig zijn om grote data sets te verwerken

Wat moet je nog meer weten?

Na registratie voor deze training ontvang je een bevestigingsmail met praktische informatie. Een week voor de training vragen we je naar eventuele dieetwensen en delen we literatuur uit als je je moet voorbereiden.

We kijken uit naar je deelname!

Trainingsinformatie

Alle literatuur en trainingsmaterialen zijn bij de prijs inbegrepen.

Een heerlijke lunch en snacks zijn bij de training inbegrepen.

Nadat je je hebt ingeschreven voor deze training, ontvang je een bevestigingsmail met praktische informatie.

Aankomende trainingen

View all trainings

Advanced Power BI – DAX and Data Modeling

Vergroot nu jouw Power BI-kennis met DAX en Data Modeling.

Juan Manuel Perafan

Data and AI

Data Analytics

Microsoft

PowerBI

2 days

Virtual

13 – 14 mei, 2024

From:

€1310

Bekijk training

A/B Testing and Experiments

In de A/B-Testing and Experiments-training leer je alles om je eigen experimenten succesvol uit te voeren.

Data and AI

Data Analytics

4 days

Virtual

8 okt, 2024

From:

€1355

Bekijk training

Deep Learning for Natural Language Processing

Leer het volledige potentieel van Deep Learning kennen met onze Deep Learning for Natural Language Processing training.

Data and AI

Data Analytics

Data Science

Gegevens en AI

Bekijk training

Analytics for Executives

Bouw aan je Data en AI vaardigheden en het maken van data-gedreven business forecasts met de Analytics for Executives training.

Data and AI

Data Analytics

Bekijk training

Advanced Analytics Translation

Verdiep jouw Analytics Translation skills voor ideation, business case building en de samenwerking met stakeholders.

Steven van Duin

Data and AI

Data Analytics

2 days

In Person

23 – 24 mei, 2024

From:

€2095

Bekijk training

Kun je de training die je zoekt niet vinden? Er is nog meer!

Bekijk alle trainingen

This is
who
we are

Let us help your business

We’re here to help

This is
who
we are

Let us help your business

We’re here to help

Data Processing at Scale

Trainer Title

Wil je je team(s) of organisatie trainen?

Nico de Jonge
Adviseur Data- en AI-training

Wat ga je leren?

Belangrijkste leerdoelen

Programma

Dag 1

Dag 2

Voor wie is de training?

Waarom zou ik deze training volgen?

Optimaal gebruik van Spark

Geavanceerd

Data sets verwerken

Wat moet je nog meer weten?

Aankomende trainingen

Juan Manuel Perafan

Steven van Duin

Kun je de training die je zoekt niet vinden? Er is nog meer!

Data Processing at Scale

Wil je je team(s) of organisatie trainen?

Nico de JongeAdviseur Data- en AI-training

Wat ga je leren?

Belangrijkste leerdoelen

Programma

Dag 1

Dag 2

Voor wie is de training?

Waarom zou ik deze training volgen?

Optimaal gebruik van Spark

Geavanceerd

Data sets verwerken

Wat moet je nog meer weten?

Aankomende trainingen

Juan Manuel Perafan

Steven van Duin

Kun je de training die je zoekt niet vinden? Er is nog meer!

Nico de Jonge
Adviseur Data- en AI-training