Data Processing at Scale
Data is kennis en kennis is macht. Maar het efficiënt verwerken van data kan een uitdaging zijn bij het opschalen. Deze training duikt diep in een van de populairste en meest schaalbare tools voor de transformatie van grote hoeveelheden Data: Apache Spark.
In deze Data Processing at Scale training leer je alles wat je moet weten over hoe Apache Spark werkt. Door een combinatie van theorie en hands-on oefeningen krijg je ook de vaardigheden om efficiënte ETL Spark jobs te schrijven om grote datasets te verwerken.
Wil je je team(s) of organisatie trainen?
Nico helpt je graag verder met op maat gemaakte trainingsoplossingen voor jouw organisatie.
Neem contact opWat ga je leren?
Na de training ben je in staat om:
Apache Spark en de geavanceerde functies te gebruiken.
Efficiënte ETL-jobs te schrijven.
De API te gebruiken om data te transformeren op basis- en geavanceerd niveau.
Te denken in termen van gedistribueerde systemen bij het schrijven van Spark-taken.
Belangrijkste leerdoelen
- Werking van Apache Spark.
- Data laden vanuit verschillende formaten.
- Basis- en geavanceerde dataframe operations.
- Window en user-defined functions.
- Unit testing.
- Praktijkoefening om logs op grote schaal te analyseren om trending topics te vinden.
Programma
- Hoe werkt Apache Spark.
- Gegevens laden vanuit verschillende formats.
- Basis- en geavanceerde dataframebewerkingen, Window- en user-defined functions.
Voor wie is de training?
Deze training is perfect voor jou als je als data- of machine learning engineer te maken hebt met het transformeren van grote hoeveelheden data.
Requirements
Deze training vereist basiservaring met Python. Heb je die ervaring nog nodig? Kijk dan eens naar Python for Data Analysis.
Waarom zou ik deze training volgen?
Optimaal gebruik van Spark
Apache Spark en zijn geavanceerde functies gebruiken en efficiënte ETL-taken schrijven
Geavanceerd
Leer meer over de werking van Apache Spark, het laden van data vanuit verschillende formats en basis- en geavanceerde bewerkingen met dataframes.
Data sets verwerken
De vaardigheden verwerven die nodig zijn om grote data sets te verwerken
Wat moet je nog meer weten?
Na registratie voor deze training ontvang je een bevestigingsmail met praktische informatie. Een week voor de training vragen we je naar eventuele dieetwensen en delen we literatuur uit als je je moet voorbereiden.
We kijken uit naar je deelname!
Trainingsinformatie
Alle literatuur en trainingsmaterialen zijn bij de prijs inbegrepen.
Een heerlijke lunch en snacks zijn bij de training inbegrepen.
Nadat je je hebt ingeschreven voor deze training, ontvang je een bevestigingsmail met praktische informatie.