Kursbeskrivning
Big Data Engineer - Masterprogram
Ett unikt utbildnings och certifieringsprogram!
Detta Big Data Engineer Master's Program, som utvecklats i samarbete med IBM, ger utbildning i de konkurrenskraftiga färdigheter som behövs för en givande karriär inom datateknik. Du kommer att lära dig att behärska Hadoop big data-ramverket, utnyttja funktionaliteten i Apache Spark med Python, förenkla datalinjer med Apache Kafka och använda open source-databashanteringsverktyget MongoDB för att lagra data i big data-miljöer.
De viktigaste funktionerna utbildningen
- Certifieringar från IBM (för IBM-kurser) och AVC som erkänns av branschen
- Verkliga slutprojekt som ger praktisk branschutbildning
- 30+ ofta efterfrågade färdigheter
- Livstids tillgång till eLearning
- 35 timmars självstudier
- 132 timmar lärarledd utbildning
- Master classes, exklusiva mentorsessioner och hackathons av IBM
Mål för utbildningen
I slutet av detta masterprogram för Big Data Engineer kommer du att kunna
- Få en djup förståelse för de flexibla och mångsidiga ramverken i Hadoops ekosystem, t.ex. Pig, Hive, Impala, HBase, Sqoop, Flume och Yarn
- Behärska verktyg och färdigheter som datamodellering, databasgränssnitt, avancerad arkitektur, Spark, Sala, RDD, SparkSQL, Spark Streaming, Spark ML, GraphX, Sqoop, Flume, Pig, Hive, Impala och Kafka-arkitektur.
- Förstå hur man modellerar, samlar in, replikerar och shardar data med NoSQL-databashanteringssystemet MongoDB.
- Få expertis i att skapa och underhålla analysinfrastruktur och äga utveckling, distribution, underhåll och övervakning av arkitekturkomponenter
- Få insikter om hur man kan förbättra företagens produktivitet genom att bearbeta stora datamängder på plattformar som kan hantera deras volym, hastighet, variation och riktighet
- Lär dig hur Kafka används i praktiken, inklusive dess arkitektur och komponenter, få praktisk erfarenhet av att ansluta Kafka till Spark och arbeta med Kafka Connect.
- Förstå hur du använder Amazon EMR för att bearbeta data med hjälp av Hadoops ekosystemverktyg
Målgrupp
En Big Data Engineer bygger och underhåller datastrukturer och arkitekturer för att ta in, bearbeta och distribuera data för storskaliga, dataintensiva tillämpningar. Det är en lovande karriär för både nya och erfarna yrkesverksamma med en passion för data:
- IT-proffs
- Yrkesverksamma inom bank och finans
- Databasadministratörer
- Nybörjare inom datateknik
- Studenter i UG/ PG-program
Masterprogram med innehåll
- Big Data för datateknik (1 timme)
- Big Data Hadoop och Spark-utvecklare (84 timmar)
- PySpark-utbildning (3 timmar)
- MongoDB-utvecklare och administratör (56 timmar)
- Apache Kafke (10 timmar)
- AWS tekniska grunder (17,5 timmar)
- AWS Big Data-certifiering (61)
- Examensprojekt för Big Data (56 timmar)
Extra kurser:
- AWS Technical Essentials
- Java-certifiering
- Inudstry Master Class - Datateknik
1. Big Data för datateknik
I denna introduktionskurs från IBM får du lära dig de grundläggande begreppen och terminologierna för big data och dess tillämpningar inom olika branscher. Du kommer att få insikt i hur du förbättrar affärsproduktiviteten genom att bearbeta big data och utvinna värdefull information.
Viktiga inlärningsmål
Förstå vad big data är, källor till big data och exempel från verkligheten
Lär dig den viktigaste skillnaden mellan big data och datavetenskap
Behärska användningen av big data för operativ analys och bättre kundservice
Få kunskap om ekosystemet för big data och ramverket Hadoop
Kursplan
Lektion 1 - Vad är big data?
Lektion 2 - Big data: bortom hypen
Lektion 3 - Big data och datavetenskap
Lektion 4 - Användningsfall
Lektion 5 - Bearbetning av Big Data
2. Utvecklare av Big Data Hadoop och Spark
AVC:s utbildning i Big Data Hadoop hjälper dig att lära dig big data och Hadoop-ekosystemverktyg som HDFS, YARN, MapReduce, Hive, Impala, Pig, HBase, Spark, Flume, Sqoop och Hadoop Frameworks, inklusive ytterligare livscykelkoncept för big data-bearbetning. Under denna lärarledda onlinekurs i Hadoop kommer du att arbeta med realtidsprojekt inom detaljhandel, turism, finans och andra områden. Denna big data-kurs kommer också att förbereda dig för Clouderas CCA175 Big Data-certifiering.
Viktiga inlärningsmål
- Lär dig att navigera i Hadoops ekosystem och förstå hur du optimerar dess användning
- Inmatning av data med Sqoop, Flume och Kafka
- Implementera partitionering, bucketing och indexering i Hive
- Arbeta med RDD i Apache Spark
- Bearbeta strömmande data i realtid
- Utför DataFrame-operationer i Spark med SQL-frågor
- Implementera användardefinierade funktioner (UDF) och användardefinierade attributfunktioner (UDAF) i Spark
Kursplan
Lektion 1 - Introduktion till Bigdata och Hadoop
Lektion 2 - Hadoops arkitektur för distribuerad lagring (HDFS) och YARN
Lektion 3 - Datainmatning i Big Data-system och ETL.
Lektion 4 - Distribuerad bearbetning MapReduce-ramverk och Pig
Lektion 5 - Apache Hive
Lektion 6 - NoSQL-databaser HBase
Lektion 7 - Grunderna i funktionell programmering och Scala
Lektion 8 - Apache Spark nästa generations ramverk för stora datamängder
Lektion 9 - Spark Core bearbetning av RDD
Lektion 10 - Spark SQL-behandling av DataFramesspan
Lektion 11 - Spark MLLib Modellering av BigData med Spark
Lektion 12 - Ramverk för behandling av strömmar och Spark Streaming
Lektion 13 - Spark GraphX
3. PySpark-utbildning
Pyspark Training ger en djupgående översikt över Apache Spark, frågemotorn med öppen källkod för bearbetning av stora datamängder, och hur man integrerar den med Python med hjälp av PySpark-gränssnittet. Den här kursen visar hur man bygger och implementerar dataintensiva applikationer samtidigt som man fördjupar sig i högpresterande maskininlärning. Du får lära dig att använda Spark RDD, Spark SQL, Spark MLlib, Spark Streaming, HDFS, Sqoop, Flume, Spark GraphX och Kafka.
Viktiga inlärningsmål
- Förstå hur man använder Python-funktionalitet i Spark-ekosystemet.
- Behärska arkitekturen för Apache Spark och konfigurera en Python-miljö för Spark
- Lär dig om olika tekniker för datainsamling, förstå RDD:er och hur man jämför dem med DataFrames, hur man läser data från filer och HDFS och hur man arbetar med scheman
- Få omfattande kunskaper om olika verktyg som ingår i Spark-ekosystemet, t.ex. Spark SQL, Spark MlLib, Sqoop, Kafka, Flume och Spark Streaming.
- Skapa och utforska olika API:er för att arbeta med Spark DataFrames och lära dig att aggregera, transformera, filtrera och sortera data med DataFrames.
Kursplan
Lektion 01 - En kort introduktion till Pyspark
Lektion 02 - Robusta distribuerade datamängder
Lektion 03 - Resilienta distribuerade datamängder och åtgärder
Lektion 04 - DataFrames och transformationer
Lektion 05 - Databehandling med Spark DataFrames
4. Apache Kafka
I denna certifieringskurs för Apache Kafka lär du dig arkitekturen, installationen, konfigurationen och gränssnitten för Kafka open source messaging. Med denna Kafka-utbildning kommer du att lära dig grunderna i Apache ZooKeeper som en centraliserad tjänst och utveckla färdigheterna för att distribuera Kafka för realtidsmeddelanden. Kursen är en del av masterprogrammet Big Data Hadoop Architect och rekommenderas för utvecklare och analytiker som vill utöka sin expertis.
Viktiga inlärningsmål
- Beskriva vikten av big data
- Beskriva de grundläggande koncepten för Kafka
- Beskriva arkitekturen för Kafka
- Förklara hur man installerar och konfigurerar Kafka
- Förklara hur man använder Kafka för realtidsmeddelanden
Kursplan
Lektion 1 - Kom igång med Big Data och Apache Kafka
Lektion 2 - Kafka Producent
Lektion 3 - Kafka-konsument
Lektion 4 - Kafka-operationer och prestandajustering
Lektion 5 - Arkitektur för Kafka-kluster och hantering av Kafka
Lektion 6 - Övervakning av Kafka och schemaregister
Lektion 7 - Kafka-strömmar och Kafka-kontakter
Lektion 8 - Integrering av Kafka med Storm
Lektion 9 - Kafka-integrering med Spark och Flume
Lektion 10 - Adminklient och säkerhet för Kafka
5. MongoDB-utvecklare och administratör
Bli en expert MongoDB-utvecklare och administratör med djupgående kunskaper om NoSQL och behärska färdigheterna i datamodellering, ingestion, query, sharding och datareplikering. Kursen innehåller branschbaserade projekt inom elearning och telekom. Kursen passar bäst för databasadministratörer, mjukvaruutvecklare, systemadministratörer och analytiker.
Viktiga inlärningsmål
- Utveckla expertis i att skriva Java- och NodeJS-applikationer med MongoDB
Behärska replikering och sharding av data i MongoDB för att optimera läs/skriv-prestanda - Installera, konfigurera och underhålla MongoDB-miljön
- Få praktisk erfarenhet av att skapa och hantera olika typer av index i
- MongoDB för frågeexekvering
- Lagra ostrukturerade data i MongoDB på ett skickligt sätt
- Utveckla färdigheter för att bearbeta stora mängder data med MongoDB-verktyg
- Få färdigheter i MongoDB-konfiguration, säkerhetskopieringsmetoder och övervaknings- och driftsstrategier
- Fördjupa dig i hantering av DB Notes, Replica set och master-slave-koncept.
Kursplan
Lektion 1 - Introduktion till NoSQL-databaser
Lektion 2 - MongoDB: En databas för den moderna webben
Lektion 3 - CRUD-operationer i MongoDB
Lektion 4 - Indexering och aggregering
Lektion 5 - Replikering och sharding
Lektion 6 - Utveckling av Java- och Node JS-applikationer med MongoDB
Lektion 7 - Hantering av MongoDB-klusteroperationer
6. AWS tekniska grunder
I denna AWS Technical Essentials-kurs får du lära dig att navigera genom AWS hanteringskonsol, förstå AWS säkerhet, lagrings- och databasalternativ samt få expertis inom webbtjänster som RDS och EBS. Kursen är skapad i linje med den senaste AWS-syllabusen och hjälper dig att bli skicklig på att identifiera och effektivt använda AWS-tjänster.
Viktiga inlärningsmål
- Förstå de grundläggande begreppen för AWS-plattformen och cloud computing
- Identifiera AWS-koncept, terminologier, fördelar och driftsättningsalternativ för att uppfylla företagets krav
- Identifiera alternativ för driftsättning och nätverk i AWS
Kursplan
Lektion 01 - Introduktion till molntjänster
Lektion 02 - Introduktion till AWS
Lektion 03 - Lagring och leverans av innehåll
Lektion 04 - Beräkningstjänster och nätverk
Lektion 05 - AWS-hanterade tjänster och databaser
Lektion 06 - Driftsättning och hantering
7. Utbildning för certifiering av AWS Big Data
I denna AWS Big Data-certifieringskurs kommer du att bekanta dig med begrepp som cloud computing och dess distributionsmodeller; Amazon web services molnplattform; Kinesis Analytics; AWS big data lagring, bearbetning, analys, visualisering och säkerhetstjänster; EMR; AWS Lambda och Glue; maskininlärningsalgoritmer; och mycket mer.
Viktiga inlärningsmål
- Upptäck hur man använder Amazon EMR för att bearbeta data med hjälp av Hadoops ekosystemverktyg
- Förstå hur man använder Amazon Kinesis för bearbetning av big data i realtid
- Analysera och omvandla stora datamängder med Kinesis Streams
- Visualisera data och kör frågor med Amazon QuickSight
Kursplan
Lektion 01 - Introduktion till AWS i Big Data.
Lektion 02 - Insamling
Lektion 03 - Lagring
Lektion 04 - Bearbetning I
Lektion 05 - Bearbetning II
Lektion 06 - Analys I
Lektion 07 - Analys II
Lektion 08 - Visualisering
Lektion 09 - Säkerhet
8. Slutprojekt om stora data
Detta Big Data slutprojekt ger dig chansen att tillämpa de färdigheter du har lärt dig under detta program. Du får lära dig att lösa ett verkligt big data-problem genom särskilda mentorskapssessioner. Detta projekt är det sista steget i utbildningen och ger dig möjlighet att visa din expertis inom big data för framtida arbetsgivare.
9. Extra kurser:
AWS tekniska grundkunskaper
Denna AWS Technical Essentials-kurs lär dig att navigera genom AWS-hanteringskonsolen, förstå AWS-säkerhet, lagrings- och databasalternativ och få expertis inom webbtjänster som RDS och EBS. Kursen är skapad i linje med den senaste AWS-syllabusen och hjälper dig att bli skicklig på att identifiera och effektivt använda AWS-tjänster.
Certifieringsutbildning i Java
Denna avancerade certifieringsutbildning i Java är utformad för att ta dig igenom begreppen i Java, från inledande tekniker till avancerade programmeringskunskaper. Denna Java-kurs ger dig också kunskap om Core Java 8, operatorer, matriser, loopar, metoder och konstruktörer samtidigt som du får praktisk erfarenhet av JDBC och JUnit-ramverket.
Master Class för branschen - Datateknik
Delta i en interaktiv online Master Class och få inblick i världen av data engineering.
Kommande kursstarter
Intresseanmälan

Adding Value Consulting (AVC) är en ledande ATO (Accredited Training Organization). Vi har introducerat ett stort antal 'Best Practice'-metoder i Skandinavien. Vi är experter inom utbildning och certifiering. Under åren har AVC förvärvat omfattande kunskap om olika ledningsmetoder, relevant praxis...
Läs mer om Adding Value Consulting AB och visa alla utbildningar.