Ferme la recherche

Certification DiGiTT - Data - parcours Data Engineer - bootcamp

Descriptif

Durée de la formation

Durée 400 heures
En centre 400 heures

Session

entrées/sorties permanentes

du 01 avril 2021 au 31 déc. 2021  - Puteaux (92)
du 01 avril 2021 au 31 déc. 2021  - Puteaux (92)
Pour connaître les dates des prochaines sessions, veuillez contacter l'organisme de formation

Objectif de la formation

Comprendre les enjeux du Big Data
Découvrir les opportunités du Big Data
Acquérir les connaissances nécessaires permettant de mettre en oeuvre les technologies Big Data
Evaluer et sélectionner les outils appropriés dans le cadre d'un plan de mise en oeuvre du Big Data

Description de la formation

Module 1 : Les fondamentaux
-Kit de survie. Maitriser les outils indispensables : Github, Jupyter Notebook, PyCharm...
-Python pour la Data Science. Manipulation des librairies python : Pandas, Matplotlib, NumPy, SciPy
-Les fondamentaux mathématiques. Développer les acquis théoriques fondamentaux en algèbre linéaire, statistiques et probabilités

Module 2 : Data Analysis
-Data analysis et Data Cleaning. Apprendre à utiliser Github, lancer des requêtes SQL, utiliser une API
-Data Visualization. Apprendre à utiliser les principales librairies de data viz comme Bokeh, Seaborn ou encore Plotly
-Data Exploration. Explorer vos données en python afin d'en extraire les principaux insights

Module 3 : Data Engineering
-Manipulation d'API. Apprendre à développer et manipuler vos propres API.
-Mise en production d' un projet Data. Découvrir les notions de dockerisation, clusters kubernetes.
-Cloud. Maitriser les solutions cloud d'Amazon AWS et Google Cloud. Apprendre à monitorer l'activité de vos serveurs.

Module 4 : Machine Learning
-Apprentissage supervisé / Non Supervisé. Explorer ces différentes méthodes d'apprentissages grâce à la librairie Sickit
- Learn :
SVM, kNN, PCA, Random Forest.
-Généralisation des modèles. Apprendre à choisir les bonnes méthodes de régularisation.
-Natural Language Processing. Développer les acquis techniques en gestion de données textes : NLTK, SpaCy...

Module 5 : Big Data Engineering
-Ecosystème Hadoop. Pouvoir comprendre l'architecture des applicatifs Hadoop et savoir quels sont les apports et les cas d'usage
des solutions Hadoop.
-Bases de données SQL/NoSQL. Apprendre à manipuler les bases de données SQL et NoSQL : MongoDB, ElasticSearch, Neo4J
-Data Streaming. Apprendre à créer un Data Streaming Pipeline et à maitriser l'utilisation de Kafka

Conditions d'accès

Avoir une culture générale des systèmes d'informations
Chef de projets
Développeurs
Data Scientists
Architecte SI et toute personne intéressée par les enjeux du Big Data
DSI

Validation

Certification DiGiTT;Attestation d'acquis ou de compétences;Attestation de suivi de présence

Donne accès au(x) métier(s) suivant(s)

Formation professionnelle (voir la fiche métier)

Etudes et developpement informatique (voir la fiche métier)

Informations complémentaires

Parcours personnalisable : Pédagogique
2
FOAD : 400 h
274 jours
Et après la formation ?

Retour à l'emploi des anciens stagiaires

FAIBLE

Conseils
Les questions à se poser avant de choisir une formation à distance
  • Les modalités de formation proposées par cet organisme sont-elles adaptées à mes besoins et répondent-elles à mes attentes ?
  • Y-a-t'il un système de coaching, de contrôle de l’assiduité, de vérification régulière des connaissances acquises ?
  • Est-ce que je dispose du matériel adéquat et d'un lieu approprié pour suivre cette formation ? Bonne connexion, webcam, casque, bureau fermé ou accès un espace numérique public ou de co-working ?
  • Suis-je suffisamment motivé, auto-discipliné et organisé pour me connecter de façon assidue ?
  • Suis-je en capacité de travailler seul ? Si non, puis-je m’appuyer sur une communauté ?

Datarockstars