Ferme la recherche

Data Scientist - les fondamentaux de la Data Science

Descriptif

Durée de la formation

Durée 21 heures
En centre 21 heures

Session

du 22 avril 2020 au 24 avril 2020  - Levallois Perret (92)
+ autres sessions
du 22 avril 2020 au 24 avril 2020  - Levallois Perret (92)
du 24 juin 2020 au 26 juin 2020  - Levallois Perret (92)
du 16 sept. 2020 au 18 sept. 2020  - Levallois Perret (92)
du 28 sept. 2020 au 30 sept. 2020  - Levallois Perret (92)
du 04 nov. 2020 au 06 nov. 2020  - Levallois Perret (92)
du 14 déc. 2020 au 16 déc. 2020  - Levallois Perret (92)

Objectif de la formation

Découvrir le métier de Data Scientist et les grandes familles de problèmes.
Savoir modéliser un problème de Data Science.
Créer vos premières variables.
Constituer votre boîte à outils de Data Scientist.
Participer à une première compétition.

Description de la formation

*** Jour 1.
* Introduction au Big Data.
Qu'est
- ce
- que le Big Data ?
L'écosystème technologique du Big Data.
* Introduction à la Data Science, le métier de Data Scientist.
Le vocabulaire d'un problème de Data Science.
De l'analyse statistique au machine learning.
Panorama des possibilités du machine learning.
* Modélisation d'un problème.
Input / ouput d'un problème de machine learning.
* Identifier les familles d'algorithmes de machine learning.
Analyse supervisée.
Analyse non supervisée.
Classification / régression.
* Régression linéaire.
Quelques rappels : fonction hypothèse, fonction convexe, optimisation.
La construction de la fonction de coût.
Méthode de minimisation : la descente de gradient.
* Régression logistique.
Frontière de décision.
La construction d'une fonction de coût convexe pour la classification.
* La boîte à outil du Data Scientist.
Introduction aux outils.
Introduction à Python, Pandas et Scikit
- learn.
*** Jour 2.
* Rappels et révisions du jour 1.
* Qu'est
- ce qu'un bon modèle ?
Cross
- validation.
Les métriques d'évaluation : precision, recall, ROC, MAPE, etc.
* Les pièges du machine learning.
Overfitting ou sur
- apprentissage.
Biais vs variance.
La régularisation : régression Ridge et Lasso.
* Data Cleaning.
Les types de données : catégorielles, continues, ordonnées, temporelles.
Détection des outliers statistiques, des valeurs aberrantes.
Stratégie pour les valeurs manquantes.
* Feature Engineering.
Stratégies pour les variables non continues.
Détecter et créer des variables discriminantes.
* Data visualisation.
La visualisation pour comprendre les données : histogramme, scatter plot, etc.
La visualisation pour comprendre les algorithmes : train / test loss, feature importance, etc.
* Introduction aux méthodes ensemblistes.
Le modèle de base : l'arbre de décision, ses avantages et ses limites.
Présentation des différentes stratégies ensemblistes : bagging, boosting, etc.
* Apprentissage semi
- supervisé.
Les grandes classes d'algorithmes non supervisées : clustering, PCA, etc.
*** Jour 3
* Rappels et révisions.
Synthèse des points abordés en journées 1 et 2.
Approfondissement des sujets sélectionnés avec l'intervenant.
* Mise en pratique.
Le dernier jour est entièrement consacré à des mises en pratique.
* Sélection et participation à une compétition.
Le formateur sélectionnera une compétition en cours sur Kaggle ou datascience.net qui sera démarrée en jour 3 par l'ensemble des participants.

Conditions d'accès

Connaissances de base en programmation ou scripting.
Quelques souvenirs de statistiques.
Analystes, Statisticiens, Architectes, Développeurs.

Validation

Attestation d'acquis ou de compétences;Attestation de suivi de présence

Donne accès au(x) métier(s) suivant(s)

Etudes et prospectives socio-economiques (voir la fiche métier)

Et après la formation ?

NON DÉTERMINÉ

Conseils
Les questions à poser avant de choisir un centre de formation
  • Quels sont les profils des anciens stagiaires (niveau de formation, expérience professionnelle) ?
  • Est-il possible de visiter le centre ?
  • Quel type de public accueillez-vous en formation (salariés, demandeurs d’emploi, particuliers) ?
  • Peut-on obtenir une liste de ces anciens stagiaires pour les interroger sur cette formation ?
  • Comment aidez-vous les stagiaires à trouver un emploi ?

PLB Consultant

Lieu de formation

PLB Consultant
3-5 Rue Maurice Ravel
Levallois Perret

Calculez votre itinéraire

Centre de formation

PLB Consultant
3-5 Rue Maurice Ravel
92300, Levallois-Perret

Toutes les formations et avis pour PLB Consultant