Ferme la recherche

Data science - niveau avancé

Descriptif

Durée de la formation

Durée 21 heures
En centre 21 heures

Session

du 04 déc. 2019 au 06 déc. 2019  - Paris - 2ème (75)
+ autres sessions
du 04 déc. 2019 au 06 déc. 2019  - Paris - 2ème (75)
du 04 déc. 2019 au 06 déc. 2019  - Paris - 2ème (75)
du 27 janv. 2020 au 29 janv. 2020  - Paris - 2ème (75)
du 27 janv. 2020 au 29 janv. 2020  - Paris - 2ème (75)
du 18 mars 2020 au 20 mars 2020  - Paris - 2ème (75)
du 18 mars 2020 au 20 mars 2020  - Paris - 2ème (75)
du 25 mai 2020 au 27 mai 2020  - Paris - 2ème (75)
du 25 mai 2020 au 27 mai 2020  - Paris - 2ème (75)
du 28 sept. 2020 au 30 sept. 2020  - Paris - 2ème (75)
du 28 sept. 2020 au 30 sept. 2020  - Paris - 2ème (75)
du 25 nov. 2020 au 27 nov. 2020  - Paris - 2ème (75)
du 25 nov. 2020 au 27 nov. 2020  - Paris - 2ème (75)

Objectif de la formation

Découvrir et utiliser la puissance prédictive des modèles ensemblistes
Savoir effectuer un "feature engineering" performant
Appréhender les techniques de text
- mining et de deep
- learning à travers des exemples concrets
Enrichir sa boite à outils de data scientist

Description de la formation

Jour 1
Rappel des fondamentaux
Eco
- système Big Data et Data Science
Comment modéliser un problème de data science ?
Les différentes familles d'algorithmes (supervisé : classification/régression, non supervisé)
Les algorithmes classiques
Comment évaluer la performance ?
Sur apprentissage et compromis biais/variance
Modèles ensemblistes
Rappels
Pourquoi ça fonctionne ? Raisons théoriques
Introduction au stacking
Architecture et promesses du stacking
Feature weighted stacking
Mise en application
Introduction au text mining
Un modèle de représentation : le bag of words
Normalisations usuelles
Stemming, lemmatization
Distances (Levenshtein, Hamming, Jaro
- Winkler)
Word2Vec
Jour 2
Feature en gineering avancé
Normalisation
Qu'est ce que la normalisation ?
Quand l'utiliser ?
Réduction de dimension (ACP, TSNE, LSA, etc.)
Transformation et interactions entre variables
Traitement des variables catégorielles à haute dimensionnalité
Création de variables extraites d'arbres (Facebook Trick)
Réseaux de neurones et deep learning
L'origine : le perceptron
Les réseaux de neurones
Deep learning
Objectif : s'affranchir du feature engineering manuel
Convolution
Réseaux récurrents
Cas concret : reconnaissance de chiffres
Apprentissage semi
- supervisé
Jour 3
Rappels et révisions
Synthèse des points abordés en journées 1 et 2
Approfondissement des sujets sélectionnés avec l'intervenant
Mise en pratique
Le dernier jour est entièrement consacré à des mises en pratique
Sélection et participation à une compétition
Le formateur sélectionnera une compétition en cours sur Kaggle qui sera démarrée en jour 3 par l'ensemble des participants

Conditions d'accès

Connaissances de base en programmation ou en scripting.
Avoir suivi la formation "Fondamentaux de la Data Science" (DSDFX) serait en plus.
Analyste
Statisticien
Architecte
Développeur
Data scientist

Validation

Attestation d'acquis ou de compétences;Attestation de suivi de présence

Donne accès au(x) métier(s) suivant(s)

Direction des systemes d'information (voir la fiche métier)

Etudes et developpement informatique (voir la fiche métier)

Et après la formation ?

Retour à l'emploi des anciens stagiaires

EXCELLENT

Conseils
Les questions à poser avant de choisir un centre de formation
  • Quels sont les profils des anciens stagiaires (niveau de formation, expérience professionnelle) ?
  • Est-il possible de visiter le centre ?
  • Quel type de public accueillez-vous en formation (salariés, demandeurs d’emploi, particuliers) ?
  • Peut-on obtenir une liste de ces anciens stagiaires pour les interroger sur cette formation ?
  • Comment aidez-vous les stagiaires à trouver un emploi ?

Octo Academy

Lieu de formation

OCTO Technology
34 Avenue de l'Opéra
Paris - 2ème

Calculez votre itinéraire

Centre de formation

OCTO Technology
34 Avenue de l'Opéra
75002, Paris 2e

Toutes les formations et avis pour Octo Academy