> Formations > Technologies numériques > Intelligence Artificielle, Big Data > IA, Machine Learning, analyse de données > Formation Data analyst, Bootcamp (10 semaines) > Formations > Technologies numériques > Formation Data analyst, Bootcamp (10 semaines)

Data analyst, Bootcamp (10 semaines)

by DataScientest

Data analyst, Bootcamp (10 semaines)

by DataScientest



ORSYS et DataScientest proposent un parcours de formation complet pour le métier de data analyst. Le data analyst ou business analyst traite et analyse les données dans une optique de prise de décision business, organisationnelle ou projet. Ce parcours vous apprend les fondamentaux du langage Python et ses bibliothèques principales pour la data science. Vous apprenez également toutes les technologies autour de l’analyse des données comme la data visualisation, le machine learning, l’extraction et la gestion de données texte, le big data ainsi que la business intelligence (BI).


Catalogue
Sur mesure

Formation en ligne

Réf. 4ID
  294h00
Prix : 5990 € H.T.
Langue : FR




ORSYS et DataScientest proposent un parcours de formation complet pour le métier de data analyst. Le data analyst ou business analyst traite et analyse les données dans une optique de prise de décision business, organisationnelle ou projet. Ce parcours vous apprend les fondamentaux du langage Python et ses bibliothèques principales pour la data science. Vous apprenez également toutes les technologies autour de l’analyse des données comme la data visualisation, le machine learning, l’extraction et la gestion de données texte, le big data ainsi que la business intelligence (BI).


Objectifs pédagogiques
À l’issue de la formation, le participant sera en mesure de :
Connaître les fondamentaux de Python
Maîtriser les bibliothèques Python dédiées à la data science
Effectuer de la data visualisation
Utiliser les technologies autour de l’analyse données : machine Learning, big data, Business Intelligence (BI)…
Comprendre l’extraction et la gestion de données texte

Public concerné
Personnes ayant une appétence pour la programmation et la manipulation des données.

Prérequis
Avoir un niveau bac+2 à composante business ou sciences est souhaité. Des notions de marketing et de statistiques sont nécessaires.

Méthodes et moyens pédagogiques
Activités digitales
Test de positionnement sous forme de QCM d'une heure, séance d’introduction à la plateforme à distance, classes collectives, classe de soutien sur mesure, simulation et codage en direct, exercices, fiches de synthèse, projet fil rouge dédié, social learning, échanges avec data scientists.
Tutorat
Un data scientist expert accompagne par e-mail l’apprenant dès son entrée en formation. Il échange avec lui et l'aide à assimiler les compétences théoriques et pratiques nécessaires à la réussite de sa formation. Lui ou un second data scientist expert anime des classes à distance collectives durant 15 % du temps ainsi que des ateliers collectifs de soutien. L'apprenant dispose également d'un mentor dédié au suivi de son projet fil rouge avec qui il fait des points réguliers. Les partages entre apprenants sur le forum de discussion et pendant les moments en groupe sont aussi très riches. 
Pédagogie et pratique
Formation digitale basée sur une pédagogie active et conçue avec des experts en data science. Une combinaison de théorie, de démonstrations, de mises en pratique, de partages d’expériences et de bonnes pratiques. Un test de positionnement, un accompagnement sur mesure dès le début du parcours, un projet fil rouge et des séquences pédagogiques de courte durée permettent de renforcer l’apprentissage et d’évaluer l’apprenant tout au long de sa formation. En cas de besoin technique, une cellule support est disponible en ligne 5 jours sur 7 de 9 h à 18 h 30. À l’issue de son parcours en ligne, l’apprenant reçoit un certificat délivré par Mines ParisTech | PSL Executive Education, ce qui lui permet de bénéficier de la reconnaissance d’un acteur de référence dans le domaine.

Programme de la formation

Fondamentaux de Python

  • Découverte des différentes variables, listes et tuples.
  • Présentation des divers opérateurs et structures de contrôle.
  • Initiation au concept de boucle et ses différents types.
  • Introduction aux fonctions et à leur documentation.
  • Instanciation de classes et utilisation de modules.

NumPy et Pandas

  • Création et manipulation d’un tableau NumPy array.
  • Présentation des opérations matricielles.
  • Création d’un indicateur statistique et application.
  • Chargement et première exploration d’un jeu de données.
  • Introduction au data cleaning.
  • Introduction au data processing.

Data quality (optionnel)

  • Présentation des principes essentiels à la data quality.
  • Traitement des variables numériques et textuelles.
  • Introduction au nettoyage de données.
  • Initiation à la gestion des valeurs manquantes.

Matplotlib

  • Présentation de différents types de graphes.
  • Introduction à la personnalisation de graphique.
  • En option : présentation de graphiques avancés avec Matplotlib et création de figures avec classes et objets.

Seaborn

  • Initiation à l'analyse de distribution.
  • Découverte de l'analyse statistique.
  • Initiation à l'analyse multivariée.
  • En option : Bokeh.
  • Utiliser des graphiques interactifs et intégrables sur une page web.

Algorithme et méthodologie de classification avec Scikit-learn

  • Présentation des algorithmes de classification (régression logistique, KNN, arbre de décision, forêt aléatoire, SVM…).
  • Initiation aux algorithmes de boosting et de bagging.
  • Découverte des différents modèles et sélections.
  • Classification des données déséquilibrées.

Méthode de réduction de dimension

  • Découverte du clustering avec l'algorithme des k-means.
  • Introduction à l'analyse en composantes principales.
  • Présentation de l'algorithme T-SNE.
  • Introduction à l'analyse discriminante linéaire.

Méthode de régression et text mining

  • Introduction à la régression linéaire simple.
  • Introduction aux expressions régulières.
  • Mise au point à la gestion de données textuelles.
  • Création de nuages de mots.
  • Présentation de l'analyse de sentiments.

Web scraping et introduction aux data engineering et big data

  • Introduction au langage web (HTML, CSS).
  • Extraction de contenu web avec Beautiful Soup.
  • Application du scraping sur Google.
  • Introduction aux 3V du big data (volume, variété, vélocité).
  • Présentation des bases de données et architectures.
  • Mise en production de données.

Data processing et machine learning sur de grandes bases de données

  • Introduction à PySpark.
  • Découverte de fonctions PySpark (Data processing, data frames, régression avec PySpark, ML pipelines, model turning…).
Solutions de financement
Plusieurs solutions existent pour financer votre formation et dépendent de votre situation professionnelle.
Découvrez-les sur notre page Comment financer sa formation ou contactez votre conseiller formation.