Nos domaines de formation :

Formation Big Data, méthodes et solutions pratiques pour l'analyse des données

4,1 / 5
Stage pratique
Best
Durée : 5 jours
Réf : BID
Prix  2018 : 3030 € H.T.
Pauses et déjeuners offerts
  • Programme
  • Cycles certifiants
  • Participants / Prérequis
  • Intra / sur-mesure
  • avis vérifiés
Programme

Ce stage vous permettra de comprendre les enjeux et les apports du Big Data ainsi que les technologies pour le mettre en œuvre. Vous apprendrez à intégrer des volumétries massives de données structurées et non structurées via un ETL, puis à les analyser grâce à des modèles statistiques et des dashboards dynamiques.

Objectifs pédagogiques

  • Comprendre les concepts et l'apport du Big Data par rapport aux enjeux métiers
  • Comprendre l'écosystème technologique nécessaire pour réaliser un projet Big Data
  • Acquérir les compétences techniques pour gérer des flux de données complexes, non structurés et massifs
  • Implémenter des modèles d'analyses statistiques pour répondre aux besoins métiers
  • Appréhender un outil de data visualisation pour restituer des analyses dynamiques

Exercice

Mettre en place une plateforme Hadoop et ses composants de base, utiliser un ETL pour gérer les données, créer des modèles d'analyse et dashboards.
PROGRAMME DE FORMATION

Comprendre les concepts et les enjeux du Big Data

  • Origines et définition du Big Data.
  • Les chiffres clés du marché dans le monde et en France.
  • Les enjeux du Big Data : ROI, organisation, confidentialité des données.
  • Un exemple d'architecture Big Data.

Les technologies du Big Data

  • Description de l'architecture et des composants de la plateforme Hadoop.
  • Les modes de stockage (NoSQL, HDFS).
  • Principes de fonctionnement de MapReduce, Spark, Storm...
  • Principales distributions du marché (Hortonworks, Cloudera, MapR, Elastic Map Reduce, Biginsights).
  • Installer une plateforme Hadoop.
  • Les technologies du datascientist.
  • Présentation des technologies spécifiques pour le Big Data (Tableau, Talend, Qlikview ...).

Exercice
Installation d'une plateforme Big Data Hadoop (via Cloudera QuickStart ou autre).

Gérer les données structurées et non structurées

  • Principes de fonctionnement de Hadoop Distributed File System (HDFS).
  • Importer des données externes vers HDFS.
  • Réaliser des requêtes SQL avec HIVE.
  • Utiliser PIG pour traiter la donnée.
  • Le principe des ETL (Talend...).
  • Gestion de streaming de données massive (NIFI, Kafka, Spark, Storm...)

Exercice
Implémentation de flux de données massives.

Technique et méthodes Big data analytics

  • Machine Learning, une composante de l'intelligence artificielle.
  • Découvrir les trois familles : Régression, Classification et Clustering.
  • La préparation des données (data preparation, feature engineering).
  • Générer des modèles en R ou Python.
  • Ensemble Learning.
  • Découvrir les outils du marché : Jupyter Notebook, Dataïku, Amazon Machine Learning...

Exercice
Mise en place d'analyses avec une des outils étudiés.

Data visualisation et cas d'usage concrets

  • Définir le besoin de la data visualisation.
  • Analyse et visualisation des données.
  • Peut concerner tous les types de données dans la DataViz ?
  • Les outils DataViz du marché.

Exercice
Installation et utilisation d'un outil de Data Visualisation pour constituer des analyses dynamiques.

Conclusion

  • Ce qu'il faut retenir.
  • Synthèse des bonnes pratiques.
  • Bibliographie.
Cycles certifiants
Participants / Prérequis

» Participants

Dataminers, chargés d'études statistiques, développeurs, chefs de projet, consultants en informatique décisionnelle.

» Prérequis

Connaissances de base des modèles relationnels, des statistiques et des langages de programmation. Connaissances de base des concepts de la Business Intelligence.
Intra / sur-mesure
Programme standard     Programme sur-mesure
Oui / Non

Vos coordonnées

Avis vérifiés
picto avis vérifiés
Sandrine M. 25/06/2018
5 / 5
très bon accueil, restauration correcte, locaux climatisé, tout est satisfaisant

Romuald P. 25/06/2018
5 / 5
Un environnement de démo un peu plus performant éliminerait quelques frustrations de certains collaborateurs ,-)

Laurent N. 25/06/2018
5 / 5
Machine plus puissante ?

Dimitri L. 25/06/2018
4 / 5
Le matériel informatique mis à dispo est très satisfaisant. Le formateur très avenant et à l'écoute. Locaux sombres. Salle de pause pas très conviviale

Emilie M. 18/06/2018
4 / 5
Postes de travail peu performants Machine à café HS

Pengfei L. 18/06/2018
4 / 5
Access internet est très long. Impossible pour télécharger les outils pour faire l'exos.

Thien T. 18/06/2018
5 / 5
Le poste de formation n'est pas dimensionné pour ce genre de sujet. Les machines virtuelles sont très lentes ! Tous les outils ou programmes en rapport avec le cours ne sont pas installés. De grosses lenteurs constatées au niveau du réseau informatique.

DU L. 11/06/2018
4 / 5
Très bien l'équipe et les services de sécurité m'ont prise en charge très efficacement (malaise pendant la formation)

Simon C. 11/06/2018
4 / 5
Siège sans accoudoirs

Thibaut R. 11/06/2018
5 / 5
petits soucis techniques... mais ça va. Au niveau du matériel, on a vraiment les yeux collés à l'écran... faudrait prévoir des bureaux un chouilla plus grand.

Sylvain B. 14/05/2018
4 / 5
Les distributeurs de café utilisent des gobelets recyclables : proposez donc leur collecte et leur recyclage !! Indiquez par ailleurs sur les machines qu'ils sont réutilisables sur les machines. Proposer également des fruits, pas que des viennoiseries ou confiseries chargées en sucre et graisses saturées

James K. 14/05/2018
5 / 5
tout était parfait

Céline C. 23/04/2018
4 / 5
Attention à la climatisation quelquefois défaillantes, surtout dans les salles avec pc pauses gourmandes appréciées

Harouna D. 23/04/2018
5 / 5
Trop chaud certains après-midi, ce qui diminue de fait la concentration.

Miriam B. 23/04/2018
5 / 5
Environnement très agréable et propice à la formation

Adrien V. 16/04/2018
4 / 5
Ok pour les postes à disposition , les intervenants devant mutualiser leurs infrastructures, il est difficile de mettre à disposition des plateformes pleinement opérationnelles , en résulte une perte de temps parfois importante sur des bugs ou des détails sans lien avec la formation. Exemple : postes Windows pas à l'heure et sur le mauvais fuseau, entraînant un non fonctionnement de certains outils. Nombreux travaux pendant la formation i

Fernando P. 16/04/2018
4 / 5
Performance réseau câble désastreux et WiFi très mauvais.

Brice C. 16/04/2018
5 / 5
Les travaux de l'autre côté de la passerelle = juste insupportable Sinon un bon accueil, des pauses agréables. Merci

Julien F. 16/04/2018
4 / 5
Un petit bloc de feuilles pour les notes aurait été utile.

Antoine B. 19/03/2018
4 / 5
Juste un bémol sur l'isolation phonique des salles de formation.

JEROME D. 05/03/2018
4 / 5
cf commentaire sur la documentation. Pour le suivi sur écran, l'idéal aurait été un 2nd écran pour ne pas à avoir switcher d'une fenêtre à l'autre.

Julien A. 05/03/2018
4 / 5
Il faudrait faire le téléchargement nécessaire à l'environnement technique (VM...) afin d'éviter une perte de temps. En effet, tout le monde télécharge en même temps avec un débit faible, ce qui fait perdre du temps sur des le contenus intéressant. Ce point est à améliorer.

Sylvain B. 05/03/2018
5 / 5
La formation a été ponctuée de quelques problèmes techniques (installations de certaines VM incomplètes)

Julien J. 05/03/2018
5 / 5
Un deuxième écran aurait été plus pratique pour switcher entre le support de cours informatique et l'application utilisée.

Abdelkader O. 26/02/2018
4 / 5
Bugs à répétition lors de l'exercice : Tweeter-NIFI

Charles S. 26/02/2018
4 / 5
Bon environnement

Adnane C. 26/02/2018
4 / 5
Il aurait été intéressant d'utiliser un cluster de machines afin de démontrer tout l'intérêt du BigData.

Paul L. 26/02/2018
5 / 5
Problème dans la configuration de mon PC, à part ça (après clonage de ma machine) pas de souci.

Gaetan D. 05/02/2018
4 / 5
Petit souci de connexion réseau rapidement résolu Bonnes conditions de formation Dommage que les sessions en région soient souvent annulées

Laurent S. 15/01/2018
4 / 5
PC très largement sous dimensionnés

Mohamed Z. 08/01/2018
4 / 5
Cadre et matériel convenable, pas de soucis particulier.

Paul T. 08/01/2018
4 / 5
TrÈs bien organisé. Bémol sur la convocation reçue tardivement / aprÈs relance.

Manothay T. 08/01/2018
5 / 5
La date de péremption des gâteaux de riz est dépassée

Elvis N. 18/12/2017
4 / 5
bonne organisation, cependant salle pas isolé, on a du bruit provenant des travaux extérieurs

Lise G. 18/12/2017
5 / 5
Machinerie très bruyante, ayant problème audition difficulté à entendre

Maxime H. 11/12/2017
4 / 5
Bruit ascenseur insupportable pour 1 semaine de formation !

Yaya B. 11/12/2017
4 / 5
l'infrastructure informatique et des VMs peut être amélioré pour éviter les pertes de temps lors des exos.

Michel A. 11/12/2017
4 / 5
L'animateur, Arnaud CANU, maîtrise clairement son sujet et c'est agréable ! Renouvellement de l'air de la salle clairement pas à la hauteur et trop chaud (mal au crâne en fin de journée) Plus de mise en relation avec des cas d'usage pour que l'on comprenne mieux de quoi se servir dans telle ou telle situations. BFM TV dans les salles de pause c'est stressant. Prévenir, avant le début de la formation, de la quantité de données à récupérer à la fin de la formation (ma clef USB était trop petit

Soufian H. 11/12/2017
5 / 5
Salle 34 bruyante.

Daniel G. 11/12/2017
5 / 5
Excellente formation/formateur les 4 premiers jours, le dernier jour est sans intérêt (j'ai failli retourner au boulot)... pourquoi ne pas approfondir les BDD NoSQL (Cassandra ou MongoDB ) et Elastic Search plutôt que cette journée "tableau" à l'intérêt très limité.

Jean D. 11/12/2017
5 / 5
Excellent intervenant, très pédagogue, exercices présentant peu d'intérêt

Arnaud C. 04/12/2017
5 / 5
Concernant le plan d'accès, l'aéroport SATOLAS n'existe plus il faut le remplacer par Saint Exupéry.

Anne J. 20/11/2017
4 / 5
Bon accueil, accès facile. La salle est un peu petite par rapport au nombre des participants.

Romain V. 20/11/2017
4 / 5
Nombreux problèmes logistique: vitesse du réseau, machines formateur différentes des machines des élèves. Cela a provoqué de nombreux contretemps. Ajouter des lignes/pages de notes dans le support papier si possible.

Gillian C. 20/11/2017
4 / 5
Rien à dire si ce n'est ... Vivement ...

ROUX L. 20/11/2017
5 / 5
Problème de content réseau Internet

Gaëlle O. 20/11/2017
5 / 5
Salle un peu petite. Problèmes de réseaux.

Myriam G. 13/11/2017
4 / 5
Peut mieux faire dans l'accueil du 1er jour (trop de badges qui ne fonctionnaient pas)

David L. 13/11/2017
5 / 5
Formation très enrichissante : Les animateurs sont de vrais experts, à l'écoute et partageant leurs retours d'expérience

Kader K. 13/11/2017
5 / 5
Il est dommage que nous ayons pas pu réaliser un vrai cluster hadoop avec les 12 pc de la salle pour se rendre compte de la puissance de distribution des calculs. La solution par VM local reste suffisante pour visualiser les composants à manipuler.

Ramia H. 13/11/2017
4 / 5
la chaise n'est pas du tout comfortable

Narjisse O. 13/11/2017
5 / 5
petit soucis de propreté du tableau, le formateur a eu beau effacer, les schémas étaient difficilement lisibles

Rémy S. 13/11/2017
5 / 5
Moins de croissants et de cochonneries à manger, Plus de fruits bio

Lionel D. 13/11/2017
5 / 5
Bonne organisation .

SHABA A. 09/10/2017
4 / 5
le professeur métrise bien son sujet, cette formation m'a permis de connaitre ce nouveau domaine de big data et de pratiquer un socle varié d'outils de la gestion de données

Myriam G. 09/10/2017
5 / 5
Possibilité que la salle soit plus insonorisée (on entend distinctement le cours d'à coté)

Paul B. 09/10/2017
5 / 5
Disposer d''un cluster hadoop performant (cluster sur AWS ou serveur central) pour pouvoir tester les outils connexes (etl, dataviz, etc) sur une infrastructure big data

Marjolaine C. 09/10/2017
5 / 5
Pas de salle de sieste Support écrit pas à jour mais très agréable de trouver tous les écrans déjà dedans : permet de se concentrer sur ce que dit le professeur.

SCHUYTENEER D. 09/10/2017
4 / 5
Les PC utilisés sont assez limités, même si on a pu les utiliser... C'est inconcevable qu'on ne puisse pas monter par les escaliers, à pied donc ! En matière de sécurité, je ne suis même pas sûr que ce soit bien réglementaire !

Vincent M. 09/10/2017
4 / 5
un écran plus grand (27 pouces au lieu de 19 par exemple) aurait permis d'utiliser les logiciels dans de bonnes conditions.

Eric S. 09/10/2017
4 / 5
Ecran beaucoup trop petits : 17 pouces ! Ma PC a planté (écran noir) au moins 4 fois pendant la durée de la formation...

Thomas T. 18/09/2017
4 / 5
Restaurant bof bof

Jerry D. 11/09/2017
4 / 5
Correct, propre bien organisé, température ambiante des salles à revoir.

Laurent B. 11/09/2017
4 / 5
Gros problèmes réseaux empêchant parfois de faire les exercices. poste de travail pas adapté (ressources).

Sylvain O. 11/09/2017
4 / 5
Bonne organisation avec respect des pauses et des horaires. L'environnement est agréable. Sauf la porte des WC qui claque à chaque fois ce qui dérange pendant la formation.

Denis M. 11/09/2017
4 / 5
Trop de problèmes rencontrés lors des TP

BELLO Y. 11/09/2017
4 / 5
Organisation et environnement ok

AMARA B. 11/09/2017
4 / 5
débit du réseau faible.. UN vrai problème

Thierry B. 11/09/2017
4 / 5
Des pb liés à la config des postes: la mise en place d'une vm dans le cloud simplifierai et permettrai d'avoir la puissance adéquate

Edouard H. 11/09/2017
5 / 5
Pas de cluster central, élément indispensable pour cette formation Réseau Internet peu réactif, voire trop aléatoire

Jean R. 17/07/2017
5 / 5
Salle de cours pas assez climatisée et trop chaude. Pour le reste, parfait. Merci pour votre accueil.

Jean D. 17/07/2017
5 / 5
Très bien sauf le support papier parfois illisible du fait de la petitesse des polices

Stéphane G. 17/07/2017
4 / 5
Manque Wifi dans les salles de cours

Julien B. 17/07/2017
4 / 5
Très bon organisme de formation

Jean P. 17/07/2017
5 / 5
Très bonne organisation
Avis client 4,1 / 5

Les avis client sont issus des feuilles d’évaluation de fin de formation. La note est calculée à partir de l’ensemble des avis datant de moins de 12 mois.

Dates de sessions

Pour vous inscrire, cliquez sur la session qui vous intéresse.