Aller au menu Aller au contenu Aller à la page d'accessibilité
masquer

CONTACTER
UN CONSEILLER

fleche

Je consulte ma fiche formation, en Pays de la Loire.

Ingénieur en science des données spécialisé en infrastructure data ou en apprentissage automatique Mastère Data Engineer

Nantes Ynov Campus

2 sessions
Périodes
Voies d'accès
Lieu
Validation
Session n° 1
28/09/2026 au 29/09/2028
Contrat d'apprentissage Formation adulte
Nantes
Totale

Bloc de compétences

  • Collecter, transformer et sécuriser des données
  • Analyser, organiser et valoriser des données
  • Elaborer et piloter un projet data
  • Spécialisation infrastructure data - Concevoir et opérer une infrastructure data
  • Spécialisation apprentissage automatique - Concevoir et déployer des modèles d'apprentissage automatique
Session n° 2
28/09/2026 au 29/09/2028
Contrat d'apprentissage Formation adulte
Nantes
Totale

Bloc de compétences

  • Collecter, transformer et sécuriser des données
  • Analyser, organiser et valoriser des données
  • Elaborer et piloter un projet data
  • Spécialisation infrastructure data - Concevoir et opérer une infrastructure data
  • Spécialisation apprentissage automatique - Concevoir et déployer des modèles d'apprentissage automatique
2 sessions
Session n° 1
28/09/2026 au 29/09/2028

Nantes
Contrat d'apprentissage Formation adulte
Totale

Bloc de compétences

  • Collecter, transformer et sécuriser des données
  • Analyser, organiser et valoriser des données
  • Elaborer et piloter un projet data
  • Spécialisation infrastructure data - Concevoir et opérer une infrastructure data
  • Spécialisation apprentissage automatique - Concevoir et déployer des modèles d'apprentissage automatique
2 sessions
Périodes
Voies d'accès
Lieu
Validation
Session n° 1
28/09/2026 au 29/09/2028
Contrat d'apprentissage
Formation adulte
Nantes
Totale

Bloc de compétences

  • Collecter, transformer et sécuriser des données
  • Analyser, organiser et valoriser des données
  • Elaborer et piloter un projet data
  • Spécialisation infrastructure data - Concevoir et opérer une infrastructure data
  • Spécialisation apprentissage automatique - Concevoir et déployer des modèles d'apprentissage automatique
Session n° 2
28/09/2026 au 29/09/2028
Contrat d'apprentissage
Formation adulte
Nantes
Totale

Bloc de compétences

  • Collecter, transformer et sécuriser des données
  • Analyser, organiser et valoriser des données
  • Elaborer et piloter un projet data
  • Spécialisation infrastructure data - Concevoir et opérer une infrastructure data
  • Spécialisation apprentissage automatique - Concevoir et déployer des modèles d'apprentissage automatique

2 sessions

Session n° 1

28/09/2026 au 29/09/2028
Contrat d'apprentissage
Formation adulte
Nantes
Totale

Bloc de compétences

  • Collecter, transformer et sécuriser des données
  • Analyser, organiser et valoriser des données
  • Elaborer et piloter un projet data
  • Spécialisation infrastructure data - Concevoir et opérer une infrastructure data
  • Spécialisation apprentissage automatique - Concevoir et déployer des modèles d'apprentissage automatique
Session n° 2

28/09/2026 au 29/09/2028
Contrat d'apprentissage
Formation adulte
Nantes
Totale

Bloc de compétences

  • Collecter, transformer et sécuriser des données
  • Analyser, organiser et valoriser des données
  • Elaborer et piloter un projet data
  • Spécialisation infrastructure data - Concevoir et opérer une infrastructure data
  • Spécialisation apprentissage automatique - Concevoir et déployer des modèles d'apprentissage automatique

Mon plus formation

Mon plus formation : vidéo

Descriptif de la formation

Collecter, transformer et sécuriser des données Analyser, organiser et valoriser des données Elaborer et piloter un projet dataSpécialisation infrastructure data - Concevoir et opérer une infrastructure data Spécialisation apprentissage automatique - Concevoir et déployer des modèles d'apprentissage automatique Collecter, transformer et sécuriser des données Analyser, organiser et valoriser les données Elaborer et piloter un projet data Spécialisation infrastructure et data – Concevoir et opérer une infrastructure data Spécialisation apprentissage automatique - Concevoir et déployer des modèles d'apprentissage automatique

Ingénieur en science des données spécialisé en infrastructure data ou en apprentissage automatique Mastère Data Engineer

Collecter, transformer et sécuriser des données Analyser, organiser et valoriser des données Elaborer et piloter un projet dataSpécialisation infrastructure data - Concevoir et opérer une infrastructure data Spécialisation apprentissage automatique - Concevoir et déployer des modèles d'apprentissage automatique Collecter, transformer et sécuriser des données Analyser, organiser et valoriser les données Elaborer et piloter un projet data Spécialisation infrastructure et data – Concevoir et opérer une infrastructure data Spécialisation apprentissage automatique - Concevoir et déployer des modèles d'apprentissage automatique

Nantes Ynov Campus

20 Boulevard du Général de Gaulle CS 46339
44200 Nantes

02-28-44-04-40

Du 28/09/2026 au 29/09/2028

  • en centre : 952 heures
  • en entreprise : 2723 heures
  • Temps plein
  • Cours de jour

  • Contrat d'apprentissage

Lieu de la formation

Nantes Ynov Campus
20 Boulevard du Général de Gaulle CS 46339 44200 Nantes
02-28-44-04-40
contact-nantes@ynov.com


  • Pré-requis

    > Niveau d’entrée :
    • Niveau 6 (Licence, Licence pro, BUT, Titres ou équivalents)
    > Type de prérequis :
    • Sans pré-requis spécifique
    > Commentaire prérequis :
    • Être titulaire d'un titre ou diplôme de niveau 6 validé dans le domaine de l’informatique OU avoir validé les 3 premières années d'une formation qui vise un titre ou diplôme de niveau 7 dans le domaine de l'informatique.
  • Objectif général : Certification

  • Blocs de compétences
    > Collecter, transformer et sécuriser des données
    • Élaborer une stratégie de collecte de données en définissant les données utiles et nécessaires pour répondre à une problématique, et en identifiant les sources des données afin de cadrer le travail à réaliser pour collecter les données ciblées. Mettre en œuvre des techniques de collecte de données en exploitant les API externes et les bases de données disponibles, des techniques de web crawling et de web scraping afin de recueillir les données ciblées. Automatiser la collecte de données en mettant en place des tâches planifiées et/ou des flux temps réel, en utilisant des logiciels d’automatisation afin de garantir l’actualisation des données. Élaborer la stratégie de stockage des données avec un modèle de données adéquat en intégrant les différents types de données, l’utilisation envisagée (analyse, stockage, disponibilité, accessibilité) et le volume à stocker afin d’organiser le stockage des données. Construire une base de données en sélectionnant la technologie (SQL, NoSQL), un système de gestion de base de données (SGBD) et/ou une solution de stockage BIG DATA, en assurant le paramétrage et l’implémentation afin de mettre en œuvre le modèle de données qui garantit la disponibilité et l’intégrité des données. Sélectionner les technologies et les outils de traitement de données en identifiant les solutions existantes et en comparant leurs avantages et leurs inconvénients afin de traiter efficacement les données collectées. Transformer les données à l’aide de langage de programmation ou en utilisant des outils dédiés (Talend, Spark…) afin d’obtenir des données nettoyées exploitables. Développer un processus ETL en identifiant les bénéfices des technologies ETL (ex : facilité de développement), en exploitant la technologie ETL préalablement sélectionnée afin d’automatiser l’extraction, la transformation et le chargement de données. Définir la politique de sécurisation des données en évaluant les risques, en qualifiant leur niveau de sensibilité, en identifiant les droits d’accès selon les rôles des différentes parties prenantes et en respectant les exigences légales (ex : RGPD) afin de garantir la bonne utilisation et l’intégrité des données. Concevoir une architecture sécurisée et robuste, en intégrant des mesures de sécurité multicouches et des contrôles d'accès stricts, en mettant en place des solutions de protection des données (ex : chiffrement) pour sécuriser les données en transit et au repos, en veillant à l’anonymisation des données personnelles afin de répondre aux normes de protection de la vie privée et de sécurité des données.
    • Mise en situation professionnelle réelle ou fictive. : À partir de l’analyse d’une organisation réelle ou fictive de son choix, le candidat propose une stratégie de collecte et de transformation des données. Il remet au jury un dossier écrit comprenant : Une stratégie de collecte de données - Un exemple de collecte de données - Une méthode d’automatisation de collecte - Une stratégie de stockage des données - Un modèle de données - Une base de données - Une solution de stockage Big Data - Une présentation des outils et des technologies de traitement des données - Une présentation des données transformées, des méthodes et outils utilisés - Un processus ETL - Les solutions utilisés pour l’automatisation et l’orchestration du traitement des données - Une politique de sécurité des données - Un schéma d’architecture de sécurité
    > Analyser, organiser et valoriser des données
    • Analyser les besoins métier et les enjeux exprimés par un commanditaire en réalisant des entretiens exploratoires et en récupérant les informations stratégiques nécessaires afin de cadrer le travail d’analyse des données à produire. Définir les axes d’analyse et les métriques en identifiant les données à exploiter, celles disponibles et pertinentes pour traduire la problématique d’entreprise énoncée en problème numérique. Réaliser des requêtes et des calculs en utilisant des outils de dashboarding, des tableurs, des requêtes SQL ou scripts Python afin de produire une analyse des données préalablement collectées. Élaborer des modèles statistiques et des tests d’hypothèses en modélisant des relations entre les variables, en évaluant la pertinence des résultats des simulations afin de valider ou réfuter des hypothèses. Représenter les données en choisissant les modèles de représentation les plus adaptés (ex : histogramme, Heat map, nuage de points) et en utilisant des outils de représentation adaptés (ex : Office, power BI) afin de permettre la compréhension et l’exploitation des données par le public visé. Présenter des recommandations, en préparant son discours et des arguments, en structurant son analyse sur les données représentées afin d’aider les décideurs à établir leurs stratégies. Former les utilisateurs à l’utilisation des données et des outils de visualisation en analysant le besoin de montée en compétences et en élaborant des supports de formation et de sensibilisation adaptés afin de permettre aux utilisateur de maitriser l’exploitation des données. Rédiger la documentation technique d'utilisation du système d’analyse de données en identifiant le public concerné, en détaillant le fonctionnement du système d’analyse de données afin d'assurer la traçabilité et la transmission aux utilisateurs.
    • Mise en situation professionnelle réelle ou fictive. À partir de l’analyse d’une organisation réelle ou fictive de son choix, le candidat propose une stratégie d’analyse, de mise en forme et de valorisation des données. Il remet au jury un dossier écrit comprenant : Une analyse du besoin - Une présentation d’un plan d’analyse - Une présentation des requêtes et des résultats - Une méthodologie de tests statistiques - La visualisation des résultats de l’analyse - Une présentation de recommandations - Un support de formation - Une documentation technique
    > Elaborer et piloter un projet data
    • Définir les objectifs à atteindre et le périmètre du projet, en analysant les contraintes techniques et réglementaires, en étudiant le contexte et les enjeux afin de dimensionner le projet en termes de délai et budget. Dimensionner le projet en évaluant la charge de travail et les ressources nécessaires (humaines, matérielles) au regard des exigences attendues et des contraintes préalablement définies afin d’estimer le temps et le budget nécessaires à la faisabilité du projet. Rédiger la documentation projet, en identifiant les parties prenantes concernées, en prenant en compte l’ensemble des caractéristiques du projet, afin de clarifier et formaliser les attendus. Planifier l’exécution du projet en organisant la répartition et l'ordonnancement des activités, le planning prévisionnel de réalisation et les ressources nécessaires à son exécution, en prenant en considération les personnes en situation de handicap afin de suivre les différentes phases du projet. Suivre l’avancement du projet en mettant en place un outil de suivi (logiciel de suivi, tableau de bord), en définissant les indicateurs (qualitatifs et/ou quantitatifs) pour chaque jalon défini dans le planning, en réalisant des reportings et des comptes rendus de réunion afin d’anticiper les aléas éventuels. Évaluer les besoins en compétences de l’équipe projet, en collaborant avec le service Ressources Humaines, en établissant un plan de développement des compétences et en orientant les membres de l’équipe vers des formations adaptées, afin de renforcer l’équipe responsable de mener à bien le projet DATA. Piloter l’équipe projet en affectant les missions à réaliser, en prenant en compte les spécificités des membres de l’équipe, en intégrant les spécificités d’un contexte multiculturel, international, en utilisant les différentes techniques de communication et d’animation managériale pour favoriser le bon fonctionnement de l'équipe. Procéder aux arbitrages et aux réajustements nécessaires à partir de l’analyse des écarts entre le prévisionnel et l’état du projet à date, en utilisant des outils d’aide à la décision (ex : logigramme) afin de garantir la performance du projet dans le respect des objectifs de qualité, coûts et délai. Mettre en place un système de veille technologique et réglementaire en matière de science des données et d’Intelligence Artificielle à l’aide de recherches documentaires, de plateformes de partage, de webinars afin d’être alerté des évolutions qui impacteraient les pratiques métier. Intégrer dans ses pratiques métier les enjeux en termes de données responsables, de responsabilité sociétale et environnementale (RSE), de sécurité, d’éthique et de confidentialité des données en se tenant informé des évolutions du cadre juridique, à travers une recherche documentaire ou en étant accompagné par des juristes afin d’agir dans le respect de la législation.
    • Mise en situation professionnelle réelle ou fictive. À partir de l’analyse d’une organisation réelle ou fictive de son choix, le candidat propose la gestion d’un projet Data. Il remet au jury un dossier écrit comprenant : Le cadrage du projet - Le dimensionnement du projet - La documentation projet - Le planning projet - Un outil de suivi de projet - Un tableau de bord - Un plan de développement des compétences - Les outils de communication et managériaux utilisés - La présentation d’un cas d’arbitrage rencontré au cours du projet - Une méthodologie de veille - Un plan d’actions relatif aux enjeux RSE, de sécurité, d’éthique et de confidentialité
    > Spécialisation infrastructure data - Concevoir et opérer une infrastructure data
    • Analyser l’environnement du projet en recueillant les besoins métiers, les volumes de données à traiter, en réalisant un état des lieux des composants existants afin d’orienter le choix de conception de l’architecture DATA à mettre en œuvre. Sélectionner l’ensemble des composants et technologies de l’infrastructure en étudiant les solutions existantes, en vérifiant leur compatibilité et les normes en vigueur afin de concevoir une architecture DATA correctement dimensionnée pour le projet. Concevoir une architecture d’entrepôt de données en s’appuyant sur le cahier des charges, en sélectionnant les composants appropriés afin d’optimiser le stockage des données en termes de rapidité, de sécurité et d’accessibilité. Mettre en place des pipelines DATA temps réel ou asynchrones à l’aide d’outils BIG DATA (ex : DATA brick, plateforme DBT Snowflake), Cloud et/ou On premise afin d’automatiser la transformation et la transmission les données. Automatiser l’intégration et le déploiement des composants en utilisant des outils d’intégration et de développement continu, afin d’industrialiser la mise en production de l’architecture DATA. Mettre en place un système de supervision et d’alertes en déployant des outils de supervision, et en déterminant les indicateurs de suivi pertinents afin de s’assurer du bon fonctionnement des composants de l’architecture DATA. Exploiter les systèmes et les équipements de l’infrastructure DATA en respectant les procédures d’administration et de maintien en condition opérationnelle afin de garantir l’intégrité et la disponibilité des données de l’organisation. Rédiger la documentation fonctionnelle et technique en identifiant le public concerné et les objectifs attendus, en prenant en compte l’ensemble des caractéristiques de l’infrastructure DATA afin de transférer les procédures et les modalités de fonctionnement aux différents utilisateurs. Élaborer le cahier de recette en rédigeant les scénarios de tests et les résultats attendus afin de détecter les anomalies de fonctionnement et les régressions éventuelles. Résoudre un incident technique en investiguant la source du problème et en déployant une méthode de résolution afin de rétablir la disponibilité du service.
    • Mise en situation professionnelle réelle ou fictive. À partir de l’analyse d’un projet réel ou fictif, le candidat présente la stratégie de conception et de maintien d’une architecture DATA. À l’aide d’un support de présentation de son choix, il présente lors d’une soutenance orale : Un rapport d’analyse - Une présentation des composants de l’architecture DATA - Un schéma de données - Des pipelines de traitement de la donnée - Un pipeline CI/CD - Une présentation d’un système de supervision - Une feuille de route d’exploitation - Une documentation technique - Un cahier de recettes et de tests - Une méthodologie d’investigation et de traitement d’un incident.
    > Spécialisation apprentissage automatique - Concevoir et déployer des modèles d'apprentissage automatique
    • Analyser la problématique et le contexte d’un commanditaire en réalisant des entretiens exploratoires, des questionnaires et une analyse de l’existant afin de lui apporter une réponse appropriée. Cadrer la stratégie de résolution du problème, en utilisant des algorithmes, en traduisant le problème en un problème d’optimisation afin de le résoudre avec les outils des modèles d’apprentissage automatique. Sélectionner les technologies, les outils et les algorithmes en identifiant les différentes solutions disponibles et en comparant leurs avantages et leurs inconvénients afin de répondre à la problématique du commanditaire au regard des contraintes du projet. Construire des variables en utilisant des langages de programmation (ex : Python, Scala, R, Julia…) en exploitant des bibliothèques d’analyse de données afin de fournir les meilleures variables au modèle d’apprentissage automatique. Sélectionner les variables en identifiant les différentes méthodes de sélection de variables possibles, en utilisant des méthodologies d’apprentissage automatique afin d’optimiser la performance du modèle. Entrainer un modèle d’apprentissage automatique à l’aide de librairies (ex : Scikit-learn XGBoost, TensorFlow, PyTorch) afin d’obtenir des modèles capables de prédictions sur de nouvelles données inconnues. Optimiser la performance des modèles d’apprentissage automatique en modifiant les hyperparamètres et en analysant les prédictions afin de répondre au mieux à la problématique du commanditaire. Sauvegarder le modèle d’apprentissage automatique entrainé à l’aide d’outils de sérialisation, virtualisation, containerisation, versioning afin de pouvoir le déployer dans des environnements de production. Déployer des modèles d’apprentissage automatique en utilisant des API et des outils CI/CD afin de le mettre en production. Superviser le système Machine Learning en sélectionnant des outils de monitoring et en les exploitant afin de détecter les dérives et les bugs du modèle d’apprentissage automatique. Automatiser les tâches inhérentes au cycle de vie d’un système d’apprentissage automatique à l’aide de pipelines et des outils adaptés afin de maintenir la performance du modèle d’apprentissage automatique.
    • Mise en situation professionnelle réelle ou fictive. À partir de l’analyse d’un projet réel ou fictif, le candidat présente la stratégie de conception et de déploiement de modèles de Machine Learning. À l’aide d’un support de présentation de son choix, il présente lors d’une soutenance orale : Une analyse du besoin - Une présentation de la stratégie de résolution du problème - Une présentation des technologies et des outils sélectionnés - Un jeu de données exploitables pour le Machine Learning - Des méthodes de sélection de variables - Un entrainement d’un modèle d’apprentissage automatique - Une méthode d’optimisation des modèles d’apprentissage automatique - Une méthode de sauvegarde - Un processus CI/CD - Un système de monitoring de la performance - Un système de collecte de données
  • Objectifs et Programme

    Collecter, transformer et sécuriser des données Analyser, organiser et valoriser des données Elaborer et piloter un projet dataSpécialisation infrastructure data - Concevoir et opérer une infrastructure data Spécialisation apprentissage automatique - Concevoir et déployer des modèles d'apprentissage automatique

    Précisions de l’organisme de formation :

    Collecter, transformer et sécuriser des données Analyser, organiser et valoriser les données Elaborer et piloter un projet data Spécialisation infrastructure et data – Concevoir et opérer une infrastructure data Spécialisation apprentissage automatique - Concevoir et déployer des modèles d'apprentissage automatique 1ère année 3 majeures obligatoires (Algorithmie et développement dans l'ingénierie des données, Concepts, fonctionnements et technologies de l'IA, Architecture et administration des bases de données) 3 mineures obligatoires (Gestion de projet IT, Pilotage de la stratégie SI, Outils ETL) Projets et apprentissage par la pratique (Ydays – Pédagogie par la pratique – IA – Anglais – Hackathons et challenges)   2ème année 3 majeures obligatoires (Industrialisation de l'IA dans le cloud, Infrastructure et orchestration de flux de données, Stockage et traitement avancé des données distribuées) 2 mineures obligatoires (Data visualisation avancée, MLops) Projets et apprentissage par la pratique (Ydays – Pédagogie par la pratique – IA – Anglais – Hackathons et challenges) 1 élective au choix parmi : - Traitement en temps réel et systèmes distribués - Souveraineté et sécurité de la donnée - Culture et marché de l'IA - Green IT - Prise de parole en public Perfectionnement - IT for english - Ethique IA - Blockchain Projets et apprentissage par la pratique (Ydays – Pédagogie par la pratique – IA – Anglais – Hackathons et challenges)

  • Résultats attendus

    Certification

  • Organisation pédagogique

    > Modalité d'enseignement :
    • Formation hybride
  • En savoir plus

  • Des liens avec les métiers accessibles avec cette formation

    Administration de systèmes d'information

    Expertise et support en systèmes d'information

    Études et développement informatique

    Conseil et maîtrise d'ouvrage en systèmes d'information

Source : Cariforef des Pays de la Loire - 258033 - Code établissement : 51594

La session est déclarée fermée.

N’hésitez pas, néanmoins, à prendre contact avec l’organisme de formation. Des places se sont peut-être libérées ou de nouvelles sessions programmées prochainement.

"Pour vous aider dans votre recherche, des chargé(e)s d'information sont à votre disposition."

• Métiers • Formations • Aides et financements • Lieux et outils d'information
Pour vous aider dans votre recherche, des chargé.e.s d'information sont à votre disposition.
appeler
• Métiers
• aides et financements
• Formations
• Lieux et outils d'information
Contactez-nous par mail, nous répondons à vos questions sur :
• les métiers • les aides et les financements • les formations • les lieux et les outils d'information
" Pour vous aider dans votre recherche, des chargé.e.s d'information sont à votre disposition "
* Champ obligatoire
RAPPEL GRATUIT
du lundi au jeudi de 9h à 12h30 / 13h30 à 17h et le vendredi de 9h à 12h30

Nos chargé.e.s d'information répondent à toutes vos questions.
Nous vous rappelons au moment qui vous arrange.

"Quand souhaitez-vous être rappelé ?"
Nos chargé.e.s d'information répondent à vos questions.