Fiche formation : Concepteur développeur en intelligence artificielle et analyse big data

Mon plus formation

90% de pratique en groupe sur des vrais sujets Tech
Un suivi en temps réel pour ne pas rester bloqué
Un accès à vie à la plateforme pédagogique du Wagon
Orienté produit : apprenez en construisant votre app !
Une communauté tech unique

Descriptif de la formation

Concevoir un processus de collecte de données en évaluant et choisissant des outils adaptés pour faciliter l'accessibilité, la sécurité et l'intégrité des données centralisées dans le respect de la réglementation en vigueur (RGPD).
Créer un système automatisé de collecte de données en intégrant des solutions ETL (comme Fivetran ou Stitch) et/ou en développant des scripts informatiques en Python ou SQL pour une agrégation rapide et exacte des données correspondant aux besoins métier.
Développer des stratégies de nettoyage de données, en analysant le contexte spécifique des données pour assurer un traitement approprié et sécurisé des données qui réponde aux besoins métier de l’entreprise.
Extraire des données en développant des scripts personnalisés (par exemple en Python ou SQL) pour récupérer des informations précises et pertinentes depuis une ou plusieurs bases de données.
Mener des analyses exploratoires en calculant des techniques statistiques descriptives (comme la moyenne ou l’analyse des fréquences) pour comprendre la distribution des données et écarter les valeurs anormales.
Identifier et interpréter des tendances en utilisant des langages de programmation (par exemple Python) et/ou des outils métiers adaptés (par exemple un tableur) pour comprendre finement le contexte et la nature des données analysées.
Sélectionner l’algorithme d’apprentissage le plus adapté en comparant les performances et les caractéristiques des différentes familles d’algorithmes afin d'apporter une réponse pertinente à la problématique métier rencontrée.
Préparer et transformer des données en utilisant des techniques de prétraitement (preprocessing) pour les adapter aux spécificités du modèle d'apprentissage automatique choisi.
Entraîner un modèle d'apprentissage automatique en optimisant une loss function (fonction de coût) à partir des données d’entraînement afin de permettre à l’algorithme d’effectuer le moins d’erreurs possibles selon des indicateurs de succès clairement définis.
Identifier les évolutions clés en IA et Big Data en analysant des sources d'information spécialisées pour rester à la pointe des dernières innovations et alimenter les stratégies de projet.
Élaborer et évaluer la problématique métier en utilisant des approches analytiques, pour créer un cahier des charges qui reflète précisément les besoins et les objectifs du projet data.
Évaluer les risques inhérents au projet IA et Big Data concernant l’impact éthique, le respect du RGPD ou encore la conformité aux normes environnementales, en proposant des méthodes d’audit pour garantir une conformité globale du projet.
Planifier et coordonner les ressources humaines et matérielles de manière efficace, en structurant un calendrier des activités qui garantit le respect des délais et des budgets du projet data.
Piloter une équipe multidisciplinaire en mettant en place des mécanismes d'évaluation et de feedback continus, assurant ainsi une progression fluide et coordonnée du projet data.
Présenter les résultats de projets IA et Big Data en adaptant le contenu et la forme aux différentes parties prenantes, y compris les personnes en situation de handicap, en suivant les directives d'accessibilité du WCAG pour garantir une compréhension claire et inclusive.
Préparer des données non structurées en les convertissant en données numériques et sous forme tabulaires pour servir de données d'entraînement à un algorithme d’apprentissage profond.
Sélectionner l’algorithme d’apprentissage profond le plus adapté en comparant les performances et les caractéristiques des différentes familles d’algorithmes afin d'apporter une réponse pertinente adaptée à la problématique métier rencontrée.
Entraîner un modèle d'apprentissage profond en optimisant une loss function (fonction de coût) à partir des données d’entraînement afin de permettre à l’algorithme d’effectuer le moins d’erreurs possibles selon des indicateurs de succès clairement définis.
Déployer efficacement un modèle d'apprentissage profond en utilisant des outils et plateformes de production adaptés (MLOps), pour assurer une accessibilité et une performance optimale des prédictions de l'algorithme aux utilisateurs finaux.
Identifier les indicateurs clés à calculer en interrogeant les besoins métier afin de structurer les tableaux de bords nécessaires à des prises de décisions stratégiques.
Choisir des visualisations pertinentes en prenant en considération la nature massive des données et le profil des usagers y compris les personnes en situation de handicap, en suivant les directives d'accessibilité du WCAG afin de faciliter la compréhension des informations obtenues grâce à l’IA et au Big Data.
Créer des tableaux de bord en utilisant des outils de BI (comme PowerBI ou Looker Studio) afin de rendre accessibles et interactives les analyses prédictives aux autres membres de l'entreprise.

Cette formation modulaire permet d’acquérir et de valider les compétences des blocs suivants du titre professionnel RNCP 38616 – “Concepteur développeur en intelligence artificielle et analyse big data - option Data Science” :
– Bloc 1  : Automatiser la collecte et le traitement des données (Data Engineering)

Les modalités d’évaluation sont conformes aux référentiels RNCP (cas pratique, livrables, mise en situation professionnelle, jury), et la validation donne lieu à l’attestation officielle de réussite des blocs.

Concepteur développeur en intelligence artificielle et analyse big data

Concevoir un processus de collecte de données en évaluant et choisissant des outils adaptés pour faciliter l'accessibilité, la sécurité et l'intégrité des données centralisées dans le respect de la réglementation en vigueur (RGPD).
Créer un système automatisé de collecte de données en intégrant des solutions ETL (comme Fivetran ou Stitch) et/ou en développant des scripts informatiques en Python ou SQL pour une agrégation rapide et exacte des données correspondant aux besoins métier.
Développer des stratégies de nettoyage de données, en analysant le contexte spécifique des données pour assurer un traitement approprié et sécurisé des données qui réponde aux besoins métier de l’entreprise.
Extraire des données en développant des scripts personnalisés (par exemple en Python ou SQL) pour récupérer des informations précises et pertinentes depuis une ou plusieurs bases de données.
Mener des analyses exploratoires en calculant des techniques statistiques descriptives (comme la moyenne ou l’analyse des fréquences) pour comprendre la distribution des données et écarter les valeurs anormales.
Identifier et interpréter des tendances en utilisant des langages de programmation (par exemple Python) et/ou des outils métiers adaptés (par exemple un tableur) pour comprendre finement le contexte et la nature des données analysées.
Sélectionner l’algorithme d’apprentissage le plus adapté en comparant les performances et les caractéristiques des différentes familles d’algorithmes afin d'apporter une réponse pertinente à la problématique métier rencontrée.
Préparer et transformer des données en utilisant des techniques de prétraitement (preprocessing) pour les adapter aux spécificités du modèle d'apprentissage automatique choisi.
Entraîner un modèle d'apprentissage automatique en optimisant une loss function (fonction de coût) à partir des données d’entraînement afin de permettre à l’algorithme d’effectuer le moins d’erreurs possibles selon des indicateurs de succès clairement définis.
Identifier les évolutions clés en IA et Big Data en analysant des sources d'information spécialisées pour rester à la pointe des dernières innovations et alimenter les stratégies de projet.
Élaborer et évaluer la problématique métier en utilisant des approches analytiques, pour créer un cahier des charges qui reflète précisément les besoins et les objectifs du projet data.
Évaluer les risques inhérents au projet IA et Big Data concernant l’impact éthique, le respect du RGPD ou encore la conformité aux normes environnementales, en proposant des méthodes d’audit pour garantir une conformité globale du projet.
Planifier et coordonner les ressources humaines et matérielles de manière efficace, en structurant un calendrier des activités qui garantit le respect des délais et des budgets du projet data.
Piloter une équipe multidisciplinaire en mettant en place des mécanismes d'évaluation et de feedback continus, assurant ainsi une progression fluide et coordonnée du projet data.
Présenter les résultats de projets IA et Big Data en adaptant le contenu et la forme aux différentes parties prenantes, y compris les personnes en situation de handicap, en suivant les directives d'accessibilité du WCAG pour garantir une compréhension claire et inclusive.
Préparer des données non structurées en les convertissant en données numériques et sous forme tabulaires pour servir de données d'entraînement à un algorithme d’apprentissage profond.
Sélectionner l’algorithme d’apprentissage profond le plus adapté en comparant les performances et les caractéristiques des différentes familles d’algorithmes afin d'apporter une réponse pertinente adaptée à la problématique métier rencontrée.
Entraîner un modèle d'apprentissage profond en optimisant une loss function (fonction de coût) à partir des données d’entraînement afin de permettre à l’algorithme d’effectuer le moins d’erreurs possibles selon des indicateurs de succès clairement définis.
Déployer efficacement un modèle d'apprentissage profond en utilisant des outils et plateformes de production adaptés (MLOps), pour assurer une accessibilité et une performance optimale des prédictions de l'algorithme aux utilisateurs finaux.
Identifier les indicateurs clés à calculer en interrogeant les besoins métier afin de structurer les tableaux de bords nécessaires à des prises de décisions stratégiques.
Choisir des visualisations pertinentes en prenant en considération la nature massive des données et le profil des usagers y compris les personnes en situation de handicap, en suivant les directives d'accessibilité du WCAG afin de faciliter la compréhension des informations obtenues grâce à l’IA et au Big Data.
Créer des tableaux de bord en utilisant des outils de BI (comme PowerBI ou Looker Studio) afin de rendre accessibles et interactives les analyses prédictives aux autres membres de l'entreprise.

Le Wagon

10 Passage de la Poule Noire
44000 Nantes

07-56-79-80-80

france-fundings@lewagon.org

Site web

Toutes les formations de cet organisme

Du 06/07/2026 au 10/07/2026

en centre : 40 heures
La formation se déroule au rythme de 40h par semaine. Les horaires sont de 9h à 12h et de 13h à 18h
Temps plein
Cours de jour

Formation adulte

La session sur le site de l'organisme

Lieu de la formation

Le Wagon
10 Passage de la Poule Noire 44000 Nantes
07-56-79-80-80
france-fundings@lewagon.org

Itinéraire

Financements possibles

Rémunération de fin de formation Pays de la Loire (R2F)
Compte personnel de formation (CPF) - session potentiellement éligible
Formation avec autres financements (entreprise, individuel)
PROGRAMME REGION - Abondement CPF demandeurs d'emploi - Formations sup

Pré-requis

> Niveau d’entrée :
• Niveau 4 (Bac, Bac Pro, BP, Titres ou équivalents)

> Type de prérequis :

• Sans pré-requis spécifique

> Commentaire prérequis :

• Afin de suivre au mieux l’action de formation et d’obtenir la ou les qualifications auxquelles elle prépare, le Stagiaire est informé qu’il est nécessaire de posséder, avant l’entrée en formation, le niveau de connaissances suivant :
Admission : L’admission est soumise à l’aval de la commission pédagogique, comprenant un entretien en visioconférence et un test d’entrée. Un bon niveau d’anglais est requis, les
ressources pédagogiques étant majoritairement en anglais.
Matériel requis : Le candidat doit disposer d’un ordinateur portable récent et performant, les tablettes et Chromebooks étant inadéquats. Le candidat doit disposer d’un casque audio.
Prérequis de certification : Le candidat doit être au moins titulaire d’un diplôme de niveau 4 avec au moins une année d’expérience professionnelle ou être titulaire d’un diplôme de niveau 5 ou plus.
Objectif général : Certification
Blocs de compétences

> Automatiser la collecte et le traitement des données (Data Engineering)

• Concevoir un processus de collecte de données en évaluant et choisissant des outils adaptés pour faciliter l'accessibilité, la sécurité et l'intégrité des données centralisées dans le respect de la réglementation en vigueur (RGPD). Créer un système automatisé de collecte de données en intégrant des solutions ETL (comme Fivetran ou Stitch) et/ou en développant des scripts informatiques en Python ou SQL pour une agrégation rapide et exacte des données correspondant aux besoins métier. Développer des stratégies de nettoyage de données, en analysant le contexte spécifique des données pour assurer un traitement approprié et sécurisé des données qui réponde aux besoins métier de l’entreprise.

• Un cas pratique d'étude d'un jeu de données concernant une problématique métier. Le candidat devra réaliser un traitement de cette donnée et son transfert automatique.
Objectifs et Programme
- Concevoir un processus de collecte de données en évaluant et choisissant des outils adaptés pour faciliter l'accessibilité, la sécurité et l'intégrité des données centralisées dans le respect de la réglementation en vigueur (RGPD).
- Créer un système automatisé de collecte de données en intégrant des solutions ETL (comme Fivetran ou Stitch) et/ou en développant des scripts informatiques en Python ou SQL pour une agrégation rapide et exacte des données correspondant aux besoins métier.
- Développer des stratégies de nettoyage de données, en analysant le contexte spécifique des données pour assurer un traitement approprié et sécurisé des données qui réponde aux besoins métier de l’entreprise.
- Extraire des données en développant des scripts personnalisés (par exemple en Python ou SQL) pour récupérer des informations précises et pertinentes depuis une ou plusieurs bases de données.
- Mener des analyses exploratoires en calculant des techniques statistiques descriptives (comme la moyenne ou l’analyse des fréquences) pour comprendre la distribution des données et écarter les valeurs anormales.
- Identifier et interpréter des tendances en utilisant des langages de programmation (par exemple Python) et/ou des outils métiers adaptés (par exemple un tableur) pour comprendre finement le contexte et la nature des données analysées.
- Sélectionner l’algorithme d’apprentissage le plus adapté en comparant les performances et les caractéristiques des différentes familles d’algorithmes afin d'apporter une réponse pertinente à la problématique métier rencontrée.
- Préparer et transformer des données en utilisant des techniques de prétraitement (preprocessing) pour les adapter aux spécificités du modèle d'apprentissage automatique choisi.
- Entraîner un modèle d'apprentissage automatique en optimisant une loss function (fonction de coût) à partir des données d’entraînement afin de permettre à l’algorithme d’effectuer le moins d’erreurs possibles selon des indicateurs de succès clairement définis.
- Identifier les évolutions clés en IA et Big Data en analysant des sources d'information spécialisées pour rester à la pointe des dernières innovations et alimenter les stratégies de projet.
- Élaborer et évaluer la problématique métier en utilisant des approches analytiques, pour créer un cahier des charges qui reflète précisément les besoins et les objectifs du projet data.
- Évaluer les risques inhérents au projet IA et Big Data concernant l’impact éthique, le respect du RGPD ou encore la conformité aux normes environnementales, en proposant des méthodes d’audit pour garantir une conformité globale du projet.
- Planifier et coordonner les ressources humaines et matérielles de manière efficace, en structurant un calendrier des activités qui garantit le respect des délais et des budgets du projet data.
- Piloter une équipe multidisciplinaire en mettant en place des mécanismes d'évaluation et de feedback continus, assurant ainsi une progression fluide et coordonnée du projet data.
- Présenter les résultats de projets IA et Big Data en adaptant le contenu et la forme aux différentes parties prenantes, y compris les personnes en situation de handicap, en suivant les directives d'accessibilité du WCAG pour garantir une compréhension claire et inclusive.
- Préparer des données non structurées en les convertissant en données numériques et sous forme tabulaires pour servir de données d'entraînement à un algorithme d’apprentissage profond.
- Sélectionner l’algorithme d’apprentissage profond le plus adapté en comparant les performances et les caractéristiques des différentes familles d’algorithmes afin d'apporter une réponse pertinente adaptée à la problématique métier rencontrée.
- Entraîner un modèle d'apprentissage profond en optimisant une loss function (fonction de coût) à partir des données d’entraînement afin de permettre à l’algorithme d’effectuer le moins d’erreurs possibles selon des indicateurs de succès clairement définis.
- Déployer efficacement un modèle d'apprentissage profond en utilisant des outils et plateformes de production adaptés (MLOps), pour assurer une accessibilité et une performance optimale des prédictions de l'algorithme aux utilisateurs finaux.
- Identifier les indicateurs clés à calculer en interrogeant les besoins métier afin de structurer les tableaux de bords nécessaires à des prises de décisions stratégiques.
- Choisir des visualisations pertinentes en prenant en considération la nature massive des données et le profil des usagers y compris les personnes en situation de handicap, en suivant les directives d'accessibilité du WCAG afin de faciliter la compréhension des informations obtenues grâce à l’IA et au Big Data.
- Créer des tableaux de bord en utilisant des outils de BI (comme PowerBI ou Looker Studio) afin de rendre accessibles et interactives les analyses prédictives aux autres membres de l'entreprise.
Précisions de l’organisme de formation :

Cette formation modulaire permet d’acquérir et de valider les compétences des blocs suivants du titre professionnel RNCP 38616 – “Concepteur développeur en intelligence artificielle et analyse big data - option Data Science” :
– Bloc 1  : Automatiser la collecte et le traitement des données (Data Engineering)

Les modalités d’évaluation sont conformes aux référentiels RNCP (cas pratique, livrables, mise en situation professionnelle, jury), et la validation donne lieu à l’attestation officielle de réussite des blocs.

Démarrer en Data Science avec Python - BC01 : Automatiser la collecte et le traitement des données

Concepteur développeur en intelligence artificielle et analyse big data - RNCP38616BC01
À l’issue de cette formation, les stagiaires seront capables de configurer un environnement de travail professionnel, d’écrire des scripts simples en Python, et de mobiliser les outils fondamentaux de la data science (Jupyter, Pandas, SQL, APIs) pour collecter, analyser et manipuler des données, en s’appuyant sur les bases en statistiques et en raisonnement analytique..
Module 1 – Set up (8h)
Objectifs : Installer et configurer ton environnement de travail (outils de développement, terminal, git, et plateforme Kitt) pour être prêt à coder efficacement pendant toute ta formation.

Module 2 – Python (8h)
Objectif : À l’issue de cette unité, les stagiaires seront capables d’écrire des scripts simples en Python en mobilisant les structures de contrôle, les types de données fondamentaux et les concepts clés de la programmation, afin de préparer les bases nécessaires à l’analyse de données.

Module 3 – Data toolkit (24h)
Objectifs : À l’issue de cette unité, les stagiaires seront capables d’explorer, décrire et visualiser des ensembles de données à l’aide de Python et de bibliothèques adaptées, afin d’identifier des tendances, des corrélations et des insights pertinents pour une analyse structurée.
Résultats attendus

Modalités d'évaluation
Cas pratique et mise en situation
Évaluations : Cas pratique, mise en situation professionnelle et livrables permettent d’évaluer les compétences des apprenants.

Session d'information
Une session dédiée à la certification est organisée pendant la formation. Elle inclut :
Le déroulement de l’examen
Les dates et inscriptions
Slides et replay sont partagés rapidement avec les apprenants.

Évaluations en ligne
Les évaluations se font entièrement à distance.
Dates et liens d’inscription communiqués durant la formation.
Convocation officielle envoyée par mail après inscription.
Organisation pédagogique

> Modalité d'enseignement :
• Formation entièrement présentielle
En savoir plus
Des liens avec les métiers accessibles avec cette formation

Source : Cariforef des Pays de la Loire - 278181 - Code établissement : 57586

La session est déclarée fermée.

N’hésitez pas, néanmoins, à prendre contact avec l’organisme de formation. Des places se sont peut-être libérées ou de nouvelles sessions programmées prochainement.

	UN CONSEILLER À VOTRE ÉCOUTE
	Appeler Être rappelé Envoyer un mail
PRÈS DE CHEZ VOUS
TÉLÉCHARGER LE PDF

Je consulte ma fiche formation en Pays de la Loire.

Concepteur développeur en intelligence artificielle et analyse big data

Mon plus formation

Descriptif de la formation

Concepteur développeur en intelligence artificielle et analyse big data

Le Wagon

Lieu de la formation

Financements possibles

Pré-requis

Objectif général : Certification

Précisions de l’organisme de formation :

Organisation pédagogique

En savoir plus

La session est déclarée fermée.