Concepteur développeur en intelligence artificielle et analyse big data
Le Wagon
Mon plusformation
90% de pratique en groupe sur des vrais sujets Tech Un suivi en temps réel pour ne pas rester bloqué Un accès à vie à la plateforme pédagogique du Wagon Orienté produit : apprenez en construisant votre app ! Une communauté tech unique
Descriptif de la formation
Concevoir un processus de collecte de données en évaluant et choisissant des outils adaptés pour faciliter l'accessibilité, la sécurité et l'intégrité des données centralisées dans le respect de la réglementation en vigueur (RGPD).
Créer un système automatisé de collecte de données en intégrant des solutions ETL (comme Fivetran ou Stitch) et/ou en développant des scripts informatiques en Python ou SQL pour une agrégation rapide et exacte des données correspondant aux besoins métier.
Développer des stratégies de nettoyage de données, en analysant le contexte spécifique des données pour assurer un traitement approprié et sécurisé des données qui réponde aux besoins métier de l’entreprise.
Extraire des données en développant des scripts personnalisés (par exemple en Python ou SQL) pour récupérer des informations précises et pertinentes depuis une ou plusieurs bases de données.
Mener des analyses exploratoires en calculant des techniques statistiques descriptives (comme la moyenne ou l’analyse des fréquences) pour comprendre la distribution des données et écarter les valeurs anormales.
Identifier et interpréter des tendances en utilisant des langages de programmation (par exemple Python) et/ou des outils métiers adaptés (par exemple un tableur) pour comprendre finement le contexte et la nature des données analysées.
Sélectionner l’algorithme d’apprentissage le plus adapté en comparant les performances et les caractéristiques des différentes familles d’algorithmes afin d'apporter une réponse pertinente à la problématique métier rencontrée.
Préparer et transformer des données en utilisant des techniques de prétraitement (preprocessing) pour les adapter aux spécificités du modèle d'apprentissage automatique choisi.
Entraîner un modèle d'apprentissage automatique en optimisant une loss function (fonction de coût) à partir des données d’entraînement afin de permettre à l’algorithme d’effectuer le moins d’erreurs possibles selon des indicateurs de succès clairement définis.
Identifier les évolutions clés en IA et Big Data en analysant des sources d'information spécialisées pour rester à la pointe des dernières innovations et alimenter les stratégies de projet.
Élaborer et évaluer la problématique métier en utilisant des approches analytiques, pour créer un cahier des charges qui reflète précisément les besoins et les objectifs du projet data.
Évaluer les risques inhérents au projet IA et Big Data concernant l’impact éthique, le respect du RGPD ou encore la conformité aux normes environnementales, en proposant des méthodes d’audit pour garantir une conformité globale du projet.
Planifier et coordonner les ressources humaines et matérielles de manière efficace, en structurant un calendrier des activités qui garantit le respect des délais et des budgets du projet data.
Piloter une équipe multidisciplinaire en mettant en place des mécanismes d'évaluation et de feedback continus, assurant ainsi une progression fluide et coordonnée du projet data.
Présenter les résultats de projets IA et Big Data en adaptant le contenu et la forme aux différentes parties prenantes, y compris les personnes en situation de handicap, en suivant les directives d'accessibilité du WCAG pour garantir une compréhension claire et inclusive.
Préparer des données non structurées en les convertissant en données numériques et sous forme tabulaires pour servir de données d'entraînement à un algorithme d’apprentissage profond.
Sélectionner l’algorithme d’apprentissage profond le plus adapté en comparant les performances et les caractéristiques des différentes familles d’algorithmes afin d'apporter une réponse pertinente adaptée à la problématique métier rencontrée.
Entraîner un modèle d'apprentissage profond en optimisant une loss function (fonction de coût) à partir des données d’entraînement afin de permettre à l’algorithme d’effectuer le moins d’erreurs possibles selon des indicateurs de succès clairement définis.
Déployer efficacement un modèle d'apprentissage profond en utilisant des outils et plateformes de production adaptés (MLOps), pour assurer une accessibilité et une performance optimale des prédictions de l'algorithme aux utilisateurs finaux.
Identifier les indicateurs clés à calculer en interrogeant les besoins métier afin de structurer les tableaux de bords nécessaires à des prises de décisions stratégiques.
Choisir des visualisations pertinentes en prenant en considération la nature massive des données et le profil des usagers y compris les personnes en situation de handicap, en suivant les directives d'accessibilité du WCAG afin de faciliter la compréhension des informations obtenues grâce à l’IA et au Big Data.
Créer des tableaux de bord en utilisant des outils de BI (comme PowerBI ou Looker Studio) afin de rendre accessibles et interactives les analyses prédictives aux autres membres de l'entreprise.
Cette formation modulaire permet d’acquérir et de valider les compétences des blocs suivants du titre professionnel RNCP 38616 – “Concepteur développeur en intelligence artificielle et analyse big data - option Data Science” : – Bloc 1 : Automatiser la collecte et le traitement des données (Data Engineering)
Les modalités d’évaluation sont conformes aux référentiels RNCP (cas pratique, livrables, mise en situation professionnelle, jury), et la validation donne lieu à l’attestation officielle de réussite des blocs.
Concepteur développeur en intelligence artificielle et analyse big data
Concevoir un processus de collecte de données en évaluant et choisissant des outils adaptés pour faciliter l'accessibilité, la sécurité et l'intégrité des données centralisées dans le respect de la réglementation en vigueur (RGPD).
Créer un système automatisé de collecte de données en intégrant des solutions ETL (comme Fivetran ou Stitch) et/ou en développant des scripts informatiques en Python ou SQL pour une agrégation rapide et exacte des données correspondant aux besoins métier.
Développer des stratégies de nettoyage de données, en analysant le contexte spécifique des données pour assurer un traitement approprié et sécurisé des données qui réponde aux besoins métier de l’entreprise.
Extraire des données en développant des scripts personnalisés (par exemple en Python ou SQL) pour récupérer des informations précises et pertinentes depuis une ou plusieurs bases de données.
Mener des analyses exploratoires en calculant des techniques statistiques descriptives (comme la moyenne ou l’analyse des fréquences) pour comprendre la distribution des données et écarter les valeurs anormales.
Identifier et interpréter des tendances en utilisant des langages de programmation (par exemple Python) et/ou des outils métiers adaptés (par exemple un tableur) pour comprendre finement le contexte et la nature des données analysées.
Sélectionner l’algorithme d’apprentissage le plus adapté en comparant les performances et les caractéristiques des différentes familles d’algorithmes afin d'apporter une réponse pertinente à la problématique métier rencontrée.
Préparer et transformer des données en utilisant des techniques de prétraitement (preprocessing) pour les adapter aux spécificités du modèle d'apprentissage automatique choisi.
Entraîner un modèle d'apprentissage automatique en optimisant une loss function (fonction de coût) à partir des données d’entraînement afin de permettre à l’algorithme d’effectuer le moins d’erreurs possibles selon des indicateurs de succès clairement définis.
Identifier les évolutions clés en IA et Big Data en analysant des sources d'information spécialisées pour rester à la pointe des dernières innovations et alimenter les stratégies de projet.
Élaborer et évaluer la problématique métier en utilisant des approches analytiques, pour créer un cahier des charges qui reflète précisément les besoins et les objectifs du projet data.
Évaluer les risques inhérents au projet IA et Big Data concernant l’impact éthique, le respect du RGPD ou encore la conformité aux normes environnementales, en proposant des méthodes d’audit pour garantir une conformité globale du projet.
Planifier et coordonner les ressources humaines et matérielles de manière efficace, en structurant un calendrier des activités qui garantit le respect des délais et des budgets du projet data.
Piloter une équipe multidisciplinaire en mettant en place des mécanismes d'évaluation et de feedback continus, assurant ainsi une progression fluide et coordonnée du projet data.
Présenter les résultats de projets IA et Big Data en adaptant le contenu et la forme aux différentes parties prenantes, y compris les personnes en situation de handicap, en suivant les directives d'accessibilité du WCAG pour garantir une compréhension claire et inclusive.
Préparer des données non structurées en les convertissant en données numériques et sous forme tabulaires pour servir de données d'entraînement à un algorithme d’apprentissage profond.
Sélectionner l’algorithme d’apprentissage profond le plus adapté en comparant les performances et les caractéristiques des différentes familles d’algorithmes afin d'apporter une réponse pertinente adaptée à la problématique métier rencontrée.
Entraîner un modèle d'apprentissage profond en optimisant une loss function (fonction de coût) à partir des données d’entraînement afin de permettre à l’algorithme d’effectuer le moins d’erreurs possibles selon des indicateurs de succès clairement définis.
Déployer efficacement un modèle d'apprentissage profond en utilisant des outils et plateformes de production adaptés (MLOps), pour assurer une accessibilité et une performance optimale des prédictions de l'algorithme aux utilisateurs finaux.
Identifier les indicateurs clés à calculer en interrogeant les besoins métier afin de structurer les tableaux de bords nécessaires à des prises de décisions stratégiques.
Choisir des visualisations pertinentes en prenant en considération la nature massive des données et le profil des usagers y compris les personnes en situation de handicap, en suivant les directives d'accessibilité du WCAG afin de faciliter la compréhension des informations obtenues grâce à l’IA et au Big Data.
Créer des tableaux de bord en utilisant des outils de BI (comme PowerBI ou Looker Studio) afin de rendre accessibles et interactives les analyses prédictives aux autres membres de l'entreprise.
Cette formation modulaire permet d’acquérir et de valider les compétences des blocs suivants du titre professionnel RNCP 38616 – “Concepteur développeur en intelligence artificielle et analyse big data - option Data Science” : – Bloc 1 : Automatiser la collecte et le traitement des données (Data Engineering)
Les modalités d’évaluation sont conformes aux référentiels RNCP (cas pratique, livrables, mise en situation professionnelle, jury), et la validation donne lieu à l’attestation officielle de réussite des blocs.
• Niveau 4 (Bac, Bac Pro, BP, Titres ou équivalents)
> Type de prérequis :
• Sans pré-requis spécifique
> Commentaire prérequis :
• Afin de suivre au mieux l’action de formation et d’obtenir la ou les qualifications auxquelles elle prépare, le Stagiaire est informé qu’il est nécessaire de posséder, avant l’entrée en formation, le niveau de connaissances suivant : Admission : L’admission est soumise à l’aval de la commission pédagogique, comprenant un entretien en visioconférence et un test d’entrée. Un bon niveau d’anglais est requis, les ressources pédagogiques étant majoritairement en anglais.
Matériel requis : Le candidat doit disposer d’un ordinateur portable récent et performant, les tablettes et Chromebooks étant inadéquats. Le candidat doit disposer d’un casque audio.
Prérequis de certification : Le candidat doit être au moins titulaire d’un diplôme de niveau 4 avec au moins une année d’expérience professionnelle ou être titulaire d’un diplôme de niveau 5 ou plus.
> Automatiser la collecte et le traitement des données (Data Engineering)
• Concevoir un processus de collecte de données en évaluant et choisissant des outils adaptés pour faciliter l'accessibilité, la sécurité et l'intégrité des données centralisées dans le respect de la réglementation en vigueur (RGPD). Créer un système automatisé de collecte de données en intégrant des solutions ETL (comme Fivetran ou Stitch) et/ou en développant des scripts informatiques en Python ou SQL pour une agrégation rapide et exacte des données correspondant aux besoins métier. Développer des stratégies de nettoyage de données, en analysant le contexte spécifique des données pour assurer un traitement approprié et sécurisé des données qui réponde aux besoins métier de l’entreprise.
• Un cas pratique d'étude d'un jeu de données concernant une problématique métier. Le candidat devra réaliser un traitement de cette donnée et son transfert automatique.
Concevoir un processus de collecte de données en évaluant et choisissant des outils adaptés pour faciliter l'accessibilité, la sécurité et l'intégrité des données centralisées dans le respect de la réglementation en vigueur (RGPD).
Créer un système automatisé de collecte de données en intégrant des solutions ETL (comme Fivetran ou Stitch) et/ou en développant des scripts informatiques en Python ou SQL pour une agrégation rapide et exacte des données correspondant aux besoins métier.
Développer des stratégies de nettoyage de données, en analysant le contexte spécifique des données pour assurer un traitement approprié et sécurisé des données qui réponde aux besoins métier de l’entreprise.
Extraire des données en développant des scripts personnalisés (par exemple en Python ou SQL) pour récupérer des informations précises et pertinentes depuis une ou plusieurs bases de données.
Mener des analyses exploratoires en calculant des techniques statistiques descriptives (comme la moyenne ou l’analyse des fréquences) pour comprendre la distribution des données et écarter les valeurs anormales.
Identifier et interpréter des tendances en utilisant des langages de programmation (par exemple Python) et/ou des outils métiers adaptés (par exemple un tableur) pour comprendre finement le contexte et la nature des données analysées.
Sélectionner l’algorithme d’apprentissage le plus adapté en comparant les performances et les caractéristiques des différentes familles d’algorithmes afin d'apporter une réponse pertinente à la problématique métier rencontrée.
Préparer et transformer des données en utilisant des techniques de prétraitement (preprocessing) pour les adapter aux spécificités du modèle d'apprentissage automatique choisi.
Entraîner un modèle d'apprentissage automatique en optimisant une loss function (fonction de coût) à partir des données d’entraînement afin de permettre à l’algorithme d’effectuer le moins d’erreurs possibles selon des indicateurs de succès clairement définis.
Identifier les évolutions clés en IA et Big Data en analysant des sources d'information spécialisées pour rester à la pointe des dernières innovations et alimenter les stratégies de projet.
Élaborer et évaluer la problématique métier en utilisant des approches analytiques, pour créer un cahier des charges qui reflète précisément les besoins et les objectifs du projet data.
Évaluer les risques inhérents au projet IA et Big Data concernant l’impact éthique, le respect du RGPD ou encore la conformité aux normes environnementales, en proposant des méthodes d’audit pour garantir une conformité globale du projet.
Planifier et coordonner les ressources humaines et matérielles de manière efficace, en structurant un calendrier des activités qui garantit le respect des délais et des budgets du projet data.
Piloter une équipe multidisciplinaire en mettant en place des mécanismes d'évaluation et de feedback continus, assurant ainsi une progression fluide et coordonnée du projet data.
Présenter les résultats de projets IA et Big Data en adaptant le contenu et la forme aux différentes parties prenantes, y compris les personnes en situation de handicap, en suivant les directives d'accessibilité du WCAG pour garantir une compréhension claire et inclusive.
Préparer des données non structurées en les convertissant en données numériques et sous forme tabulaires pour servir de données d'entraînement à un algorithme d’apprentissage profond.
Sélectionner l’algorithme d’apprentissage profond le plus adapté en comparant les performances et les caractéristiques des différentes familles d’algorithmes afin d'apporter une réponse pertinente adaptée à la problématique métier rencontrée.
Entraîner un modèle d'apprentissage profond en optimisant une loss function (fonction de coût) à partir des données d’entraînement afin de permettre à l’algorithme d’effectuer le moins d’erreurs possibles selon des indicateurs de succès clairement définis.
Déployer efficacement un modèle d'apprentissage profond en utilisant des outils et plateformes de production adaptés (MLOps), pour assurer une accessibilité et une performance optimale des prédictions de l'algorithme aux utilisateurs finaux.
Identifier les indicateurs clés à calculer en interrogeant les besoins métier afin de structurer les tableaux de bords nécessaires à des prises de décisions stratégiques.
Choisir des visualisations pertinentes en prenant en considération la nature massive des données et le profil des usagers y compris les personnes en situation de handicap, en suivant les directives d'accessibilité du WCAG afin de faciliter la compréhension des informations obtenues grâce à l’IA et au Big Data.
Créer des tableaux de bord en utilisant des outils de BI (comme PowerBI ou Looker Studio) afin de rendre accessibles et interactives les analyses prédictives aux autres membres de l'entreprise.
Précisions de l’organisme de formation :
Cette formation modulaire permet d’acquérir et de valider les compétences des blocs suivants du titre professionnel RNCP 38616 – “Concepteur développeur en intelligence artificielle et analyse big data - option Data Science” : – Bloc 1 : Automatiser la collecte et le traitement des données (Data Engineering)
Les modalités d’évaluation sont conformes aux référentiels RNCP (cas pratique, livrables, mise en situation professionnelle, jury), et la validation donne lieu à l’attestation officielle de réussite des blocs.
Démarrer en Data Science avec Python - BC01 : Automatiser la collecte et le traitement des données
Concepteur développeur en intelligence artificielle et analyse big data - RNCP38616BC01 À l’issue de cette formation, les stagiaires seront capables de configurer un environnement de travail professionnel, d’écrire des scripts simples en Python, et de mobiliser les outils fondamentaux de la data science (Jupyter, Pandas, SQL, APIs) pour collecter, analyser et manipuler des données, en s’appuyant sur les bases en statistiques et en raisonnement analytique.. Module 1 – Set up (8h) Objectifs : Installer et configurer ton environnement de travail (outils de développement, terminal, git, et plateforme Kitt) pour être prêt à coder efficacement pendant toute ta formation.
Module 2 – Python (8h) Objectif : À l’issue de cette unité, les stagiaires seront capables d’écrire des scripts simples en Python en mobilisant les structures de contrôle, les types de données fondamentaux et les concepts clés de la programmation, afin de préparer les bases nécessaires à l’analyse de données.
Module 3 – Data toolkit (24h) Objectifs : À l’issue de cette unité, les stagiaires seront capables d’explorer, décrire et visualiser des ensembles de données à l’aide de Python et de bibliothèques adaptées, afin d’identifier des tendances, des corrélations et des insights pertinents pour une analyse structurée.
Modalités d'évaluation Cas pratique et mise en situation Évaluations : Cas pratique, mise en situation professionnelle et livrables permettent d’évaluer les compétences des apprenants.
Session d'information Une session dédiée à la certification est organisée pendant la formation. Elle inclut : Le déroulement de l’examen Les dates et inscriptions Slides et replay sont partagés rapidement avec les apprenants.
Évaluations en ligne Les évaluations se font entièrement à distance. Dates et liens d’inscription communiqués durant la formation. Convocation officielle envoyée par mail après inscription.
Des liens avec les métiers accessibles avec cette formation
Source : Cariforef des Pays de la Loire - 278181 - Code établissement : 57586
La session est déclarée fermée.
N’hésitez pas, néanmoins, à prendre contact avec l’organisme de formation. Des places se sont peut-être libérées
ou de nouvelles sessions programmées prochainement.
Pour vous aider dans votre recherche, des chargé.e.s d'information sont à votre disposition.