FORMATION : Initiation au Machine learning
Pour connaitre les prochaines sessions de formation sur l’Intelligence Artificielle, cliquez ici
Le monde de l’Internet des Objets est confronté aux traitements des données mesurées. L’objectif de cette formation sera de se familiariser et de maîtriser les règles de base du Machine Learning, de connaître les familles d’algorithmes et de développer quelques algorithmes pour appréhender le travail sur les variables et l’optimisation des erreurs de modélisation. Cela s’adresse à un auditoire familier des manipulations de données et de calcul sur ces données, ayant besoin de mieux comprendre ce que représente le Machine Learning en terme de possibilité et de savoir-faire.
Objectif : Comprendre l’articulation des domaines d’activité autour de la donnée afin de discerner les besoins de son entreprise, là où elle peut faire monter en compétence ces propres équipes et là où il sera plus efficace de faire appel à de l’expertise externe. - Qu’est ce la data science, le Machine Learning, le Deep Learning, le big data et l’intelligence artificielle ? - Qui sont les acteurs majeurs et locaux dans ces domaines ?
La structuration particulière de la formation (4 demi-journées réparties sur 4 jours) permettra au stagiaire de poser des questions au formateur pour la séance suivante.
PROGRAMME
1. Les grands principes du Machine Learning
1.1 Les modélisations supervisées, non-supervisées et par renforcement
1.2 Les étapes de construction d’un modèle
1.3 L’évaluation des modèles
Pratique : Évaluer et comparer des modèles préparés pour l’exercice
2. Préparation des variables
2.1 La nature statistique des données et leurs dimensions
2.2 Représenter les variables, Détecter les données aberrantes
2.3 Le ré-échantillonnage de variables
2.4 Réduire le set de variables pour un modèle, faire avec les multi-colinéarités
2.5 Traiter les classes rares
3. Les algorithmes
3.1 Présentation de modèles
Régression linéaire simple, multiple, polynomiale.
Régression logistique Classification hiérarchique et non hiérarchique (K-means)
Classification par arbres de décision et ensemble Naïve Bayes, Random Forest
Machines à vecteurs supports
Méthodes à noyaux
Gradient Boosting
Réseau neuronal
3.2 Mise en pratique
Chaque modèle est accompagné d’un exemple pré-codé. Les exercices s’intercalent dans la présentation pour permettre à chaque équipe de tester les modèles sur leur propre jeu de données.
Public visé : Ce cours s’adresse aux Ingénieurs et techniciens en bureau d’études ou tout autre personne utilisant de la modélisation de données
Prérequis :
- Connaissance en programmation python. De nombreux supports existent sur le web pour apprendre ce langage. Nous utiliserons les librairies scikit-learn, keras et pandas.
- Savoir faire des opérations sur des données dans un tableur
- Se rappeler de ses cours de mathématiques (moyenne, médiane, variance, calcul de distances, dérivées, etc.)
- Travail en binôme avec chacun son propre PC portable connecté sur Internet.
Modalités
Supports de présentation au format pdf transmis par email aux participants
Animation des formations par web-conférence
IMPORTANT
Les participants devront disposer d’une Webcam , d’un micro/casque et un accès internet haut débit
INFORMATIONS PRATIQUES
Participation aux frais
Prix préférentiel pour les adhérents CAP’TRONIC : 750 € HT par personne pour les 4 demi-journées
Pour les grandes entreprises et les PME qui ne souhaitent pas adhérer : 950 € HT par personne pour les 4 demi-journées
Remarque : Jessica France est titulaire d’un numéro d’agrément de formation continue et est référencé DATADOCK depuis le 1er juillet 2017. Cette formation est éligible au financement par votre Opérateur de Compétences (OPCO) hors CPF.