La montée en compétence

Outils, techniques autour de l'IA et la data, méthodes de travail, communication, environnement open data ... Découvrez ici toutes nos formations !


SAISON 2024

Miniature Masterclass

Retour d’expérience sur la création d’Open Food Facts et l’utilisation de l’IA en son sein

Raphaël Bournhonesque, ingénieur Machine Learning, nous présente Open Food Facts : une base de données collaborative et ouverte qui recense les produits alimentaires du monde entier.

Lien vers la formation

SAISON 2023

Brigitte benoit

Comprendre et mesurer l'impact environnemental des projets data

L’objectif de la formation conçue par deux participants du programme 10%, Brigitte TRAN, conseillère SI au ministère de la Culture et Benoît COURTY, datascientist à l'Assemblée nationale, est de sensibiliser et aider les professionnels du numérique à mesurer l'impact environnemental de leurs projets. La formation propose des apports généraux sur l'éco-responsabilité et un outil concret de mesure d'impact (CodeCarbone). Pour aller plus lien, consulter le support de la formation : la présentation générale et la bibliographie : https://speakerdeck.com/etalabia/programme-10-percent-partie-1-formation-impact-environnemental?slide=6 la présentation de code carbone https://speakerdeck.com/etalabia/programme-10-percent-partie-2-formation-impact-environnemental et la présentation faite par Benoit Courty lors du SunnyTech 2023 : https://www.youtube.com/watch?v=GxwEa7wydWI

Public

Masterclass data visualisation

Etienne Côme, chargé de recherche à l'Université Gustave Eiffel nous expliquera comment produire une datavisualisation qui fonctionne ? Quels sont les détails qui comptent en matière de datavisualisation ? Comment une datavisualisation peut-elle impacter la réception d'un message ?

Lien vers la formation
John Matthiew

Testing des modèles et leur évaluation

Alors que l’AI Act demande aux praticiens de l’IA de mettre en place des solutions de mise en qualité, les data scientists devront tester les modèles de ML avant de mettre leurs modèles en production. Au-delà des métriques globales de performance, il faudra veiller à mettre en place des tests variés (comme les tests métamorphiques ou heuristiques) en prenant en compte des segments de données spécifiques. Cette formation donnée par Jean-Marie John-Mathews, PhD, co-founder & CPO de Giskard comprend une présentation de l’état de l’art du ML Testing puis une session pratique sur les quelques tests spécifiques. On montrera enfin comment intégrer les tests dans une pipeline de production.

Lien vers la formation


Lino

Les bonnes pratiques avec Python

Lino Galiana et Romain Avouac, data scientists à l'Insee, nous présentent les bonnes pratiques avec Python. Pour aller plus loin, le cours conçu par Lino Galiana "Python pour la data science" accessible ici : https://pythonds.linogaliana.fr/. Vous y trouverez des notebooks Jupyter pour s’exercer. L’ensemble des codes sources est stocké sur Github.

Lien vers la formation

Damien Dufour

Comment identifier un "bon problème ?"

Damien Dufour, coach chez beta.gouv nous explique comment identifier un "vrai" problème selon la méthode "produit". Beta.gouv est un est un programme d’incubation qui aide les administrations publiques à construire des services numériques utiles, simples, faciles à utiliser.

Le lien vers le support de formation : https://speakerdeck.com/etalabia/formation-beta-dot-gouv-dot-fr-comment-identifier-un-bon-probleme

Lien vers la formation

Romain Avouac

Présentation du SSP Cloud

Romain Avouac, datascientist à l’Insee nous présente le SSP Cloud, une plateforme moderne et libre de data science (https://onyxia.lab.sspcloud.fr/) proposée et maintenue par l’Insee et à disposition des agents de l’État pour l’expérimentation à partir de données ouvertes. Une démonstration a permis de montrer le potentiel de l’outil pour faciliter le travail collaboratif sur les projets 10% : stockage de données, services de data science partagés, documentation et formations aux outils innovants.

Lien vers la formation

SAISON 2022

Olivier Levitt(1)

Présentation d'Onyxia

Olivier Levitt du SSP Datalab de l’Insee nous présente le déploiement d’applications sur Onyxia, (https://onyxia.lab.sspcloud.fr/), une plateforme mutualisée de services de traitement des données statistiques et de datascience. Pour consulter le répertoire Github associé : https://github.com/olevitt/demo-deploiement

Lien vers la formation

pengfei-liu

Machine Learning Ops

Pengfei Liu, big data architect à l'Insee nous donne une formation sur le machine learning. Pour consulter le support de présentation : répertoire Github associé : https://github.com/pengfei99/MLOPS

Lien vers la formation

Coraline

Picher son projet data face à un public de non-experts

Coraline Gillard, chargée de mission au sein du programme des Entrepreneurs d'intérêt général (Dinum) nous explique comment picher son projet data devant un public de non-experts. Objectif ; préparer les participants 10% dans la présentation de leurs projets lors de la cérémonie de clôture de la saison 1.

Lien vers la formation