A l'agenda

Newsletter mars

Atelier 10%

Le prochain atelier 10% se tiendra le jeudi 30 mars de 14h00 à 18h00. Il est ouvert aux experts de la data en poste au sein de l'Etat.

Au programme :
14h00-15h00 : Formation aux bonnes pratiques sur Python par Lino Galiana et Romain Avouac, datascientists à l'Insee, enseignants à l'ENSAE et participants 10%.
Cette formation sera l'occasion de présenter les outils favorisant les bonnes pratiques de développement en Python. Objectif : faciliter la mise en production de projets de data science. Il s'agira d'une présentation synthétique du contenu du cours de l'ENSAE "Bonnes pratiques et mise en production de projets data science".
15h00-17h30 : Ateliers de travail sur les projets 10%, avec l'appui des coachs Etalab.
17h30 : Stand-up finaux des projets par les équipes 10%.
Vous êtes un datascientist de l'Etat et souhaitez participer, contactez-nous : lab-ia@data.gouv.fr

newsletteer mars 2

Webinaire du DataGrandEst

Le DataGrandEst propose tous les jeudis un webinaire "Le jeudi, adonnez vous à la donnée". Des experts de la data échangent autour d'un sujet d'actualité fort. Le jeudi 6 avril de 11h00 à 12h00, le webinaire sera consacré à "L'aquisition de données par drônes".
Pour s'inscrire, c'est ici.

newsletteer mars 2

Un pavillon dédié au numérique de l'État à Viva Technology 2023 !

Cette année et pour la première fois, la DINUM et les directions du numérique de plusieurs ministères participent ensemble à cet événement majeur de la tech.

Au programme : un stand ouvert pendant 4 jours et des conférences.
L'occasion de découvrir l'action numérique de l'État :
🗣 Rencontrez et échangez avec les agents des ministères présents autour de leurs innovations, métiers, projets et services numériques majeurs.
💻 Découvrez des Startups d'État et explorez différents thèmes : inclusion, design, données, IdentitéNumérique, dématérialisation ...

14 au 17 juin 2023, de 9h à 18h
📍 Paris Expo Porte de Versailles
Pour s'inscrire : c'est ici


Rejoindre le programme 10%

Lancé en 2022, le programme 10%, co-porté par la Dinum en association étroite avec l'Insee, est une collaboration inédite entre experts publics de la donnée qui consacrent une partie de leur temps de travail à des projets d'intérêt commun.

Intégrer la communauté 10%, c'est aussi monter en compétence grâce à des formations, échanger entre pairs et partager des moments informels autour de valeurs communes.

En 2023, 8 projets font l'objet d'une collaboration de la communuté 10% :
▶️Transformers : une IA open-source pour l'analyse de texte par les administrations.
▶️ChartsGouv : l'outil de visualisation des données de l'État.
▶️Datanonyme : l'outil pour aider les administrations à anonymiser leurs données.
▶️OCR 2023 : l'outil pour aider les administrations à extraire des informations de documents difficilement exploitables.
▶️Cartiflette : un outil facilitant la réalisation de cartes géographiques grâce à la récupération de fonds de cartes produits par des acteurs publics.
▶️Impact environnemental : former à l'impact environnemental et mesurer celui des projets 10%.
▶️PoufDoc : l'outil pour aider les administrations dans leur production récurrente de rapports.
▶️Le moteur de recherche des datascientists de l'État par organisations, missions et compétences.

Vous êtes datascientist de l'Etat ? Vous avez envie de rejoindre un de ces projets ? Vous avez une idée de projet d'intérêt commun à proposer ? Un projet data/IA répliquable sur lequel vous avez besoin de l'aide d'autres datascientists ?

Contactez-nous : lab-ia@data.gouv.fr
Pour en savoir plus : https://www.10pourcent.etalab.gouv.fr/


Photo newsletter

Retour sur l'atelier 10% du 14 mars

Plus d'une trentaine d'experts de la donnée de l'Etat étaient réunis au Lieu de la Transformation publique le 14 mars dernier. L'occasion pour la communauté 10% de s'ouvrir à d'autres méthodes de travail, un des axes forts de la saison 2. Damien Dufourd, coach agile chez Beta est venu présenter la méthode beta pour identifier un "bon problème". A l'aide de cas pratiques, les participants ont été aménés à bien cerner un problème réel, majeur et actionnable.

Ce premier atelier correspond au lancement de la phase d'investigation, première étape du programme 10%. Les ateliers (2 par mois) s'appuient sur des formations, des apports méthodologiques et travail en équipe sur les projets.


projets 10

Zoom sur un projet 10% : OCR

Les administrations ont régulièrement besoin d'exploiter en masse des documents administratifs sous des formats non directement exploitables (PDF scannés, images ...), par exemple, les dossiers de demandeurs d'emploi, les dossiers logement ... L'information contenue dans ces documents, pour être exploitée, doit passer par une étape d'extraction et de structuration de l'information, qui est vite très chronophage si elle doit être réalisée à la main.
C'est tout l'enjeu du projet OCR : une solution pour extraire automatiquement des informations contenues dans des documents non directement exploitables (PDF, images, photos ...).

Ce projet a d'abord été lancé par la DINUM en 2021. L'équipe projet a commencé par réaliser un état des lieux des travaux déjà réalisés dans le domaine. Elle a ensuite priorisé les cas d'usages identifiés et développpé des briques open source pour y répondre.

Le projet a été repris lors de la saison 1 du programme 10% en 2022 avec une équipe interministérielle composée de la Direction interministérielle du numérique, de l'INSEE, du ministère des Armées, du ministère de l'Intérieur et de la Haute Autorité de Santé. La saison 1 a été l'occasion de travailler sur un cas d'usage : extraire les informations des tickets de caisse pour l'enquête budget des familles de l'INSEE.

Le travail autour de ce projet se poursuit lors de la saison 2 : capitaliser sur les livrables de la saison 1 et aller plus loin en traitant un autre cas d'usage : l'extraction de tableaux ou l'extraction des données de formulaires.

Si vous avez envie de rejoindre l'équipe 10% sur ce projet, vous pouvez contacter : lab-ia@data.gouv.fr

Si vous êtes intéressés par les sujets d'OCRisation, le 29 mars de 14h00 à 16h00 , le réseau des data scientists de l'Insee recevra Christopher Kermorvant, chercheur spécialisé dans la reconnaissance de caractères manuscrits et fondateur de Teklia, entreprise qui mène plusieurs projets avec l'administration (BNF, INED...). Les infos pratiques sont ici.

En savoir plus


Benoit

Portrait de participant 10%

Chaque mois, la newsletter du programme 10% vous fait découvrir le parcours d'un datascienstist de l'Etat, participant au programme 10%. Benoit Courty, datascientist à l'Assemblée nationale inaugure cette série de portraits. Un parcours marqué par une envie constante de se former et le sens du bien commun !

Quel est ton parcours ?
J'ai terminé l'IUT de Dijon en 1999 et je suis arrivé à Paris pour faire un stage, j'y suis resté !
J'ai ensuite obtenu un diplôme d'ingénieur en cours du soir au CNAM. Cours que j'ai suivi pendant 8 ans à côté de mon travail de prestataire développeur dans différents grands groupes français. Les premières années étaient très intenses.
Suite à une réorganisation, je me suis lancé dans l'entreprenariat. J'ai monté une start up dans le domaine des drones civils pour l'inspection automatique d'ouvrage, ce qui m'a fait découvrir l'analyse d'image par deep learning. L'activité n'ayant pas décollée, je suis devenu freelance chez France Télévisions, puis dans une banque comme chef de projet technique.

Comment es-tu arrivé dans le public ?
Le Covid a été un déclencheur. J'ai profité de cette période pour continuer à me former et m'investir dans Data for Good, une association qui propose aux datascientists des défis à relever en matière de santé, d'environnement, d'inclusion sociale, d'éducation ou de citoyenneté. Participer à cette association, c'était l'opportunité de mettre en application toutes les formations que j'ai faites, et aussi de me mettre au service du bien commun.
C'est Data for good qui m'a fait connaitre l'offre d'emploi de datascientist à l'Assemblée nationale. J'ai postulé car j'ai toujours eu un vrai intérêt pour l'intérêt général. Déjà au lycée, j'avais crée un club pour donner accès à internet aux habitants du quartier. Etre utile aux autres, c'est ce qui m'a amené à travailler dans le public.

C'est quoi le quotidien d'un datascientist à l'Assemblée nationale ?
A l'Assemblée nationale, j'ai une fonction opérationnelle. Ce qui me plait, c'est d'être revenu au développement. Je travaille dans une équipe qui grandit et fonctionne comme une start-up. Cela ressemble assez à ce que j'ai vécu dans le privé, avec un fonctionnement agile et une gouvernance horizontale, bien loin de l'image de lourdeur dont souffre le service public.

Quel est le projet sur lequel tu travailles actuellement à l'Assemblée nationale ?
Je suis dans l'équipe LexImpact qui propose des outils data à destination des députés.
Je m'occupe, avec des économistes, de construire une base représentative de la population en utilisant des enquêtes INSEE et des données fiscales exhaustives. Ceci pour faire des simulations à destination des députés pour qu'ils testent l'impact de leurs amendements sur la population et sur le budget de l'état. Ce projet est né d'un hakathon #dataFin sur les données fiscales en 2018 puis pérénisé au sein de l'Assemblée nationale. Seuls les députés et leurs collaborateurs peuvent accéder à la partie budget de l'Etat, pour sécuriser l'enquête INSEE utilisée pour les calculs.
La partie sur les cas types est publique et permet de simuler une cinquantaine de dispositifs socio-fiscaux, grâce aux contributions à OpenFisca.

Un autre service ouvert à tous dont je m'occupe est le téléchargement d'un pdf présentant divers statistiques (population, entreprise, logement...) à l'échelle de la circonscription.

Qu'est-ce tu aimes dans ce métier ?
J'aime contribuer à du code et des services ouverts ainsi que sa diversité : developpement, DevOps, exploration de données ... Faire parler les données, de façon à les rendre utile, c'est passionnant.

Pourquoi as-tu rejoint le programme 10% ?
J'aime l'aspect communautaire de ce programme, l'idée de partager avec des pairs et de pouvoir échanger. Je retrouve également l'aspect formation qui est important dans mon parcours. Dans un contexte où l'IA et les données prennent de plus en plus de place, il est important de pouvoir se former en continu.

Quel est le projet auquel tu participes dans le programme 10 % ?
J'ai rejoins la saison 2 par intérêt pour les sujets sur les modèles de langage et l'anonymisation, dont nous avons besoin pour LexImpact.

Lors de l'atelier de lancement du 14 février, une participante, Brigitte Tran, a proposé un projet autour de l'écoresponsabilité. Il m'a interpelé car j'ai moi même travaillé sur ce sujet à Data For Good où j'ai mis mes compétences au service du projet Code Carbon.
C'est un projet crée au Canada par un des pères fondateurs du deep learning, Yoshua Bengio pour mesurer l'impact des entrainements de machine learning. J'ai rejoint le projet lorsqu'il a été présenté à Data For Good en 2021. J'en suis depuis un des principaux mainteneurs.

Avec l'équipe 10%, nous allons proposer d'utiliser cet outil pour mesurer l'impact carbone des projets 10% et, pourquoi pas ensuite le proposer pour mesurer l'impact carbone des projets publics. Il y aura également une formation sur l'impact environnemental. C'est important de savoir où sont les impacts de nos métiers car il y a beaucoup de fausses informations qui circulent à ce sujet.

En savoir plus


Bon à savoir

La Dinum a une nouvelle feuille de route !


La nouvelle feuille de route de la Direction interministérielle du numérique a pour objectif d'accompagner et faire réussir les projets numériques de l'État, au service des priorités gouvernementales et dans un souci d'amélioration de l'efficacité de l'action publique.


Pour consulter la nouvelle feuille de route, c'est ici.


Jobs

Etalab recherche son adjoint/e à la directice d'Etalab et chef/fe du pôle ouverture et partage des données. Un poste sur un sujet stratégique et passionnant. Pour consulter l'offre : ici et le/la responsable opérationnel/le, technique et sécurité.

L'INPI recherche un datascientist.

Le Commissariat Général au Développement Durable recherche deux datascientists sur les sujets de "politiques énergétiques et ménages" et "développement durable".

Les services statistiques ministériels (SSM) des ministères de l'intérieur et de la justice recherchent un datascientist responsable de l'appariement statistique des données relatives à la chaine pénale et un datascientist sur l'insécurité et la délinquance.

L'INSERM recherche un datascientist.

La DGFIP recherche un Expert Infrastructure Cloud, BigData et Intelligence Artificielle.


Le coin lecture

La CNIL publie son premier dossier thématique dédié à l'identité numérique.
La question de l'identité des personnes est centrale dans l'organisation de toute société, car elle permet d'attribuer un statut ou un rôle à chacun dans un collectif.

Ce dossier thématique revient sur le concept d'identité numérique, son lien historique avec les enjeux « informatique et libertés » ainsi que sur quelques chiffres relatifs à l'identité numérique, des définitions simples et les grands concepts à retenir, un état des lieux sur l'identité numérique aujourd'hui, les usages publics et privés et notamment la carte nationale d'identité électronique (CNIe).
Consulter le dossier ici.

Les Ministères Écologie, Énergie et Territoires publient "les principes généraux de qualité des données".
Des données de bonne qualité favorisent des décisions éclairées et renforcent leur légitimité et leur autorité. Partant de ce constat, les Ministères Écologie Énergie Territoires ont produit des principes généraux de qualité des données dans le cadre de sa Feuille de route de la donnée, des algorithmes et des codes sources.

Une initiative à découvrir ici


Appel à idées ?

Pour la prochaine newsletter du programme 10%, nous faisons appel à vous !

Vous avez un projet data et IA au sein de la sphère publique à valoriser dans une prochaine newsletter, une formation utile à la communauté, un événement, des actus, des conseils de lecture ... Faites-nous le savoir : lab-ia@data.gouv.fr