A l'agenda

Newsletter mai

Anniversaire du programme 10%

Le programme 10%, porté par la Direction interministérielle du numérique, en lien étroit avec l'Insee est une collaboration inédite entre experts de la data de l'État. Pendant 9 mois, ces talents consacrent une partie de leur temps de travail à des projets d'intérêt commun autour de l'IA et la data, tout en bénéficiant d'une montée en compétence.

Le 25 mai, le programme 10% fêtera ses 1 an !

Au programme :
14h00 : Ouverture par Stéphanie Schaer, directrice interministérielle du numérique et Pascal Rivière, chef de l'inspection générale de l'INSEE.
14h10 : Le programme 10% raconté par les participants.
14h20 : Le fast and curious du programme 10%. La communauté 10% répond à des questions autour de la data et l'IA (ou pas !)
14h30 : Pitchs de trois équipes sur des projets en cours :
- Transformers (Saison 2) : une IA open-source pour l'analyse de texte par les administrations ;
- Datanonyme (Saison 2) : un outil pour aider les administrations à anonymiser leurs données ;
- FormIAble (Saison 1) : un outil pour aider les administrations à extraire des informations de documents difficilement exploitables.
14h45 : Témoignage de Guillaume Rozier, conseiller du Président de la République sur les sujets de la stratégie numérique et des données publiques. Data engineer de formation, Guillaume Rozier viendra échanger avec la communauté 10% sur son parcours, ses projets, sa vision pour la sphère data de l'État. L'échange sera suivi de questions/réponses avec le public.
15h30 : Moment festif, fêtons ensemble les un an du programme 10%

L'événement est ouvert aux experts publics de l''Etat, leurs managers et l'ensemble des agents publics.
Pour vous inscrire : ici

Newsletter mai

Conférence sur la datavisualisation

Le 25 mai, de 10h00 à 12h00, le Bercy Hub organise une conférence sur la datavisualisation donnée par E. Mauvière.

Il s'agira d'évoquer les bonnes pratiques, les règles opérationnelles et les outils simples pour construire des visualisations et valorisations de données, des graphiques et des cartes faciles à lire et à comprendre, permettant de rendre leur message intelligible, transparent, ouvert, efficace et utile pour tous nos concitoyens.

Pour participer à cette conférence sur place ou à distance, tous les détails : ici

Pour en savoir plus sur le Bercy Hub, organisateur de l'événement : consulter cette page.

newsletter mai 2

Séminaire de la DGFIP : l'IA explicable

Le 9 juin 2023 de 13h00 à 17h00, la DGFIP organise un séminaire sur l'IA explicable.

Astrid Bertrand vous proposera tout d'abord de clarifier le concept d'explicabilité, ses différents degrés, les perspectives légales et les évaluations possibles par les utilisateurs.
Christian Yann Robert, professeur de statistiques actuarielles et de mathématiques à l'Institut Polytechnique de Paris, ENSAE Paris et Arthur MAILLART vous présenteront ensuite des exemples concrets d'applications dans le domaine de l'assurance pour illustrer l'importance de l'explicabilité.


Pour vous inscrire, c'est ici.

Newsletter mai 3

 Viva Technology 2023 : un pavillon dédié au numérique de l'Etat

Cette année et pour la première fois, la DINUM et les directions du numérique de plusieurs ministères participent ensemble à cet événement majeur de la tech.

Au programme : un stand ouvert pendant 4 jours et des conférences.
L'occasion de découvrir l'action numérique de l'État :
🗣 Rencontrez et échangez avec les agents des ministères présents autour de leurs innovations, métiers, projets et services numériques majeurs.
💻 Découvrez des Startups d'État et explorez différents thèmes : inclusion, design, données, IdentitéNumérique, dématérialisation ...

14 au 17 juin 2023, de 9h à 18h
📍 Paris Expo Porte de Versailles
Pour s'inscrire : c'est ici


Rejoindre le programme 10%

Lancé en 2022, le programme 10%, co-porté par la Dinum en association étroite avec l'Insee, est une collaboration inédite entre experts publics de la donnée qui consacrent une partie de leur temps de travail à des projets d'intérêt commun.

Intégrer la communauté 10%, c'est aussi monter en compétence grâce à des formations, échanger entre pairs et partager des moments informels autour de valeurs communes.

En 2023, 8 projets font l'objet d'une collaboration de la communuté 10% :
▶️Transformers : une IA open-source pour l'analyse de texte par les administrations.
▶️ChartsGouv : l'outil de visualisation des données de l'État.
▶️Datanonyme : l'outil pour aider les administrations à anonymiser leurs données.
▶️FormIable 2023 : l'outil pour aider les administrations à extraire des informations de documents difficilement exploitables.
▶️Cartiflette : un outil facilitant la réalisation de cartes géographiques grâce à la récupération de fonds de cartes produits par des acteurs publics.
▶️Impact environnemental : former à l'impact environnemental et mesurer celui des projets 10%.
▶️PoufDoc : l'outil pour aider les administrations dans leur production récurrente de rapports.
▶️Le moteur de recherche des datascientists de l'État par organisations, missions et compétences.

Vous êtes datascientist de l'Etat ? Vous avez envie de rejoindre un de ces projets ? Vous avez une idée de projet d'intérêt commun à proposer ? Un projet data/IA répliquable sur lequel vous avez besoin de l'aide d'autres datascientists ?
Contactez-nous : lab-ia@data.gouv.fr
Pour en savoir plus : https://www.10pourcent.etalab.gouv.fr/


Jean-Baptiste Delfau 2

Portrait de participant 10%

Chaque mois, la newsletter du programme 10% vous fait découvrir le parcours d'un datascienstist de l'Etat, participant au programme 10%. Jean-Baptiste Delfau, datascientist à la Gendarmerie nationale poursuit cette série de portraits. Un parcours riche marqué par des séjours à l'étranger, le goût de la logique et l'envie constante de mettre son expertise au service de l'intérêt général.

Quel est ton parcours ?
Je ne suis pas datascientist de formation. A l'origine, j'avais tenté médecine car j'aime l'humain, aider les autres. En début de formation, j'avais de la physique et j'ai beaucoup apprécié l'aspect logique de cette discipline, tout l'inverse du "par coeur". Je me suis alors orienté vers une thèse en physique statistique.
Après ma thèse, j'ai eu envie de tenter une expérience à l'étranger. J'ai d'abord passé deux ans à l'université de Tokyo en post-doctorat. Je suis un passionné de l'Asie et du Japon en particulier et l'université de Tokyo est reconnue pour l'excellence de sa recherche en physique. Puis j'ai enchainé avec une expérience professionnelle en Espagne pendant deux ans. C'était l'occasion de rester à l'étranger tout en me rapprochant de la France et le projet de recherche qui m'était proposé m'intéressait particulièrement.

Ces expériences à l'étranger ont été très enrichissantes. Par exemple, au Japon, j'ai beaucoup appris en matière de méthodes de travail. Le rapport au travail est très différent, il n'est pas vécu comme une charge bien au contraire. La mentalité est unique, le rapport à la hierarchie très marqué. Quant au milieu de la recherche, c'est un milieu exigeant dans lequel on doit toujours pouvoir être en mesure de démontrer ce que l'on avance. J'essaie de garder en tête ces principes encore aujourd'hui.

Comment es-tu arrivé à travailler comme datascientist dans le public?

Je suis rentré en France en 2017, aussi par besoin de me rapprocher de ma famille. Entre la physique statistique et la datascience, il y a pas mal de similitudes. La transition était facile et naturelle. J'ai candidaté dans une start up située à la Défense. Je me suis aperçu que mon profil plaisait. J'y ai fait mes armes en temps que datascientist en expérimentant les différentes facettes du métier : gestion de projet, conseil ...

Au bout de deux ans, j'ai eu envie de retourner dans le public et travailler pour l'intérêt général. Daphnée, une participante actuelle du programme 10%, que j'avais connue dans la start-up de la Défense, m'a dit que le Service des technologies et des systèmes d'information de la sécurité intérieure (ST(SI)²) créait un nouveau datalab. Pour moi, c'était un véritable challenge. Tout était à construire et ce projet présentait un véritable atout : avoir les SI et les métiers à portée de main. C'était également l'opportunité pour moi de travailler sur des projets concrets et industrialisables. Je me suis lancé dans cette aventure en 2019.

C'est quoi aujourd'hui ton quotidien en tant que datascientist à la gendarmerie nationale?

Il y a deux aspects essentiels: la partie technique de mon travail consiste à coder des algorithmes d'intelligence artificielle. Mais en amont, il est nécessaire de rencontrer les métiers et de définir ensemble les besoins algorithmiques en jouant un rôle d'AMOA : j'essaie de comprendre le rôle et la logique de travail des gens avec qui nous collaborons afin de bien cerner leurs besoins et d'élaborer ensemble des outils qui leur seront utiles. Cette activité me donne un aperçu d'aspects très différents de l'institution, c'est une partie de mon travail que j'apprécie particulièrement.

Sur quels projets travailles-tu actuellement ?


Le Datalab travaille actuellement beaucoup sur le projet PREDNATINF : quand un gendarme constate une infraction, il rédige un court texte et doit classer cette infraction selon sa nature. Il existe des milliers de natures d'infraction car celles-ci sont très précises. Par exemple, on fera la distinction entre la conduite en état d'ébriété et la conduite en état d'ébrité réitérée ... Le moteur de recherche portant actuellement sur les natures d'infraction est assez rudimentaire et fonctionne uniquement par mots-clés. Nous avons travaillé sur un algorithme permettant de classer les natures d'infraction par pertinence en se basant sur le texte rédigé par le gendarme. Cela permet à ce dernier de gagner du temps et d'améliorer la classification des infractions afin d'avoir une meilleure visibilité sur les chiffres de la déliquance.

Autre projet plus prospectif : nous travaillons sur des réseaux de causalité permettant de mettre en lumière s'il existe un lien de causalité entre deux séries temporelles. Par exemple : dans certaines villes, il existe des corrélations entre les infractions commises dans différents quartiers. Déterminer ces liens de causalité permet de mieux comprendre la délinquance afin de mieux lutter contre ces phénomènes.

Qu'est-ce tu aimes dans ce métier?


J'ai toujours aimé les sciences, pour moi c'est un peu comme résoudre des énigmes. Au-delà de cet aspect, j'aime rencontrer les gens, comprendre comment ils travaillent, les aider tout simplement. Quand on achève un projet qui rend vraiment service au métier, c'est très gratifiant.

Pourquoi as-tu rejoint le programme 10% ?


Le concept du programme 10% est très intéressant. C'est une super idée de mettre des experts qui ne se connaissent pas en relation pour se faire un réseau, sur lequel on peut s'appuyer. En plus, le programme permet de monter en compétence, d'avoir de nouvelles idées de projets, de partager des problématiques communes... J'ai la chance d'avoir des chefs qui m'ont beaucoup encouragé à rejoindre le programme.

Quel est le projet auquel tu participes dans le programme 10 % ?


Plusieurs projets m'intéressaient. Je me suis finalement positionné sur le projet FormIable qui consiste à aider les administrations à extraire des informations de documents difficilement exploitables comme des pdf scannés. C'est un projet qui est directement utile à la Gendarmerie. L'équipe est super et plurielle : les participants viennent de la Justice, de l'Insee, de la Gendarmerie, de l'Aviation Civile.
Le programme 10%, c'est l'opportunité de participer à un projet collectif qui nous aide très directement dans nos projets internes, tout en se formant et en échangeant entre pairs venant d'horizons différents.


Jobs

Etalab ouvre plusieurs postes : chef/fe du datalab, chef/ffe adjoint/e du Datalab et product owner, ingénieur data, analyste des données responsable opérationnel, technique et sécurité du Datalab (DataSecOps), chef/fe du pôle animation, chef/fe adjoint/e du pôle animation data et chargé/e d'animation data, coordonnateur animation data, chargé d'animation data et du réseau des AMADAC.


Pour tous les découvrir et postuler, c'est ici.


Le coin lecture

La Cour des Comptes publie une comparaison entre 10 stratégies nationales sur l'intelligence artificielle.


La Cour a examiné d'autres stratégies nationales sur l'intelligence artificielle. Pour ce faire, elle s'est appuyée sur les services techniques et de coopération et les services économiques de nos ambassades dans une dizaine de pays.
Une étude à découvrir ici

La data du futur, l'ère de la démocratisation
Quand on demande à 10 grands acteurs des données comment sera le futur de la data, ils répondent : démocratique. La démocratisation de l'accès et de l'utilisation de la data s'est accélérée grâce à trois facteurs : de nouvelles régulations, des avancées technologiques et une meilleure compréhension des données par le grand public. Cette ouverture bénéficie non seulement à l'ensemble de l'entreprise, mais aussi aux gouvernements et aux citoyens.
Découvrez dans ce livre les visions des 10 interviewés : ici

Arte a réalisé un documentaire sur l'utilisation des algorithmes nourries d'analyses de chercheurs et de témoignages d'utilisateurs.
Disponible jusqu'au 9 juillet ici

Erwan Le Pennec, Professeur au département de mathématiques appliquées (CMAP) de l'École polytechnique a réalisé une conférence sur ChatGPT, son mode de fonctionnement, ses cas d'usages, ses limites mais aussi les grands défis qui en découlent.
Découvrez le replay de cette conférence ici.

Les Ministères Écologie, Énergie et Territoires publient "les principes généraux de qualité des données".
Des données de bonne qualité favorisent des décisions éclairées et renforcent leur légitimité et leur autorité. Partant de ce constat, les Ministères Écologie Énergie Territoires ont produit des principes généraux de qualité des données dans le cadre de sa Feuille de route de la donnée, des algorithmes et des codes sources.
Une initiative à découvrir i ci

La CNIL publie un plan d'action pour un déploiement de systèmes d'IA respectueux de la vie privée.
Ce plan s'articule autour de 4 volets. Pour le découvrir, c'est ici


Appel à idées ?

Pour la prochaine newsletter du programme 10%, nous faisons appel à vous !
Vous avez un projet data et IA au sein de la sphère publique à valoriser dans une prochaine newsletter, une formation utile à la communauté, un événement, des actus, des conseils de lecture ... Faites-nous le savoir : lab-ia@data.gouv.fr