pierrefg
Mon parcours Informatique Porfolio artistique Contact

pierre fg

cover picture

/ Informatique

~ Retrouvez ici mes projets de science des données, mes sujets de recherche ainsi qu'un petit inventaire de mes publications, logiciels et séminaires.
Projets
Recherche
Publications, séminaires...

Projets

Surveillance de l'entrefer dans des turbines hydro-électriques compactes

traitement du signal, visualisation

2023-2024 (1 an)

project cover picture

Déplié 3D de la valeur d'entrefer dans une turbine hydroélectrique.

Projet de maintenance prédictive mené avec la Compagnie Nationale du Rhône. J’ai développé une méthode automatisée pour surveiller l’entrefer rotor–stator à partir de capteurs capacitifs tournants, dans un contexte de déformation du stator et d’excentricité dynamique du rotor.
La solution fournit des résultats rapides et interprétables par des experts, tout en réduisant le volume de données à stocker.

Analyse automatique de mise en page PDF et système RAG

analyse d'image, traitement automatique du langage naturel

2024 (4 mois)

project cover picture

Exemple de pdf analysé par l'outil développé dans ce projet.

Conception d'un système d’analyse automatique de documents PDF complexes (études d’impact environnemental), combinant OCR et réseaux convolutionnels pour extraire la structure du document (titres, paragraphes, tableaux, figures).
J’ai ensuite développé un système de RAG permettant l’interrogation efficace de documents volumineux à partir de requêtes en langage naturel.

Détection automatique des phases d’éveil/sommeil en pédiatrie à partir d’enregistrements audio

traitement du signal, classification

2024 (3 mois)

project cover picture

Spectrogramme de MEL avec annotations médicales.

Projet de recherche visant à détecter automatiquement les phases d’éveil et de sommeil chez l’enfant à partir d’enregistrements audio de polygraphie respiratoire.
J’ai entraîné des modèles conçus pour l'audio sur plus de 8000 heures d’audio, atteignant des performances comparables à l’état de l’art, et un fort potentiel de réduction des délais d’examen.

Analyse automatique de pièces d'usinage 3D

analyse d'image, classification, clustering

2024 (2 mois)

project cover picture

Projection TSNE des embeddings de pièces 3D.

Développement d'une méthode d’analyse de pièces d’usinage 3D au format .step, basée sur des représentations vectorielles latentes.
Cette approche permet le regroupement automatique de pièces similaires ainsi que leur classification (vis, boulons, écrous).

Recherche avancée de profils scientifiques

traitement automatique du langage naturel, scrapping

2024 (3 mois)

project cover picture

Résultat d'une requête sur l'outil développé.

Développement d'un moteur de recherche de profils scientifiques à partir de l’archive ouverte HAL (plus de 1,5 million d’articles).
L’outil repose sur des embeddings multilingues par auteur et permet la recherche en langage naturel, l’évaluation de la pertinence des publications et l’assistance à la lecture.

Recherche

Thèse

Connaissances du Domaine et Fonctions en Science des Données

Application à la Production d'Hydroélectricité

2020-23

manuscrit • poster • slides • ADESIT
Thèse défendue à Lyon le 24 novembre 2023 devant un jury composé de :
Directeurs

Vasile-Marian Scuturici

Jean-Marc Petit

Rapporteur.euses

Amer-Yahia Sihem

Themis Palpanas

Examinateur.rices

Marius Bozga

Frédérique Laforest

Pierre Senellart

Invité

Pierre Roumieu

project cover picture

Scatter plot du graphe de contre-exemples d'un jeu de données issu d'une centrale hydro-électrique.

Dans cette thèse, nous étudions le lien entre la connaissance métier sous la forme d'une fonction et la science des données. Considérons le scénario suivant. Soit D(y,z1,...,zn) un ensemble de données, Alice une experte en science des données, Bob un expert du domaine et y=f(z1, ..., zn) une fonction connue de Bob grâce à ses connaissances métier. Dans cette thèse, nous nous intéressons aux questions suivantes, simples mais cruciales pour Alice. Il s'avère que ces problèmes sont liés à l'étude des contre-exemples par l'utilisation des dépendances fonctionnelles (DF) et, en particulier, des mes...

Thèse de master

Apprentissage Profond pour la Détection et l'Identification Automatique de Diatomées

pour le Diagnostic Écologique des Milieux d'Eau Douce

2020 (6 mois)

manuscrit • poster
Thèse de master approuvée le 24 juillet 2020 par :
Directeur

Cédric Pradalier

Jury

Ghassan AlRegib

Joseph Montoya

project cover picture

Exemple d'image de microscope synthétique générée dans cette étude.

Les diatomées sont un type de microalgues unicellulaires présent dans tous les environnements aquatiques. Leur grande diversité et ubiquité font de ces organismes des bio-indicateurs reconnus pour surveiller l'état écologique des cours d'eau, notamment dans le cadre de la mise en œuvre de la Directive-Cadre sur l'Eau en Europe. Dans ce contexte, nous proposons une étude sur la détection des diatomées sur des images microscopiques en utilisant une architecture de détection d'objets basée sur l'apprentissage profond. Afin de réduire le nombre d'images annotées manuellement nécessaires à l'entraî...

Publications, séminaires...

cover picture

/ Publications

À paraître, 2026
Article de journal

Computing the g3-error with Relaxed Equality:
Complexity, Algorithmic and Visualization

Pierre Faure--Giovagnoli, Simon Vilmin, Jean-Marc Petit, Vasile-Marian ScuturiciÀ paraître, 2026
| Article de journal
ACM Transactions on Database Systems
2023
Manuscrit de thèse

Domain Knowledge and Functions in Data Science,
Application to Hydroelectricity Production

Pierre Faure--Giovagnoli2023
| Manuscrit de thèse
INSA Lyon (Villeurbanne, France)
hal • poster • slides • voir plus
2023
Papier long

Functional dependencies with predicates: what makes the g3-error easy to compute?

Simon Vilmin, Pierre Faure--Giovagnoli, Jean-Marc Petit, Vasile-Marian Scuturici2023
| Papier long
28th International Conference on Conceptual Structures [ICCS] (Berlin, Allemagne)
hal
2023
Résumé étendu

Automatic Processing of Air Gap Monitoring Signals in Hydro-Generators

Pierre Faure--Giovagnoli, Christophe Turbidi, Vasile-Marian Scuturici2023
| Résumé étendu
SURVISHNO conference (Toulouse, France)
hal
2022
Article de journal

Usefulness of synthetic datasets for diatom automatic detection using a deep-learning approach

Aishwarya Venkataramanan, Pierre Faure--Giovagnoli, Cyril Regan, David Heudre, Cécile Figus, Philippe Usseglio-Polatera, Cédric Pradalier, Martin Laviale2022
| Article de journal
Engineering Applications of Artificial Intelligence [Elsevier]
hal
2022
Papier long

Assessing the Existence of a Function in your Dataset with the g3 Indicator

Pierre Faure--Giovagnoli, Jean-Marc Petit, Vasile-Marian Scuturici2022
| Papier long
38th IEEE International Conference on Data Engineering [ICDE] (Kuala Lumpur, Malaisie)
hal
2021
Papier de démonstration

ADESIT: Visualize the Limits of your Data in a Machine Learning Process

Pierre Faure--Giovagnoli, Jean-Marc Petit, Vasile-Marian Scuturici, Marie Le Guilly2021
| Papier de démonstration
47th International Conference on Very Large Data Bases [VLDB] (Copenhague, Danemark) • Papier de démonstration
Prix de la meilleure démonstration à BDA 2021
hal • ADESIT
2020
Thèse de master

Deep-Learning for Automated Diatom Detection and Identification for the Ecological Diagnosis of Fresh-water Environments

Pierre Faure--Giovagnoli2020
| Thèse de master
Georgia Institute of Technology (Atlanta, USA)
Georgia Tech Library • poster • voir plus

/ Séminaires

2024

Détection automatique des phases de réveil/sommeil en pédiatrie à partir d’enregistrements audio

Pierre Faure--Giovagnoli, Vincent Barellon, Benjamin Bertin, Corinne Depagne, Geoffroy De La Gastine, André Stagnara2024
Congrès du Sommeil (Lille, France) • communication orale en symposium • 2024
2023-24

Surveillance automatique de l'entrefer dans les hydro-générateurs compacts

Pierre Faure--Giovagnoli, Christophe Turbidi, Vasile-Marian Scuturici2023-24
Journée de la Science (Lyon, France) • présentation orale à des collégien.nes • 2024
Semaine des alternatives durables INSA Lyon (Lyon, France) • présentation orale • 2023
Global industrie (Lyon, France) • présentation orale • 2023
2021-23

Évaluation de l'existence d'une fonction dans un jeu de données : complexité, algorithmique et visualisation

Pierre Faure--Giovagnoli, Simon Vilmin, Jean-Marc Petit, Vasile-Marian Scuturici2021-23
MALOTEC seminar at the LORIA laboratory (Nancy, France) • présentation orale • 2023
Graph and Databases Workshop [ANR GrR] (Lyon, France) • présentation orale • 2023
MaDICS Défis théoriques pour les sciences du climat (Paris, France) • poster • 2022
MaDICS Symposium [4e étition] (Lyon, France) • poster • 2022
MaDICS BigData4Astro (Lyon, France) • présentation orale • 2021
2020

Utilité des jeux de données synthétiques pour la détection automatique de diatomées grâce à l'apprentissage profond

Aishwarya Venkataramanan, Pierre Faure--Giovagnoli, Cyril Regan, David Heudre, Cécile Figus, Philippe Usseglio-Polatera, Cédric Pradalier, Martin Laviale2020
Imaginecology (en ligne) • présentation orale (180s) • 2020
5ème colloque biennal des Zones Ateliers-CNRS (en ligne) • poster • 2020

/ Logiciels

2022

ADESIT - A web application for visualizing the limits of a dataset in supervised learning

Pierre Faure--Giovagnoli, Jean-Marc Petit, Vasile-Marian Scuturici, Marie Le Guilly2022
hal • git • ADESIT
2022

Fastg3 - A Python library for computing the g3 indicator efficiently

Pierre Faure--Giovagnoli, Jean-Marc Petit, Vasile-Marian Scuturici2022
hal • git

/ Divers

2022

Étudiant à l'école d'été Machine Learning for Oceans (ML4O)

2022
Sorbonne Center for Artificial Intelligence (Paris, France)
infos
2022

Évaluateur pour SIGMOD et ICDM

2022
SIGMOD 2022 • ICDM 2022
2021

Évaluateur pour ICDM

2021
ICDM 2021
Mentions légales | Politique de confidentialité
Pierre Faure--Giovagnoli, 2025