/ Informatique

~ Retrouvez ici mes projets de science des données, mes sujets de recherche ainsi qu'un petit inventaire de mes publications, logiciels et séminaires.

Projets

Surveillance de l'entrefer dans des turbines hydro-électriques compactes

traitement du signal, visualisation

2024-2025 (1 an)

Déplié 3D de la valeur d'entrefer dans une turbine hydroélectrique.

Projet de maintenance prédictive mené avec la Compagnie Nationale du Rhône. J’ai développé une méthode automatisée pour surveiller l’entrefer rotor–stator à partir de capteurs capacitifs tournants, dans un contexte de déformation du stator et d’excentricité dynamique du rotor.
La solution fournit des résultats rapides et interprétables par des experts, tout en réduisant le volume de données à stocker.

Analyse automatique de mise en page PDF et système RAG

analyse d'image, traitement automatique du langage naturel

2025 (4 mois)

Exemple de pdf analysé par l'outil développé dans ce projet.

Conception d'un système d’analyse automatique de documents PDF complexes (études d’impact environnemental), combinant OCR et réseaux convolutionnels pour extraire la structure du document (titres, paragraphes, tableaux, figures).
J’ai ensuite développé un système de RAG permettant l’interrogation efficace de documents volumineux à partir de requêtes en langage naturel.

Détection automatique des phases d’éveil/sommeil en pédiatrie à partir d’enregistrements audio

traitement du signal, classification

2025 (3 mois)

Spectrogramme de MEL avec annotations médicales.

Projet de recherche visant à détecter automatiquement les phases d’éveil et de sommeil chez l’enfant à partir d’enregistrements audio de polygraphie respiratoire.
J’ai entraîné des modèles conçus pour l'audio sur plus de 8000 heures d’audio, atteignant des performances comparables à l’état de l’art, et un fort potentiel de réduction des délais d’examen.

Analyse automatique de pièces d'usinage 3D

analyse d'image, classification, clustering

2024 (2 mois)

Projection TSNE des embeddings de pièces 3D.

Développement d'une méthode d’analyse de pièces d’usinage 3D au format .step, basée sur des représentations vectorielles latentes.
Cette approche permet le regroupement automatique de pièces similaires ainsi que leur classification (vis, boulons, écrous).

Recherche avancée de profils scientifiques

traitement automatique du langage naturel, scrapping

2024 (3 mois)

Résultat d'une requête sur l'outil développé.

Développement d'un moteur de recherche de profils scientifiques à partir de l’archive ouverte HAL (plus de 1,5 million d’articles).
L’outil repose sur des embeddings multilingues par auteur et permet la recherche en langage naturel, l’évaluation de la pertinence des publications et l’assistance à la lecture.

Recherche

Thèse

Connaissances du Domaine et Fonctions en Science des Données

Application à la Production d'Hydroélectricité

2020-23

manuscrit • poster • slides • ADESIT

Thèse défendue à Lyon le 24 novembre 2023 devant un jury composé de :

Directeurs

Vasile-Marian Scuturici

Jean-Marc Petit

Rapporteur.euses

Amer-Yahia Sihem

Themis Palpanas

Examinateur.rices

Marius Bozga

Frédérique Laforest

Pierre Senellart

Invité

Pierre Roumieu

Scatter plot du graphe de contre-exemples d'un jeu de données issu d'une centrale hydro-électrique.

Dans cette thèse, nous étudions le lien entre la connaissance métier sous la forme d'une fonction et la science des données. Considérons le scénario suivant. Soit D(y,z1,...,zn) un ensemble de données, Alice une experte en science des données, Bob un expert du domaine et y=f(z1, ..., zn) une fonction connue de Bob grâce à ses connaissances métier. Dans cette thèse, nous nous intéressons aux questions suivantes, simples mais cruciales pour Alice. Il s'avère que ces problèmes sont liés à l'étude des contre-exemples par l'utilisation des dépendances fonctionnelles (DF) et, en particulier, des mes...

Thèse de master

Apprentissage Profond pour la Détection et l'Identification Automatique de Diatomées

pour le Diagnostic Écologique des Milieux d'Eau Douce

2020 (6 mois)

manuscrit • poster

Thèse de master approuvée le 24 juillet 2020 par :

Directeur

Cédric Pradalier

Jury

Ghassan AlRegib

Joseph Montoya

Exemple d'image de microscope synthétique générée dans cette étude.

Les diatomées sont un type de microalgues unicellulaires présent dans tous les environnements aquatiques. Leur grande diversité et ubiquité font de ces organismes des bio-indicateurs reconnus pour surveiller l'état écologique des cours d'eau, notamment dans le cadre de la mise en œuvre de la Directive-Cadre sur l'Eau en Europe. Dans ce contexte, nous proposons une étude sur la détection des diatomées sur des images microscopiques en utilisant une architecture de détection d'objets basée sur l'apprentissage profond. Afin de réduire le nombre d'images annotées manuellement nécessaires à l'entraî...

Publications, séminaires...

/ Publications

2026
Article de journal

Computing the g3-error with Relaxed Equality:
Complexity, Algorithms and Visualization

Pierre Faure--Giovagnoli, Simon Vilmin, Jean-Marc Petit, Vasile-Marian Scuturici2026
| Article de journal

ACM Transactions on Database Systems

ACM (open access)

2023
Manuscrit de thèse

Domain Knowledge and Functions in Data Science,
Application to Hydroelectricity Production

Pierre Faure--Giovagnoli2023
| Manuscrit de thèse

INSA Lyon (Villeurbanne, France)

hal • poster • slides • voir plus

2023
Papier long

Functional dependencies with predicates: what makes the g3-error easy to compute?

Simon Vilmin, Pierre Faure--Giovagnoli, Jean-Marc Petit, Vasile-Marian Scuturici2023
| Papier long

28th International Conference on Conceptual Structures [ICCS] (Berlin, Allemagne)

hal

2023
Résumé étendu

Automatic Processing of Air Gap Monitoring Signals in Hydro-Generators

Pierre Faure--Giovagnoli, Christophe Turbidi, Vasile-Marian Scuturici2023
| Résumé étendu

SURVISHNO conference (Toulouse, France)

hal

2022
Article de journal

Usefulness of synthetic datasets for diatom automatic detection using a deep-learning approach

Aishwarya Venkataramanan, Pierre Faure--Giovagnoli, Cyril Regan, David Heudre, Cécile Figus, Philippe Usseglio-Polatera, Cédric Pradalier, Martin Laviale2022
| Article de journal

Engineering Applications of Artificial Intelligence [Elsevier]

hal

2022
Papier long

Assessing the Existence of a Function in your Dataset with the g3 Indicator

Pierre Faure--Giovagnoli, Jean-Marc Petit, Vasile-Marian Scuturici2022
| Papier long

38th IEEE International Conference on Data Engineering [ICDE] (Kuala Lumpur, Malaisie)

hal

2021
Papier de démonstration

ADESIT: Visualize the Limits of your Data in a Machine Learning Process

Pierre Faure--Giovagnoli, Jean-Marc Petit, Vasile-Marian Scuturici, Marie Le Guilly2021
| Papier de démonstration

47th International Conference on Very Large Data Bases [VLDB] (Copenhague, Danemark) • Papier de démonstration

Prix de la meilleure démonstration à BDA 2021

hal • ADESIT

2020
Thèse de master

Deep-Learning for Automated Diatom Detection and Identification for the Ecological Diagnosis of Fresh-water Environments

Pierre Faure--Giovagnoli2020
| Thèse de master

Georgia Institute of Technology (Atlanta, USA)

Georgia Tech Library • poster • voir plus

/ Séminaires

2024

Détection automatique des phases de réveil/sommeil en pédiatrie à partir d’enregistrements audio

Pierre Faure--Giovagnoli, Vincent Barellon, Benjamin Bertin, Corinne Depagne, Geoffroy De La Gastine, André Stagnara2024

Congrès du Sommeil (Lille, France) • communication orale en symposium • 2024

2023-24

Surveillance automatique de l'entrefer dans les hydro-générateurs compacts

Pierre Faure--Giovagnoli, Christophe Turbidi, Vasile-Marian Scuturici2023-24

Journée de la Science (Lyon, France) • présentation orale à des collégien.nes • 2024
Semaine des alternatives durables INSA Lyon (Lyon, France) • présentation orale • 2023
Global industrie (Lyon, France) • présentation orale • 2023

2021-23

Évaluation de l'existence d'une fonction dans un jeu de données : complexité, algorithmique et visualisation

Pierre Faure--Giovagnoli, Simon Vilmin, Jean-Marc Petit, Vasile-Marian Scuturici2021-23

MALOTEC seminar at the LORIA laboratory (Nancy, France) • présentation orale • 2023
Graph and Databases Workshop [ANR GrR] (Lyon, France) • présentation orale • 2023
MaDICS Défis théoriques pour les sciences du climat (Paris, France) • poster • 2022
MaDICS Symposium [4e étition] (Lyon, France) • poster • 2022
MaDICS BigData4Astro (Lyon, France) • présentation orale • 2021

2020

Utilité des jeux de données synthétiques pour la détection automatique de diatomées grâce à l'apprentissage profond

Aishwarya Venkataramanan, Pierre Faure--Giovagnoli, Cyril Regan, David Heudre, Cécile Figus, Philippe Usseglio-Polatera, Cédric Pradalier, Martin Laviale2020

Imaginecology (en ligne) • présentation orale (180s) • 2020
5ème colloque biennal des Zones Ateliers-CNRS (en ligne) • poster • 2020

/ Logiciels

2022

ADESIT - A web application for visualizing the limits of a dataset in supervised learning

Pierre Faure--Giovagnoli, Jean-Marc Petit, Vasile-Marian Scuturici, Marie Le Guilly2022

hal • git • ADESIT

2022

Fastg3 - A Python library for computing the g3 indicator efficiently

Pierre Faure--Giovagnoli, Jean-Marc Petit, Vasile-Marian Scuturici2022

hal • git

/ Divers

2022

Étudiant à l'école d'été Machine Learning for Oceans (ML4O)

2022

Sorbonne Center for Artificial Intelligence (Paris, France)

infos

2022

Évaluateur pour SIGMOD et ICDM

2022

SIGMOD 2022 • ICDM 2022

2021

Évaluateur pour ICDM

2021

ICDM 2021

Mentions légales | Politique de confidentialité

Pierre Faure--Giovagnoli, 2026

/ Informatique

~ Retrouvez ici mes projets de science des données, mes sujets de recherche ainsi qu'un petit inventaire de mes publications, logiciels et séminaires.

Projets

Surveillance de l'entrefer dans des turbines hydro-électriques compactes

traitement du signal, visualisation

2024-2025 (1 an)

Déplié 3D de la valeur d'entrefer dans une turbine hydroélectrique.

Analyse automatique de mise en page PDF et système RAG

analyse d'image, traitement automatique du langage naturel

2025 (4 mois)

Exemple de pdf analysé par l'outil développé dans ce projet.

Détection automatique des phases d’éveil/sommeil en pédiatrie à partir d’enregistrements audio

traitement du signal, classification

2025 (3 mois)

Spectrogramme de MEL avec annotations médicales.

Analyse automatique de pièces d'usinage 3D

analyse d'image, classification, clustering

2024 (2 mois)

Projection TSNE des embeddings de pièces 3D.

Recherche avancée de profils scientifiques

traitement automatique du langage naturel, scrapping

2024 (3 mois)

Résultat d'une requête sur l'outil développé.