pierrefg
Mon parcours Informatique Porfolio artistique Contact

pierre fg

cover picture

/ Informatique

~ Retrouvez ici mes projets de science des données, mes sujets de recherche ainsi qu'un petit inventaire de mes publications, logiciels et séminaires.
Projets Recherche Publications, séminaires...

Projets

Surveillance de l'entrefer dans des turbines hydro-électriques compactes

traitement du signal, visualisation

2023-2024 (1 an)

project cover picture

Déplié 3D de la valeur d'entrefer dans une turbine hydroélectrique.

La Compagnie Nationale du Rhône (CNR) exploite un grand nombre de centrales hydroélectriques le long de la rive française du Rhône. Suite à des collisions rotor-stator sur certaines de leurs turbines, la CNR a commencé à développer des techniques de maintenance prédictive en surveillant l'entrefer (distance entre le stator et le rotor). Il est utile de noter que c'est le stator qui subit une déformation mécanique progressive et non le rotor comme c'est plus souvent le cas dans ces machines. Par conséquent, l'entrefer doit être surveillé à partir du rotor à l'aide de capteurs tournants. Après p...

Analyse automatique de mise en page PDF et système RAG

analyse d'image, traitement automatique du langage naturel

2024 (4 mois)

project cover picture

Exemple de pdf analysé par l'outil développé dans ce projet.

Dans ce projet, nous avons mis en place un système de détection de mise en page pour des documents PDF complexes (études d'impact environnemental). Plusieurs outils issus de la littérature (OCR, réseaux convolutionnels) ont été assemblés afin d'extraire : paragraphes, titres, listes, tableaux, figures, etc. Les détections sont associées à un niveau de confiance, et le type de figure est également détecté. Dans un second temps, nous avons développé un système de RAG (retrieval-augmented generation) pour permettre l'interrogation de très grands documents. Ce système regroupe plusieurs outils de ...

Détection automatique des phases d’éveil/sommeil en pédiatrie à partir d’enregistrements audio

traitement du signal, classification

2024 (3 mois)

project cover picture

Visualisation du spectrograme de MEL d'un enregistrement de sommeil avec labels médicaux sur le dessous.

En France, les structures pédiatriques réalisant une polygraphe (PG) respiratoire du sommeil sont rares, impliquant un délai d’examen souvent déraisonnable avec une perte de chance pour l'enfant atteint de SAS. La présente étude ouvre la voie à une assistance à la lecture des enregistrements PG, dans l’objectif de réduire ces délais. Nous nous intéressons à la détection automatique des phases d’éveil / sommeil. Pour ce faire, nous choisissons d’exploiter le son (NOX®), qui est le signal le plus fiable chez l’enfant. La détection des phases d'éveil à partir d'enregistrements audio reste un défi...

Analyse automatique de pièces d'usinage 3D

analyse d'image, classification, clustering

2024 (2 mois)

project cover picture

Visualisation TSNE des pièces 3D dans l'espace des embeddings. Les couleurs représentent les classes des pièces.

Dans ce projet, nous avons analysé des pièces d'usinage 3D au format .step. Les pièces ont été converties dans un espace vectoriel latent permettant leur comparaison sur des critères visuel. Nous avons alors proposé un système permettant de réunir automatiquement des pièces aux caractéristiques similiaires grâce à plusieurs techniques de clustering complémentaires.
Dans un second temps, nous avons utilisé un jeu de données labellisé pour proposer un système de classification automatique des pièces (vis, boulons, écrous...).

Recherche avancée de profils scientifiques

traitement automatique du langage naturel, scrapping

2024 (3 mois)

project cover picture

Exemple de résultat d'une requête à l'outil développé dans ce projet.

Dans ce projet, nous avons développé une solution pour améliorer le processus de recrutement des profils scientifiques. En nous appuyant sur une base de données composée de plus de 1,5 million d'articles issus de l'archive ouverte HAL, nous avons construit une base consolidée d'environ 2 millions d'auteur.rices. L'outil final permet d'effectuer des recherches à l'aide de requêtes en langage naturel. Il repose sur une agrégation d'embeddings multilingues par auteur et une recherche des plus proches voisins approximée. Ce système permet également d'évaluer la pertinence des publications individu...

Recherche

Thèse

Connaissances du Domaine et Fonctions en Science des Données

Application à la Production d'Hydroélectricité

2020-23

manuscrit • poster • slides • ADESIT
Thèse défendue à Lyon le 24 novembre 2023 devant un jury composé de :
Directeurs

Vasile-Marian Scuturici

Jean-Marc Petit

Rapporteur.euses

Amer-Yahia Sihem

Themis Palpanas

Examinateur.rices

Marius Bozga

Frédérique Laforest

Pierre Senellart

Invité

Pierre Roumieu

project cover picture

Scatter plot du graphe de contre-exemples d'un jeu de données issu d'une centrale hydro-électrique.

Dans cette thèse, nous étudions le lien entre la connaissance métier sous la forme d'une fonction et la science des données. Considérons le scénario suivant. Soit D(y,z1,...,zn) un ensemble de données, Alice une experte en science des données, Bob un expert du domaine et y=f(z1, ..., zn) une fonction connue de Bob grâce à ses connaissances métier. Dans cette thèse, nous nous intéressons aux questions suivantes, simples mais cruciales pour Alice. Il s'avère que ces problèmes sont liés à l'étude des contre-exemples par l'utilisation des dépendances fonctionnelles (DF) et, en particulier, des mes...

Thèse de master

Apprentissage Profond pour la Détection et l'Identification Automatique de Diatomées

pour le Diagnostic Écologique des Milieux d'Eau Douce

2020 (6 mois)

manuscrit • poster
Thèse de master approuvée le 24 juillet 2020 par :
Directeur

Cédric Pradalier

Jury

Ghassan AlRegib

Joseph Montoya

project cover picture

Exemple d'image de microscope synthétique générée dans cette étude.

Les diatomées sont un type de microalgues unicellulaires présent dans tous les environnements aquatiques. Leur grande diversité et ubiquité font de ces organismes des bio-indicateurs reconnus pour surveiller l'état écologique des cours d'eau, notamment dans le cadre de la mise en œuvre de la Directive-Cadre sur l'Eau en Europe. Dans ce contexte, nous proposons une étude sur la détection des diatomées sur des images microscopiques en utilisant une architecture de détection d'objets basée sur l'apprentissage profond. Afin de réduire le nombre d'images annotées manuellement nécessaires à l'entraî...

Publications, séminaires...

cover picture

/ Publications

en cours
Article de journal

Computing the g3-error with Relaxed Equality:
Complexity, Algorithmic and Visualization

Pierre Faure--Giovagnoli, Simon Vilmin, Jean-Marc Petit, Vasile-Marian Scuturicien cours
| Article de journal
ACM Transactions on Database Systems
2023
Manuscrit de thèse

Domain Knowledge and Functions in Data Science,
Application to Hydroelectricity Production

Pierre Faure--Giovagnoli2023
| Manuscrit de thèse
INSA Lyon (Villeurbanne, France)
hal • poster • slides • voir plus
2023
Papier long

Functional dependencies with predicates: what makes the g3-error easy to compute?

Simon Vilmin, Pierre Faure--Giovagnoli, Jean-Marc Petit, Vasile-Marian Scuturici2023
| Papier long
28th International Conference on Conceptual Structures [ICCS] (Berlin, Allemagne)
hal
2023
Résumé étendu

Automatic Processing of Air Gap Monitoring Signals in Hydro-Generators

Pierre Faure--Giovagnoli, Christophe Turbidi, Vasile-Marian Scuturici2023
| Résumé étendu
SURVISHNO conference (Toulouse, France)
hal
2022
Article de journal

Usefulness of synthetic datasets for diatom automatic detection using a deep-learning approach

Aishwarya Venkataramanan, Pierre Faure--Giovagnoli, Cyril Regan, David Heudre, Cécile Figus, Philippe Usseglio-Polatera, Cédric Pradalier, Martin Laviale2022
| Article de journal
Engineering Applications of Artificial Intelligence [Elsevier]
hal
2022
Papier long

Assessing the Existence of a Function in your Dataset with the g3 Indicator

Pierre Faure--Giovagnoli, Jean-Marc Petit, Vasile-Marian Scuturici2022
| Papier long
38th IEEE International Conference on Data Engineering [ICDE] (Kuala Lumpur, Malaisie)
hal
2021
Papier de démonstration

ADESIT: Visualize the Limits of your Data in a Machine Learning Process

Pierre Faure--Giovagnoli, Jean-Marc Petit, Vasile-Marian Scuturici, Marie Le Guilly2021
| Papier de démonstration
47th International Conference on Very Large Data Bases [VLDB] (Copenhague, Danemark) • Papier de démonstration
Prix de la meilleure démonstration à BDA 2021
hal • ADESIT
2020
Thèse de master

Deep-Learning for Automated Diatom Detection and Identification for the Ecological Diagnosis of Fresh-water Environments

Pierre Faure--Giovagnoli2020
| Thèse de master
Georgia Institute of Technology (Atlanta, USA)
Georgia Tech Library • poster • voir plus

/ Séminaires

2024

Détection automatique des phases de réveil/sommeil en pédiatrie à partir d’enregistrements audio

Pierre Faure--Giovagnoli, Vincent Barellon, Benjamin Bertin, Corinne Depagne, Geoffroy De La Gastine, André Stagnara2024
Congrès du Sommeil (Lille, France) • communication orale en symposium • 2024
2023-24

Surveillance automatique de l'entrefer dans les hydro-générateurs compacts

Pierre Faure--Giovagnoli, Christophe Turbidi, Vasile-Marian Scuturici2023-24
Journée de la Science (Lyon, France) • présentation orale à des collégien.nes • 2024
Semaine des alternatives durables INSA Lyon (Lyon, France) • présentation orale • 2023
Global industrie (Lyon, France) • présentation orale • 2023
2021-23

Évaluation de l'existence d'une fonction dans un jeu de données : complexité, algorithmique et visualisation

Pierre Faure--Giovagnoli, Simon Vilmin, Jean-Marc Petit, Vasile-Marian Scuturici2021-23
MALOTEC seminar at the LORIA laboratory (Nancy, France) • présentation orale • 2023
Graph and Databases Workshop [ANR GrR] (Lyon, France) • présentation orale • 2023
MaDICS Défis théoriques pour les sciences du climat (Paris, France) • poster • 2022
MaDICS Symposium [4e étition] (Lyon, France) • poster • 2022
MaDICS BigData4Astro (Lyon, France) • présentation orale • 2021
2020

Utilité des jeux de données synthétiques pour la détection automatique de diatomées grâce à l'apprentissage profond

Aishwarya Venkataramanan, Pierre Faure--Giovagnoli, Cyril Regan, David Heudre, Cécile Figus, Philippe Usseglio-Polatera, Cédric Pradalier, Martin Laviale2020
Imaginecology (en ligne) • présentation orale (180s) • 2020
5ème colloque biennal des Zones Ateliers-CNRS (en ligne) • poster • 2020

/ Logiciels

2022

ADESIT - A web application for visualizing the limits of a dataset in supervised learning

Pierre Faure--Giovagnoli, Jean-Marc Petit, Vasile-Marian Scuturici, Marie Le Guilly2022
hal • git • ADESIT
2022

Fastg3 - A Python library for computing the g3 indicator efficiently

Pierre Faure--Giovagnoli, Jean-Marc Petit, Vasile-Marian Scuturici2022
hal • git

/ Divers

2022

Étudiant à l'école d'été Machine Learning for Oceans (ML4O)

2022
Sorbonne Center for Artificial Intelligence (Paris, France)
infos
2022

Évaluateur pour SIGMOD et ICDM

2022
SIGMOD 2022 • ICDM 2022
2021

Évaluateur pour ICDM

2021
ICDM 2021
Mentions légales | Politique de confidentialité
Pierre Faure--Giovagnoli, 2025