/ Science des données
Projets
Surveillance de l'entrefer dans des turbines hydro-électriques compactes
traitement du signal, visualisation
2023-*
Déplié 3D de la valeur d'entrefer dans une turbine hydroélectrique.
Analyse automatique de mise en page PDF et système RAG
analyse d'image, traitement automatique du langage naturel
2024-*
Exemple de pdf analysé par l'outil développé dans ce projet.
Détection automatique des phases d’éveil/sommeil en pédiatrie à partir d’enregistrements audio
traitement du signal, classification
2024 (3 mois)
Visualisation du spectrograme de MEL d'un enregistrement de sommeil avec labels médicaux sur le dessous.
Analyse automatique de pièces d'usinage 3D
analyse d'image, classification, clustering
2024 (2 mois)
Visualisation TSNE des pièces 3D dans l'espace des embeddings. Les couleurs représentent les classes des pièces.
Dans un second temps, nous avons utilisé un jeu de données labellisé pour proposer un système de classification automatique des pièces (vis, boulons, écrous...).
Recherche avancée de profils scientifiques
traitement automatique du langage naturel, scrapping
2024 (3 mois)
Exemple de résultat d'une requête à l'outil développé dans ce projet.
Recherche
Connaissances du Domaine et Fonctions en Science des Données
Application à la Production d'Hydroélectricité
2020-23
Vasile-Marian Scuturici
Jean-Marc Petit
Amer-Yahia Sihem
Themis Palpanas
Marius Bozga
Frédérique Laforest
Pierre Senellart
Pierre Roumieu
Scatter plot du graphe de contre-exemples d'un jeu de données issu d'une centrale hydro-électrique.
Apprentissage Profond pour la Détection et l'Identification Automatique de Diatomées
pour le Diagnostic Écologique des Milieux d'Eau Douce
2020 (6 mois)
Cédric Pradalier
Ghassan AlRegib
Joseph Montoya
Exemple d'image de microscope synthétique générée dans cette étude.
Publications, séminaires...
/ Publications
Manuscrit de thèse
Domain Knowledge and Functions in Data Science, Application to Hydroelectricity Production
| Manuscrit de thèse
Papier long
Functional dependencies with predicates: what makes the g3-error easy to compute?
| Papier long
Résumé étendu
Automatic Processing of Air Gap Monitoring Signals in Hydro-Generators
| Résumé étendu
Article de journal
Usefulness of synthetic datasets for diatom automatic detection using a deep-learning approach
| Article de journal
Papier long
Assessing the Existence of a Function in your Dataset with the g3 Indicator
| Papier long
Papier de démonstration
ADESIT: Visualize the Limits of your Data in a Machine Learning Process
| Papier de démonstration
Thèse de master
Deep-Learning for Automated Diatom Detection and Identification for the Ecological Diagnosis of Fresh-water Environments
| Thèse de master
/ Séminaires
Surveillance automatique de l'entrefer dans les hydro-générateurs compacts
Semaine des alternatives durables INSA Lyon (Lyon, France) • présentation orale • 2023
Global industrie (Lyon, France) • présentation orale • 2023
Évaluation de l'existence d'une fonction dans un jeu de données : complexité, algorithmique et visualisation
Graph and Databases Workshop [ANR GrR] (Lyon, France) • présentation orale • 2023
MaDICS Défis théoriques pour les sciences du climat (Paris, France) • poster • 2022
MaDICS Symposium [4e étition] (Lyon, France) • poster • 2022
MaDICS BigData4Astro (Lyon, France) • présentation orale • 2021
Utilité des jeux de données synthétiques pour la détection automatique de diatomées grâce à l'apprentissage profond
5ème colloque biennal des Zones Ateliers-CNRS (en ligne) • poster • 2020
/ Logiciels
/ Divers
Étudiant à l'école d'été Machine Learning for Oceans (ML4O)
Évaluateur pour SIGMOD et ICDM
Évaluateur pour ICDM