- Cet évènement est passé
Journée commune des fédérations NormaSTIC et NorMAth
12 octobre 2018 @ 9 h 30 min - 17 h 15 min
GratuitLes deux fédérations STIC et mathématiques organisent le 12 octobre 2018 une journée scientifique commune. La journée aura lieu dans l’amphi A au rez-de-chaussée de l’UFR ST à Rouen, Campus du Madrillet. Le programme de la journée est le suivant:
- 9h30-10h accueil, Café.
- 10h-11h CHAMROUKHI, Faicel , « SMILES: Statistical Modeling and Inference for unsupervised Learning at LargE-Scale »
Abstract:
Large-scale data analysis is an inherently multidisciplinary area and is becoming of broader interest for today’s society. The ANR project SMILES is a collaborative fundamental research project that aims at introducing an unsupervised statistical modeling framework and scaled inference algorithms for transforming large-scale data into knowledge. It considers the large-scale context as a whole, with its main issues related to inference from a big volume of data of very high dimension and underlying complex hidden structures. The key tenet of SMILES is to introduce large-scale regression-based sparse (non)parametric models for data representation, and large-scale latent data models for unsupervised data classification. The knowledge extraction will namely consist in automatically retrieving hidden structures, summarizing prototypes, groups, sparse representations. We consider different data settings, including functional data, multimodal bioacoustical data, and biological data.
- 11h15-12h15 Thierry Lecroq, Algorithmique du texte : recherche incrémentale de motifs dans des séquences fortement similaires
Résumé :
Après avoir présenté quelques travaux sur le thème du traitement de séquences biologiques menés par l’équipe TIBS (Traitement de l’Information en Biologie-Santé) du LITIS en collaboration avec des équipes de biologie et de médecine nous nous focaliserons sur la recherche incrémentale de motif dans des séquences fortement similaires. En effet l’avènement des technologies de séquençage à haut débit a permis l’accumulation de séquences génomiques d’individus de la même espèce.
Ces séquences ne diffèrent que par un très petit nombre de variations. Il y a donc un fort besoin d’algorithmes efficaces pour effectuer des tâches de recherche de motifs dans des ensembles de séquences aussi spécifiques.
Une solution efficace consiste à indexer ces séquences. Toutefois lorsque cette indexation s’avère impossible
la recherche doit se faire de manière incrémentale. Nous présenterons plusieurs méthodes pour rechercher un seul motif de longueur m en imposant une contrainte sur le nombre et le type de variations possibles dans une fenêtre de longueur m sur les séquences fortement similaires.
Ensuite nous fournirons des solutions en relâchant certaines de ces contraintes. Les différentes méthodes proposées sont des adaptations d’algorithmes classiques de recherche de motifs.Des résultats expérimentaux montrent que nos algorithmes, bien que non optimaux dans le pire des cas,
possèdent de bonnes performances en la pratique. - 12h15-13h30 Repas
- 13h30 – 14h30 Jalal Fadili, Présentation du projet EUR
- 14h30-15h30 Luc Brun, Distance d’édition entre graphes : Un panorama des méthodes historiques et plus récentes.
Abstract:
Defining a metric between objects is a basic step of any pattern recognition algorithm. Using graphs, this notion of distance is not straightforward. Among the different distances between graphs that one may imagine, the Graph Edit Distance has progressively become a standard tool within the structural pattern recognition framework. Indeed, this distance allows to take into account fine differences between graphs, may be easily tuned and may satisfy all the axioms of a distance.
Basically, the most common definition of the graph edit distance is based on the notion of edit path. An edit path between two graphs G1 and G2 is a sequence of node/edge removal/substitution or insertion operations transforming $G_1$ into G2. Each edit path may be associated to a cost hence defining the Graph Edit Distance between G1 and G2 as the minimal cost of all edit paths between these two graphs. Within this survey, we will first review some definitions and properties of the Graph Edit Distance in order to set up a framework which will allow us to review the main families of methods used to compute the graph edit distance. Among them, we may cite methods based on a tree search or methods based on interger programming.
Résumé :
La définition d’une métrique entre les objets est une étape de base de tout algorithme de reconnaissance de formes. Si nous utilisons des graphes, cette notion de distance n’est pas immédiate. Parmi les différentes distances entre graphes que l’on peut trouver, la distance d’édition c’est progressivement imposée comme un outil standard en reconnaissance structurelle de formes. En effet, cette distance permet de tenir compte de fines différences entre les graphes, et peut être facilement réglée pour satisfaire toutes les axiomes d’une métrique.Fondamentalement, la définition la plus courante de la distance d’édition est basée sur la notion de chemin d’édition. Un chemin d’édition entre deux graphes G1 et G2 est une séquence d’opérations de retrait/substitution ou d’insertion sur les nœuds ou les arêtes transformant G1 en G2. Chaque chemin d’édition peut être associé à un coût, ce qui permet de définir la distance entre G1 et G2 comme le coût minimal de tous les chemins d’édition entre deux graphes. Dans le cadre de cet exposé, nous commencerons par passer en revue certaines définitions et propriétés de la distance d’édition sur graphes avant d’introduire les principales familles de méthodes utilisées pour calculer la distance d’édition sur graphes. Parmis celles-ci nous pouvons citer des méthodes basées sur une recherche arborescente ou des méthodes basées sur la programmation entière.
- 15h30-16h15 Posters et Pause café.
- 16h15-17h15 Exposé de Gabriel Peyré (Talk invité, ENS): « Transport optimal numérique pour la science de données »
Résumé :
Le transport optimal (TO) est devenu un outil mathématique fondamental à l’interface entre le calcul des variations, les équations aux dérivées partielles et les probabilités. Il a cependant fallu beaucoup plus de temps pour que cette notion soit utilisée dans les applications numériques. Cette situation est en grande partie due au coût de calcul élevé de la résolution des problèmes d’optimisation sous-jacents. Dans cet exposé, je passerai en revue une nouvelle classe d’approches numériques pour la résolution approximative de problèmes d’optimisation basés sur du TO. Elles offrent une nouvelle perspective pour l’application du TO en imagerie (pour effectuer du transfert de couleurs ou du morphing de formes et de textures) et l’apprentissage automatique (pour la classification et l’apprentissage de modèles génératifs profonds). Plus d’informations sont disponibles sur le site de notre livre « Computational Optimal Transport » https://optimaltransport.github.io/
Résumé : L’Ecole Universitaire de Recherche (EUR) MINMACS, déposée dans le cadre du PIA3, rassemble et structure la communauté des sciences du numérique en Normandie.
Cette présentation repassera en revue le projet déposé, les retours reçus et fera un point d’étape en vue de mobiliser la communauté dans la perspective de la nouvelle vague.
Localisation: