Réunion du projet AGAC
- Date:
- 3 mai 2019.
- Lieu:
- Amphi Marie Curie, INSA de Rouen, Saint Etienne du Rouvray.
- 13h45-14h15, Guillaume Hoffman:
Utilisation de la chimie quantique pour prédire la réactivité
We will discuss about the capability of various intrinsic molecular and atomic descriptors, grounded in the conceptual density functional theory (CDFT) and the quantum theory of atoms-in-molecules frameworks (QTAIM), to predict the experimental electrophilicity of numerous compounds, and especially the Michael acceptors (1), which are fundamental organic reagents involved in the formation of carbon–carbon bonds and carbon-heteroatoms. To this aim, linear and multilinear regressions between these theoretical properties and the experimental values gathered in Mayr-Patz’ scale (2) were performed. Then, the role of structural dynamical effects on reactivity properties of selected Michael acceptors are discussed (3). To this second aim, quantum molecular dynamics simulations were evaluated. The implications of these results for building a predictive model correlated to Mayr’s electrophilicity index are then discussed, paving the way towards a more realistic account of experimental results. Eventually, we hope this study could allow a rational prediction on the reactivity of others essential families in organic chemistry.
1. G. Hoffmann, et al, J. Mol. Model. 2018, 24, 281
2. H. Mayr, et al, SAR and QSAR in Environmental Research 2015, 26, 619
3. G. Hoffmann, et al, Chem. Phys Lett. 2019, 724, 24 - 14h15-14h45, Ramzi Chaieb & Muhammat Balcilar :
Towards a machine learning analysis of Mayr Dataset
The 111 molecules dataset computed and provided by COBRA proposes a nice regression problem where the challenge is to predict the electrophilicity of molecular compounds. Unlike classic QSPR problems, molecular graphs are enriched with numerous real attributes on both graph and node levels. This particularity reveals the need to update classical machine learning methods operating in chemoinformatics. During this presentation, we will present a first analysis of this dataset using existing methods. This first naive results may constitute a baseline for future improvements. After that, research directions for a new kernel totally adapted to this kind of structural information will be presented and discussed..
- 14h45-15h15, Natacha Lambert:
De C++ à Python, le calcul de la distance d’édition de graphes par la librairie GedLib
Travailler sur des graphes, surtout complexes, peut être une tâche ardue. Afin de les comparer, il existe le calcul de distance d’édition d’un graphe, qui calcule le coût nécessaire pour passer d’un graphe à une autre, ce qui permet de mesurer la similarité des deux. Si ce problème est NP-dur, il existe cependant plusieurs heuristiques selon le type de graphes, qui permettent de donner une valeur concluante en un temps raisonnable.
GedLib est une librairie créée par David Blumenthal qui regroupe beaucoup de ces méthodes pour calculer la distance d’édition entre deux graphes. Cependant, celle-ci n’est disponible qu’en C++, limitant son utilisation. Le travail effectué est donc de créer un lien afin de pouvoir utiliser cette librairie en Python, langage bien plus souple pour programmer, tout en gardant l’optimisation que permet les langages bas niveau.
A l’aide de Cython, module de Python permettant d’intégrer du code C et C++, les différentes fonctions et méthodes de GedLib sont rendues disponible afin de pouvoir effectuer les calculs depuis un code Python, avec pour finalité de pouvoir lancer les calculs complexes, comme le calcul du graphe médian d’un corpus de graphes.
- 15h15-15h45, Guillaume Renton :
Tentative d’apprentissage de l’isomorphisme de sous-graphes
Nous présentons une méthode basée sur l’apprentissage pour l’isomorphisme de sous-graphe. L’isomorphisme de sous-graphe consiste en la détection de graphes (sous-graphe) au sein d’un plus grand graphe.
L’approche se base sur les réseaux de neurones sur graphes (GNN) dans une approche proche des réseaux siamois. Une méthode similaire aux Edges Network de [1] est utilisée afin d’adapter un réseau de neurone à la détection du sous-graphe dans une dernière étape.
Les résultats, bien qu’obtenus dans un cas simple sur une base synthétique, sont encourageants.[1] : Gilmer, Justin, et al. « Neural message passing for quantum chemistry. » 2017.
- 15h45-16h Pause
- 16h-16h30, Muhammet Balcilar:
Spectral Graph Convolutional Neural Network for Chemoinformatics
Graph CNNs can be classified as two class in terms of filtering mechanism named Spatial and Spectral Graph CNN. Although it is computationally expensive to use spectral CNN due to the extra forward-backward transformation between spatial-spectral domain, theoretically spectral Graph CNN is the equivalent of classical CNN and filtering process is more robust. All theory under Spectral Graph CNN is based on Graph Signal Processing where we suppose the signal is coming arbitrary graph’s node, instead of classical euclidian domain signals such as image or speech. In order to the chemoinformatic signals are mostly defined on the graph, we attempted to predict the electrophilicity value of given molecules by Spectral Graph CNN. In this presentation, a brief fundamental of Graph Signal Processing will be presented, later we will describe our new Spectral Graph CNN architecture, the presentation will be ended by some initial results on some dataset on Chemoinformatics.
- 16h30-17h,
Vo Nhat Vinh: Similarité entre pharmacophores s’appuyant sur les distances d’édition de graphe
L’objectif du projet est de positionner la bioactivité potentielle de molécules organiques au profil biologique actuellement inconnu (impacts en pharmacologie et toxicologie). La prédiction se fait via la présence de configurations structurelles caractéristiques d’un profil de bioactivité : les pharmacophores. Le présent projet consiste à étudier les relations entre ces pharmacophores représentatifs de certaines activités biologiques, en calculant des distances d’édition de graphe (DEG). Une procédure par séparation et évaluation (PSE) s’applique à calculer ces distances de la manière exacte mais la taille des molécules provoque un problème de temps de calcul. Grâce à Norns, un fruit du projet Minomics, nous pouvons extraire une espace des pharmacophores et le profil de bioactivité qu’ils représentent en considérant un ensemble de molécules pour lesquelles les données biologiques sont présentes. Un processus de traitement est envisagé pour représenter cet espace avec les DEG. Cela va nous permettre par la suite de définir la proximité entre les molécules organiques d’intérêt et des activités biologiques à travers une proximité vis-à-vis de ces espaces pharmacophoriques.
- 17h00-17h30, Nicolas Boria :
Generalized Median Graph via Iterative
Alternate MinimizationsComputing a graph prototype may constitute a core element for clustering or classification tasks. However, its computation is an NP-Hard problem, even for simple classes of graphs. In this paper, we propose an efficient approach based on block coordinate descent to compute a generalized median graph from a set of graphs. This approach relies on a clear definition of the optimization process and handles labeling on both edges and nodes. This iterative process optimizes the edit operations to
perform on a graph alternatively on nodes and edges. Several experiments on different datasets show the efficiency of our approach.
[osm_map_v3 map_center= »49.3848,1.0733″ zoom= »15″ width= »100% » height= »450″ marker_name= »mic_black_pinother_02.png » map_border= »thin solid grey » tagged_color= »black »]