Partenaires

CNRS


Rechercher

Sur ce site

Sur le Web du CNRS


Accueil > le GDR > Thèmes de recherche

Thèmes de recherche

Méthodes de criblage virtuel et support au criblage réel.

Ces méthodes sont le pendant des techniques de criblages réel. Il s’agit de techniques ultra rapides (au plus, de l’ordre de la minute par composé) permettant d’obtenir une information théorique sur toute une chimiothèque. Ces techniques sont usuellement réparties dans deux catégories : celles basées sur la structure des ligands (ligand-based) et celles basées sur la structure des cibles (structure-based).

  • Méthodes basées sur la structure des ligands :
  • Les filtres représentent des ensembles de conditions auxquelles doivent satisfaire a priori les molécules que l’on souhaite étudier. Ces conditions s’expriment sur des valeurs théoriques qui sont calculées une seule fois sur toute la base de données et sur ses mises à jour ; de ce fait, ils sont très rapides à appliquer. Leur simplicité et leur vitesse font que la définition de nouveaux filtres pour différentes applications est un thème de recherche très actif.
  • Le criblage peut aussi s’orienter sur la similarité des composés étudiés à d’autres possédant les propriétés recherchées. La similarité entre composés est d’ailleurs un des critères utilisés pour déterminer le caractère innovant d’une nouvelle molécule dans la cadre d’une demande de brevet. La question principale dans ce cas est de définir les critères de similarités : la présence de sous-graphes commun, de groupements fonctionnels, leur répartition, les champs moléculaires, etc. La définition de critères permettant de mesurer la similarité de composés est l’objet de la conception de descripteurs moléculaires.
  • Une catégorie de descripteurs, appelés pharmacophores topologiques mime le raisonnement du chimiste. Les pharmacophores désignent des fonctions chimiques qui sont regroupées sur leur potentiel supposé à participer à des interactions intermoléculaires (par exemple, donneur/accepteur de liaison hydrogène). Dans ce cas précis, l’agencement des pharmacophores dans le graphe moléculaire est utilisé.
  • En utilisant des méthodes statistiques, des approches d’apprentissage et des algorithmes de fouille de données, il est possible de conceptualiser les relations de similarité entre composés au sein d’une chimiothèque afin de créer des modèles SAR/QSAR. Ceux-ci sont des modèles mathématiques qui permettent de prédire des propriétés qualitatives ou quantitatives de nouveaux composés, sur la base d’observations réalisées sur la chimiothèque. Il s’agit de modèles prédictifs pour des propriétés pharmacodynamiques (activités biologiques) et pharmacocinétiques (ADME/Tox).
  • Méthodes basées sur la structure des cibles :
  • La plus connue et la plus développée est l’arrimage ("docking"). La structure de la protéine cible étant connue, la conformation et la position du ligand sont optimisés pour minimiser l’énergie d’interaction entre protéine et ligand. Pour gagner du temps, la cavité est le plus souvent considérée comme rigide ou semi-rigide et l’approche des champs de force est remplacée par une heuristique plus simple à calculer. Dans ce cas, cette technique est assez éloignée d’un modèle physique des interactions, mais devient assez équivalente à une recherche de composés ayant un même mode d’interaction avec la protéine.
  • Des pharmacophores 3D sont aussi utilisés. Ils consistent à utiliser l’agencement des pharmacophores dans l’espace et à considérer leur adéquation avec un modèle préalablement établi. Ce modèle est fréquemment basé sur les interactions observées entre une cible et plusieurs ligands par différentes méthodes expérimentales (rayons X, RMN, mutagénèse dirigée).
  • Support au criblage réel. :
  • Les évolutions dans les techniques de miniaturisation, d’automatisation ont permis une augmentation du débit des criblages réels. Mais, que ce soit pour des raisons financières ou de temps, il est inenvisageable de cribler l’ensemble des produits disponibles sur l’ensemble des cibles biologiques ou biochimiques existantes. L’analyse de la diversité des chimiothèques, la sélection des produits à cribler sur des critères de diversité ou des critères de propriétés chimiques ou biologiques nécessitent des méthodes Chémoinformatiques qui sont encore à développer ou améliorer.

Modélisation QSPR des propriétés de molécules, de réactions et de matériaux

Bien que la majorité de modélisation QSAR concerne des problématiques à visée thérapeutique, les méthodes de la Chémoinformatique peuvent être appliquées pour toute la chimie. Cet axe de recherche concerne le développement des modèles prédictifs de propriétés "stratégiques" pour tous projets chimiques : la solubilité, la lipophilie, les points d’ébullition et de fusion, la viscosité, etc. Certains problèmes particulièrement difficiles demandent des nombreuses innovations techniques ; par exemple, la modélisation de mélanges non-additifs et de spectres. Les participants de ce GDR ont déjà établis de nombreuses interactions avec des équipes expérimentales travaillant sur le design de nouveaux solvants "verts" (liquides ioniques), de complexants et extractants des radionucléides, et de systèmes supramoléculaires.

Développement de méthodes, d’algorithmes et d’outils.

Ce thème concerne le développement de nouvelles approches en Chémoinformatique ainsi que des outils logiciels correspondants. Il s’agit de nouveaux descripteurs moléculaires, les techniques de comparaison de molécules entre elles - noyaux ("kernels") et métriques ; de méthodes d’apprentissage machine, de méta-méthodes (modèles multiples, domaine d’applicabilité, transfert inductif de connaissances). Certains participants du GDR Chémoinformatique ont mis en œuvre leurs concepts dans des logiciels aujourd’hui utilisés et reconnus sur la scène internationale.

Bases de données

Le développement des bases de données (BDs) représentera une activité importante du GDR. Nous envisageons de mener les projets suivants.

1). En collaboration avec le GIS " Chimiothèque Nationale " (CN), nous allons travailler sur l’indexation de la base de données CN en utilisant les modèles QSAR pour la solubilité aqueuse, la lipophilie, la toxicité, ainsi que certaines activités biologiques. Un autre projet concernera l’analyse de l’espace chimique de la CN en utilisant différentes approches basées sur des graphes moléculaires ("scaffolds tree" et autres), des descripteurs et des noyaux ("kernels").

2). Actuellement, quelques BDs sont développées par des participants du GDR :

Base de données Correspondant Unité, Ville Description
Bioinfo D. Rognan UMR 7200, Strasbourg Ligands drug-like commercialement disponibles
sc-PDB D. Rognan UMR 7200, Strasbourg Sites de liaisons droguables de la Protein Data Bank
SBi D. Rognan UMR 7200, Strasbourg Châssis moléculaires de molécules commercialement disponibles
PPI X. Morelli FRE3083 CNRS, Marseille Interactions protéine- protéine
ScreenDB A. Varnek UMR 7177, Strasbourg Molécules "drug-like"
SXD A. Varnek UMR 7177, Strasbourg Extraction des métaux par des molécules organiques
pKBHX J.-Y. Le Questel UMR 6230, Nantes Basicité de liaisons H de composés organiques
PPIFocusDB B. Villoutreix UMRS 973 INSERM, Paris Collection enrichie en molécules inhibitrices des interactions protéine-protéine

Nous envisageons de développer une interface INTERNET qui facilitera l’accès des utilisateurs à ces BDs.

3). Un travail de réflexion sera mené sur l’achat et la mutualisation de certaines BDs commerciales importantes pour la communauté.