BLDB : Beta-Lactamase DataBase

Nous avons développé la base de données Beta-Lactamase DataBase (BLDB) afin de pallier au manque d’information structurée et facilement accessible dans le domaine de la résistance aux antibiotiques, et plus particulièrement au niveau des β-lactamases.

La caractéristique principale de cette base de données est la présence dans un seul endroit de plusieurs volets essentiels pour une meilleure compréhension de la relation structure-activité de cette famille d’enzymes. Cette base de données contient une liste complète et à jour de toutes les β-lactamases (séquences et structures tri-dimensionnelles) décrites dans la littérature, ainsi qu’un certain nombre de mutants et de profils d’hydrolyse des antibiotiques de type β-lactame. Une fonctionnalité de recherche de type BLAST est également présente. La BLDB est actuellement utilisée de manière quotidienne par les microbiologistes de plusieurs centres de référence et de surveillance de la résistance aux antibiotiques à travers le monde dans le travail d’identification de nouveaux variants.

Le contenu de cette base de données représente un élément très important dans notre travail de design d’inhibiteurs efficaces de β-lactamases. Actuellement la BLDB contient plus de 8000 enzymes uniques appartenant aux 4 classes de β-lactamases, ainsi que plus de 1500 structures cristallographiques de β-lactamases qui sont actuellement disponibles dans la Protein Data Bank (PDB). BLDB contient également a un nombre restreint de mutants synthétiques et de profiles d’hydrolyse. Des nouvelles structures sont rajoutés de manière semi-automatique chaque semaine, après chaque mise à jour de la PDB. Des nouvelles enzymes sont rajoutées après chaque mise à jour de la Bacterial Antimicrobial Resistance Reference Gene Database, maintenue par NCBI. Une veille bibliographique constante permet également d’identifier les nouvelles β-lactamases et les mutants synthétiques décrits dans la littérature, ainsi que leur profiles d’hydrolyse.

MDPOW : Calculation of water/solvent partition coefficients with Gromacs

Le logiciel MDPOW est développé en Python, en collaboration avec Oliver Beckstein (Arizona State University, Etats-Unis), et permet la mise en place et l’analyse des simulations de dynamique moléculaire : une simulation à l’équilibre (15 ns) suivie de 21 simulations de 5 ns chacune pour la perturbation de l’énergie libre. Les simulations sont réalisées avec Gromacs dans le champ de force OPLS-AA. La version initiale permettait la prédiction d’énergie libre d’hydratation (ΔGhyd). Ultérieurement nous avons implémenté et validé la prédiction de coefficients de partition, octanol/eau (logKOW) dans un premier temps, puis cyclohexane/eau (logKCW). Récemment nous avons amélioré la reproductibilité des prédictions en implémentant un protocole NPT en lieu de NVT.

Même si elle demande de ressources de calcul relativement importantes, cette approche permet de réaliser des prédictions plus précises que les méthodes empiriques disponibles actuellement.

Actes de congrès :

  • Kenney, I. ; Iorga, B. I. ; Beckstein, O. Towards an automated pipeline for solvation free energy calculations, Annual Meeting of the APS Four Corners Section, Tempe, AZ, United States, Tempe, AZ, United States, 2015.

MOL2FF : Paramétrisation automatisée des ligands dans le champ de force OPLS-AA

Les méthodes actuelles permettant la génération de topologies pour le champ de force OPLS-AA adoptent toutes une approche similaire au champ de force AMBER, avec des charges atomiques partielles différentes pour chaque molécule qui doivent être calculées au cas par cas. Cependant, OPLS-AA est beaucoup plus riche que les autres champs de force (675 types d’atomes par rapport à environ 47 pour AMBER) et cette approche conduit à des topologies incorrectes.

Nous avons démarré, en collaboration avec Oliver Beckstein (Arizona State University, Etats-Unis), le développement d’une approche différente pour la paramétrisation automatisée des ligands, basée sur la reconnaissance de la fonction chimique, ce qui permet l’attribution correcte des types d’atomes OPLS-AA dans tous les cas. Les topologies ainsi générées servent à alimenter le dépôt en ligne Ligandbook que nous avons mis en place récemment.

Le logiciel de paramétrisation MOL2FF est écrit en TCL, tandis que l’information chimique est stockée en format SMARTS et utilisée pour des recherches par sous-structure utilisant le logiciel CACTVS. MOL2FF est en cours de développement, mais une version expérimentale est déjà utilisée depuis plusieurs années au sein de l’équipe. Elle a permis notamment la paramétrisation des ligands utilisés dans les compétitions de prédiction SAMPL3 (2011), SAMPL4 (2013) et SAMPL5 (2015), mais aussi une grande majorité des composés présents dans le dépôt en ligne Ligandbook. La version actuelle du logiciel permet la paramétrisation de toutes les fonctions chimiques présentes dans le champ de force OPLS-AA implémenté dans Gromacs, ainsi que quelques hétérocycles et fonctions chimiques supplémentaires qui ont été paramétrisés dans nos travaux récents.

De plus, cette méthode permet de valider la paramétrisation dans le champ de force OPLS-AA des composés pour lesquels les valeurs de ΔGhyd et logKSW sont connues. Des topologies OPLS-AA de bonne qualité sont essentielles pour les études de « drug design » utilisant la dynamique moléculaire. En collaboration avec Oliver Beckstein (Arizona State University), nous avons développé un protocole qui permet de tester la qualité des topologies OPLS-AA par dynamique moléculaire (calculs d’énergie libre).

Ligandbook : Topologies et paramètres de champ de force des ligands

Le dépôt en ligne pour les topologies et les paramètres de champ de force des ligands Ligandbook est un outil que nous avons développé permettant le partage de l’information au sein de la communauté de modélisateurs. Dans ce site nous avons implémenté des fonctionnalités avancées (recherche par sous-structure, traitement automatique des structures déposées, liens vers des bases de données e.g. PDB, PubChem, Common Chemistry, etc.) qui rendront l’utilisation beaucoup plus facile.

Actuellement ce dépôt contient plus de 2 900 structures, la grande majorité des ligands issus de la Protein Data Bank (PDB) et paramétrisées avec notre logiciel MOL2FF, et nous envisageons de multiplier par 10 le nombre de structures dans les prochaines années. Nous espérons que Ligandbook deviendra le site de référence en modélisation moléculaire pour le dépôt et le téléchargement des topologies et des paramètres de champ de force des ligands, des éléments indispensables pour l’étude par dynamique moléculaire des complexes protéine-ligand.

Ligandbook est écrit en PHP dans le contexte fourni par le logiciel Symfony2. Les annotations de type objet sont stockées dans une base de données relationnelle MySQL, tandis que les fichiers déposés sont stockés directement sur le disque pour une meilleure performance. Le code PHP est interfacé avec des scripts TCL exécutes en interne par le logiciel CACTVS pour la partie chémoinformatique. Les structures chimiques pour les recherches par structure exacte ou par sous-structure dont dessinés à l’aide du CACTVS Sketcher. La recherche texte utilise le moteur Elasticsearch. Des indexes sont créés en temps réel pour une grande majorité des champs (e.g. nom IUPAC, synonymes, formule chimique, masse molaire, charge, nombre d’atomes, SMILES, PubChem CID, PDB ID du ligand, CAS RN). L’indexation de ces champs permet un filtrage et une recherche rapide dans Ligandbook.

Articles :

  • Domański, J. ; Beckstein, O. ; Iorga, B. I., Ligandbook – an online repository for small and drug-like molecule force field parameters. Bioinformatics 2017, 33, 1747-1749. [Version en ligne] (Open Access).

Actes de congrès :

  • Domański, J. ; Beckstein, O. ; Iorga, B. I. Ligandbook – an online repository for small and drug-like molecule force field parameters, 244th ACS National Meeting & Exposition Abstracts of Papers, Philadelphia, PA, United States, August 19-23 ; American Chemical Society : Philadelphia, PA, United States, 2012 ; pp COMP-227.