AlphaFold génère une représentation 3D de l’univers des protéines

AlphaFold prédit la structure de presque toutes les protéines cataloguées connues de la science. Crédit : Karen Arnott/EMBL-EBIA

Des prédictions basées sur l’IA des structures tridimensionnelles de presque toutes les protéines cataloguées connues de la science ont été faites par DeepMind et l’Institut européen de bioinformatique de l’EMBL (EMBL-EBI). Le catalogue est librement et ouvertement accessible à la communauté scientifique, via la base de données sur la structure des protéines AlphaFold.

Les deux organisations espèrent que la vaste base de données continuera à faire progresser notre compréhension de la biologie et à aider d’innombrables scientifiques dans leur travail pour relever les défis mondiaux.

Cette étape importante marque l’expansion de la base de données d’environ 200 fois. Il est passé de près d’un million de structures protéiques à plus de 200 millions et comprend désormais presque tous les organismes sur Terre dont le génome a été séquencé. Les structures prédites pour une grande variété d’espèces, y compris les plantes, les bactéries, les animaux et d’autres organismes, sont désormais incluses dans la base de données complète. Cela ouvre de nouvelles voies de recherche dans les sciences de la vie qui auront un impact sur les défis mondiaux, notamment la durabilité, l’insécurité alimentaire et les maladies négligées.

Désormais, une structure prédite sera disponible pour pratiquement toutes les séquences de protéines dans la base de données de protéines UniProt. Cette version ouvrira également de nouvelles opportunités de recherche, notamment en soutenant la bioinformatique et l’informatique en permettant aux scientifiques de découvrir des modèles et des tendances potentiels dans la base de données.

“AlphaFold offre désormais une vue 3D de l’univers des protéines”, a déclaré Edith Heard, directrice générale de l’EMBL. « La popularité et la croissance de la base de données AlphaFold témoignent du succès du partenariat DeepMind et EMBL. Cela nous donne un aperçu de la puissance de la science multidisciplinaire.

“Nous sommes étonnés de la vitesse à laquelle AlphaFold est déjà devenu un outil essentiel pour des centaines de milliers de scientifiques dans les laboratoires et les universités du monde entier”, a déclaré Demis Hassabis, fondateur et PDG de DeepMind. « De la lutte contre les maladies à la lutte contre la pollution plastique, AlphaFold a déjà eu un impact incroyable sur certains de nos plus grands défis mondiaux. Nous espérons que cette base de données complète aidera d’innombrables scientifiques dans leur travail important et ouvrira de toutes nouvelles voies à la découverte scientifique.

Q8W3K0

Q8W3K0 : Une protéine potentiellement résistante aux maladies des plantes. Crédit : AlphaFold

Un outil indispensable pour les scientifiques

DeepMind et EMBL-EBI ont lancé la base de données AlphaFold en juillet 2021. À cette époque, il contenait plus de 350 000 prédictions de la structure des protéines, y compris l’ensemble du protéome humain. Les mises à jour ultérieures ont vu l’ajout d’UniProtKB/SwissProt et de 27 nouveaux protéomes, dont 17 représentent des maladies tropicales négligées qui continuent de détruire la vie de plus d’un milliard de personnes dans le monde.

Plus de 1 000 articles scientifiques ont cité la base de données et plus de 500 000 chercheurs de plus de 190 pays ont accédé à la base de données AlphaFold pour afficher plus de deux millions de structures en un peu plus d’un an.

L’équipe a également vu des chercheurs s’appuyer sur AlphaFold pour créer et personnaliser des outils tels que Foldseek et Dali qui permettent aux utilisateurs de rechercher des éléments similaires à une protéine particulière. D’autres ont adopté les idées fondamentales d’apprentissage automatique derrière AlphaFold et sont l’épine dorsale d’une gamme de nouveaux algorithmes dans cet espace, ou les appliquent à des domaines tels que la prédiction de la structure de l’ARN ou le développement de nouveaux modèles pour la conception de protéines.

Impact et avenir d’AlphaFold et de la base de données

AlphaFold a également montré son impact dans des domaines tels que l’amélioration de notre capacité à lutter contre la pollution plastique, la compréhension de la maladie de Parkinson, l’amélioration de la santé des abeilles, la compréhension de la formation de la glace, la lutte contre les maladies négligées telles que la maladie de Chagas et la leishmaniose, et l’examen de l’évolution humaine.

“Nous avons lancé AlphaFold dans l’espoir que d’autres équipes pourraient apprendre et s’appuyer sur les progrès que nous avons réalisés, et c’était excitant de voir que cela se produisait si rapidement. De nombreuses autres organisations de recherche en IA sont maintenant entrées sur le terrain, s’appuyant sur les progrès d’AlphaFold pour créer de nouvelles percées. Il s’agit véritablement d’une nouvelle ère en biologie structurale, et les méthodes basées sur l’IA feront des progrès incroyables », a déclaré John Jumper, chercheur scientifique et responsable d’AlphaFold chez DeepMind.

« AlphaFold a envoyé des ondulations à travers la biologie moléculaire. Au cours de la seule année écoulée, il y a eu plus d’un millier d’articles scientifiques sur une grande variété de sujets de recherche utilisant des structures AlphaFold ; je n’ai jamais rien vu de tel », a déclaré Sameer Velankar, chef d’équipe. à la banque de données sur les protéines de l’EMBL-EBI en Europe “Et ce n’est que l’impact d’un million de prédictions ; imaginez l’impact d’avoir plus de 200 millions de prédictions de la structure des protéines librement accessibles dans la base de données AlphaFold.”

DeepMind et EMBL-EBI continueront à mettre à jour périodiquement la base de données, dans le but d’améliorer les caractéristiques et fonctionnalités en réponse aux commentaires des utilisateurs. L’accès aux structures reste entièrement ouvert, sous une licence CC-BY 4.0, et les téléchargements groupés sont disponibles via les ensembles de données publics Google Cloud.

Leave a Reply

Your email address will not be published.