L'IA scientifique de Google découvre en 48 heures ce que la science a mis 10 ans à prouver -

Comment un fragment d'ADN oublié est devenu une menace mondiale

D'un côté, une histoire classique de science patiente. De l'autre, une question venue de Silicon Valley : l'intelligence artificielle peut-elle vraiment générer de nouvelles idées biologiques, sans accès à des données confidentielles, et sans jamais mettre les pieds dans un laboratoire ?

Depuis plus d'une décennie, des microbiologistes cherchent à comprendre pourquoi certaines bactéries développent une résistance aux antibiotiques à une vitesse alarmante. La cause n'est pas uniquement liée aux mutations de leur propre ADN — elle tient surtout à de petits éléments génétiques mobiles capables de sauter d'une espèce à l'autre. Cette sorte de voie express génétique accélère considérablement la propagation de la résistance à l'échelle mondiale.

Des chercheurs de l'Imperial College de Londres, dirigés par José R. Penadés, ont concentré leurs travaux sur l'un de ces éléments : les cf-PICIs, des îlots génétiques qui s'installent à l'intérieur des bactéries. Ils ont observé comment ces structures profitent des virus bactériens — les bactériophages — pour se déplacer, mais le mécanisme précis restait longtemps obscur.

Au fil des expériences de plus en plus complexes, trois problèmes majeurs se sont dessinés :

les éléments génétiques concernés sont petits et difficiles à détecter ;
ils peuvent passer d'une espèce à l'autre, ce qui complique considérablement les tests ;
l'interaction entre bactéries et virus est extrêmement dynamique.

Progressivement, l'équipe a reconstitué un mécanisme entièrement nouveau. Les cf-PICIs s'avèrent capables de détourner la structure de certains bactériophages — notamment leurs queues — pour se faire transporter vers d'autres bactéries. Ce faisant, ils franchissent les barrières naturelles entre espèces et amplifient la diffusion des gènes de résistance.

Ces îlots génétiques exploitent les structures virales comme un réseau de taxis biologiques pour propager la résistance encore plus vite.

Confirmer cette idée a nécessité des années de travail : biologie structurale, manipulations génétiques, expériences de transmission, contrôles, puis encore des contrôles. Lorsque la hypothèse était enfin bouclée, elle n'avait été publiée nulle part — pas dans une revue, pas dans une base de données, pas en ligne. Elle n'existait que dans des notes internes, des présentations privées et la mémoire des chercheurs.

Ce que le Co-scientist de Google a accompli sans données confidentielles

C'est à ce moment précis que l'équipe a contacté Google Research pour tester un nouvel outil d'IA : Co-scientist. Contrairement à un simple chatbot qui répond à des questions, ce système est conçu pour générer lui-même des hypothèses scientifiques, les critiquer et les classer par ordre de pertinence.

Une machine à idées, pas un oracle

Co-scientist fonctionne grâce à plusieurs "agents" qui évaluent mutuellement leurs propositions. Le système ne consulte que la littérature scientifique publique : articles, revues, bases de données. Aucun journal de laboratoire, aucun brouillon d'article, aucun fichier confidentiel. Les chercheurs ont soumis à l'IA une question générale sur le rôle des éléments génétiques mobiles et leurs interactions avec les bactériophages dans la résistance aux antibiotiques.

En moins de 48 heures, Co-scientist a produit une série de mécanismes possibles. La première hypothèse ressemblait de façon frappante à ce que Penadés et son équipe venaient tout juste de mettre au point : les cf-PICIs utiliseraient les queues virales comme moyen de transport pour élargir leur portée d'hôtes.

L'IA avait décrit un mécanisme qui coïncidait presque exactement avec une hypothèse non publiée, validée en interne après dix ans de travaux en laboratoire.

Le laboratoire a réagi avec une certaine panique : Google avait-il accidentellement eu accès à des documents confidentiels ? Penadés a explicitement demandé d'où provenaient ces résultats. Google a confirmé que Co-scientist n'avait utilisé que des sources publiquement disponibles. Pas de serveurs internes, pas de fuite de données.

Détail intéressant : en plus de cette hypothèse principale quasi parfaite, Co-scientist a généré quatre autres scénarios plausibles. Certains d'entre eux sont désormais explorés comme de nouvelles pistes de recherche au sein du laboratoire — par exemple, des façons alternatives dont les structures virales pourraient emballer et libérer des îlots génétiques.

De la pile de littérature à l'hypothèse testable

Selon l'étude publiée ultérieurement dans Cell, Co-scientist ne se contente pas de reformuler des théories existantes. L'IA combine des observations fragmentaires issues de publications variées : observations isolées sur les queues de phages, schémas de transmission, îlots génétiques et gènes de résistance. À partir de ces éléments épars, le système construit un scénario qui n'avait jamais été décrit nulle part sous cette forme.

Pour les revues de littérature classiques, le contraste est saisissant :

Méthode	Temps investi	Résultat
Revue de littérature humaine	Semaines à mois	1 à 2 hypothèses principales, nombreuses pistes abandonnées
Formulation d'hypothèses assistée par IA	Heures à jours	Plusieurs scénarios structurés, avec argumentaire détaillé

L'être humain reste indispensable pour filtrer : quelle hypothèse est biologiquement cohérente, expérimentalement vérifiable, techniquement réalisable ? Mais le champ d'exploration change radicalement. Là où un chercheur commençait habituellement dans une seule impasse, l'IA dresse soudainement la carte de tout un quartier de routes possibles.

Ce que cela signifie pour la lutte contre la résistance aux antibiotiques

La résistance aux antibiotiques progresse depuis des années plus vite que l'émergence de nouveaux traitements et stratégies. Selon des analyses internationales publiées notamment dans The Lancet, les infections résistantes coûtent désormais la vie à plus d'un million de personnes par an — un chiffre estimé à 1,27 million de décès en 2019.

Toute accélération dans la génération d'idées devient donc précieuse. Des hypothèses qui auraient normalement nécessité cinq ans pour émerger peuvent désormais être formulées en quelques jours :

les équipes de recherche peuvent identifier plus tôt des scénarios risqués mais prometteurs ;
les financeurs voient plus rapidement quelles pistes ont le plus de chances d'avoir un impact ;
les stratégies cliniques peuvent s'appuyer plus tôt sur des découvertes fondamentales.

L'IA déplace le goulot d'étranglement dans la science : non plus de l'idée à l'hypothèse, mais de l'hypothèse à la preuve concrète.

Les phases longues subsistent toujours : modèles animaux, essais cliniques, réglementation, production. Ce qui change, c'est la vitesse à laquelle un domaine peut pivoter vers un nouveau modèle de pensée opérationnel. Dans le contexte de la résistance aux antibiotiques, où les bactéries elles-mêmes évoluent à toute allure, ce gain de temps compte double.

Un nouveau type de collaboration entre l'humain et l'algorithme

Personne au sein de l'équipe de Penadés ne prétend que Co-scientist remplace leur travail. L'IA ne connaît pas l'odeur des salles de culture, ne remarque pas une contamination inattendue sur une boîte de Pétri et ne ressent aucune frustration après une série d'expériences ratées. Elle apporte de la structure à la connaissance, pas de l'intuition.

La répartition des rôles se réinvente

Pourtant, la pratique quotidienne de la recherche se transforme dès lors qu'un système comme Co-scientist est disponible. Là où des doctorants passaient auparavant des semaines à éplucher la littérature pour simplement lister les mécanismes candidats, une IA peut fournir en un week-end une première carte de ce paysage.

La contribution humaine se déplace alors vers :

la formulation de questions précises et non triviales adressées à l'IA ;
la détection de contresens biologiques camouflés dans des textes plausibles ;
la conception d'expériences ingénieuses pour falsifier les idées de l'IA ;
le cadrage éthique et sociétal des implications.

La relation entre l'humain et l'IA devient ainsi moins hiérarchique. Le chercheur n'est plus un simple utilisateur, mais un co-architecte d'un processus de réflexion où la machine et l'humain font des propositions à tour de rôle et corrigent mutuellement leurs erreurs.

Risques, angles morts et ce qui peut mal tourner

Un tel système introduit aussi de nouvelles vulnérabilités. Une IA qui ne lit que la littérature publique hérite de tous les biais présents dans cette littérature. Les domaines peu publiés, ou ceux où les résultats négatifs sont étouffés, restent sous-représentés dans les hypothèses générées.

Des questions de sécurité surgissent également. Un modèle qui imagine rapidement des mécanismes biologiques fonctionnels pourrait, en parallèle de stratégies utiles contre la résistance, esquisser involontairement des voies vers des applications dangereuses. Cela exige des règles claires sur l'accès, la traçabilité des usages et la supervision par des comités indépendants.

Sans contre-pouvoir humain, une hypothèse d'IA convaincante mais erronée peut conduire des lignes de recherche entières dans une impasse.

Un autre risque réside dans la pensée de groupe à l'échelle numérique. Si de nombreux laboratoires utilisent la même IA, avec les mêmes données d'entraînement, ils peuvent tous commettre les mêmes erreurs de raisonnement sans s'en apercevoir. Les pistes de recherche alternatives situées en dehors de la littérature dominante risquent alors de disparaître encore davantage du radar. La diversité des modèles, des sources de données et des méthodes reste absolument cruciale.

Ce que Co-scientist révèle sur l'avenir de la science "augmentée"

L'affaire des cf-PICIs illustre avant tout une tendance de fond : la science évolue de l'analyse de données assistée par IA vers la génération d'idées assistée par IA. Là où les systèmes précédents se contentaient de repérer des schémas dans des ensembles de données existants, on voit désormais des modèles construire des modèles — des représentations mentales de la façon dont la nature pourrait fonctionner.

Pour les jeunes chercheurs, cela implique d'acquérir une nouvelle compétence : apprendre à "co-réfléchir" avec un algorithme. Évaluer une hypothèse non seulement sur le fond, mais aussi savoir la décortiquer — sur quels articles l'IA s'est-elle appuyée, quels concepts manquent, quelles suppositions se glissent dans le raisonnement ?

Les organismes de financement pourraient également utiliser ce type de système comme second avis. Non pas pour déléguer des décisions, mais pour soumettre des dossiers de financement à une machine à idées supplémentaire : quelles hypothèses complémentaires, quelles combinaisons inattendues de disciplines émergent ? Cela pourrait par exemple créer de nouveaux ponts entre l'immunologie et la microbiologie dans la recherche de solutions contre la résistance.

Enfin, la transparence devient primordiale. Une IA qui produit de nouvelles hypothèses biologiques doit pouvoir expliquer comment elle y parvient. Des méthodes telles que la journalisation des raisonnements, les références aux sources et les marges d'incertitude explicites deviennent aussi importantes que les valeurs p en statistique classique. C'est à cette seule condition que le dialogue scientifique reste vérifiable — même lorsqu'un modèle parvient en 48 heures à ce qu'un humain aurait mis dix ans à concevoir.

Author

Claire Laurent

Elle tient un blog chaleureux consacré à la vie à la campagne et à la décoration intérieure écologique. Elle y explique en détail comment prendre soin des plantes d'intérieur, aménager une terrasse, cultiver des herbes aromatiques et des légumes au jardin, et créer une décoration à partir de matériaux naturels.