Une nouvelle étude permet de découvrir neuf nouveaux coronavirus grâce à l’infonuagique
Un alpiniste passionné et ancien post-doctorant de l’UBC (Université de la Colombie-Britannique) a dirigé une équipe de recherche internationale afin de réanalyser toutes les données publiques de séquençage de l’ARN, découvrant ainsi près de dix fois plus de virus à ARN que ce qui était connu auparavant, y compris plusieurs nouvelles espèces de coronavirus dans certains endroits inattendus.
Cette base de données planétaire des virus à ARN peut aider à identifier rapidement les virus qui se propagent chez l’humain, ainsi que les virus qui touchent le bétail, les cultures et les espèces menacées.
Artem Babaian est à l’origine de la collaboration entourant le projet Serrratus, qui a publié les résultats étonnants de ses recherches dans le journal Nature-021-04332-2) cette semaine.
En travaillant avec le Cloud Innovation Centre (CIC, ou Centre d’innovation infonuagique), une collaboration public/privé entre l’UBC et Amazon Web Services (AWS), le projet Serratus a pu construire un super ordinateur « ridicule » sur AWS, équivalent en puissance à 22 500 CPU, a déclaré Babaian.
Il a scruté 20 millions de gigaoctets de données de séquences génétiques accessibles au public et provenant de 5,7 millions d’échantillons biologiques du monde entier, à la recherche d’un gène spécifique indiquant la présence d’un virus à ARN. Les échantillons ont été recueillis et partagés librement par la communauté mondiale des chercheurs depuis 13 ans et comprennent tout, des carottes de glace aux excréments d’animaux.
[Carte des données mondiales de séquençage]
Serratus a découvert 132 000 virus à ARN (alors qu’on n’en connaissait que 15 000 auparavant) et neuf nouvelles espèces de coronavirus. Babaian estime que sans le CIC et le Nuage AWS, il faudrait à un superordinateur traditionnel bien plus d’un an et des centaines de milliers de dollars pour effectuer les 2 000 années de temps CPU nécessaires à cette analyse. Serratus l’a accomplie en 11 jours pour 24 000 dollars.
« Nous entrons dans une nouvelle ère de compréhension de la diversité génétique et spatiale des virus dans la nature, et de la manière dont une grande variété d’animaux interagit avec ces virus. L’espoir est que nous ne soyons pas pris au dépourvu si un virus comme le SRAS-COV-2 réapparaît. Ces virus peuvent être reconnus plus facilement et leurs réservoirs naturels peuvent être trouvés plus rapidement. Le véritable objectif est que ces
infections soient reconnues si tôt qu’elles ne deviennent jamais des pandémies », a déclaré Artem Babaian, titulaire d’un doctorat en génétique médicale de l’Université de la Colombie-Britannique et actuellement titulaire d’une bourse du programme Banting de l’Université de Cambridge.
« Si un patient présente une fièvre d’origine inconnue, une fois le sang séquencé, il est maintenant possible de relier ce virus inconnu chez l’humain à une base de données beaucoup plus importante de virus existants. Si un patient, par exemple, présente une infection virale d’origine inconnue à St. Louis, vous pouvez maintenant effectuer une recherche dans la base de données en deux minutes environ, et relier ce virus à, par exemple, un chameau d’Afrique subsaharienne échantillonné en 2012. »
Âgé de 32 ans, Artem Babaian menait des recherches génétiques sur le cancer avec BC Cancer jusqu’à ce que la pandémie de COVID-19 frappe et qu’il change de vitesse. Le travail, qui, selon le discret Babaian, n’était qu’un « projet secondaire amusant », a commencé le 3 mars 2020 lorsque lui et son ami partenaire d’escalade, Jeff Taylor, étudiant en génie à l’UBC, ont esquissé l’idée « au dos d’une serviette de table », a déclaré Artem Babaian.
« J’aurais dû garder cette serviette de table », a-t-il ajouté.
Peu de temps après, Artem Babaian a demandé l’aide du CIC. Serratus, nommé d’après le mont Serratus de la chaîne Tantalus en Colombie-Britannique, que Taylor et lui ont vu lors d’une ascension en 2020, était né. M. Babaian se souvient qu’il était assis sur la chaise d’allaitement de son épouse lorsque les premiers résultats ont commencé à apparaître sur son ordinateur portable, indiquant que Serratus non seulement fonctionnait, mais produisait des données à une vitesse presque incompréhensible.
« C’était probablement la période scientifique la plus excitante de ma vie », a-t-il déclaré. « Il y a deux types d’amusement. Le type 1 est celui où l’on sourit et où l’on s’amuse. Le type 2 est celui où l’on est malheureux en le faisant, mais où le souvenir est intense, comme l’escalade. À bien des égards, Serratus est un plaisir de type 2. Vous devez juste croire que
ça va marcher. »
« Le CIC a vraiment été là pour débloquer les portes pour nous », a-t-il ajouté. « Nous avions une idée et ils ont fait appel à des experts de leurs réseaux pour la concrétiser. Désormais, la communauté mondiale peut bénéficier de toute cette recherche jusqu’alors inexploitée. »
« Artem nous a approchés avec une vision innovante. La puissance du CIC réside dans le fait que nous jumelons nos équipes internes d’innovation et de technologie de l’UBC avec celles d’AWS », a déclaré Marianne Schroeder, directrice du CIC de l’UBC. « C’était un grand privilège pour nous de soutenir la réalisation de cette vision. Aider à trouver une solution technologique à des problèmes complexes, c’est ce que nous faisons. »
Le CIC de l’UBC, qui a été lancé juste avant la pandémie en janvier 2020, soutient les défis axés sur la santé et le bien-être des communautés. À ce jour, l’équipe a publié plus de 20 projets, dont des guides d’architecture de référence et de déploiement, tous librement accessibles.
« Bien que le nuage public tel que nous le connaissons existe depuis 15 ans, les dernières années d’innovation chez AWS ont vraiment rendu la recherche génomique possible d’une nouvelle manière », a déclaré Coral Kennett, qui dirige le CIC pour AWS. « Nous avons pu donner à Artem l’accès à la puissance de calcul pour quelques sous par requête. Nous encourageons vivement la communauté des chercheurs à soumettre leurs projets et leurs idées au CIC afin que davantage d’innovations voient le jour au profit de la communauté. »