Témoignages de clients / Sciences de la vie

2022
Logo de Vertex

Vertex Pharmaceuticals réduit les coûts de stockage et de traitement des données cryo-EM de 50 % grâce à AWS

Découvrez comment Vertex Pharmaceuticals accélère la découverte de médicaments en exécutant ses flux de travail cryo-EM sur AWS.

Multiplication par 2

des performances

>50 %

de réduction des coûts

Plusieurs jours

gagnés sur le temps de traitement des données

3 mois

pour finaliser le prototype d'une nouvelle architecture

Capacité

de mise à l'échelle et productivité améliorées

Présentation

Vertex Pharmaceuticals (Vertex) est une entreprise biotechnologique mondiale qui investit dans l'innovation scientifique afin de créer des médicaments transformateurs destinés aux personnes atteintes de maladies graves. Vertex utilise la microscopie électronique cryogénique (cryo-EM) pour générer des images sophistiquées et des informations sur la structure 3D d'une protéine et sur la structure de cibles de médicaments potentielles. Grâce à ce processus, les chimistes de l'entreprise peuvent concevoir de meilleures molécules médicamenteuses en optimisant leur structure pour qu'elles se lient à leurs cibles.
 
Cependant, les flux de travail cryo-EM nécessitent une quantité énorme de ressources de calcul et de stockage. Les scientifiques qui effectuent des analyses sur plusieurs sites de recherche génèrent des pétaoctets de données. Vertex avait besoin de faire en sorte que son infrastructure puisse être mise à l'échelle pour répondre à ses besoins croissants tout en fournissant une puissance de traitement adéquate pour accélérer la recherche.
 
Vertex a migré son stockage et son traitement de données vers Amazon Web Services (AWS). L'entreprise a utilisé plusieurs services AWS, notamment Amazon Elastic Compute Cloud (Amazon EC2), qui fournit une capacité de calcul sécurisée et redimensionnable pour prendre en charge pratiquement toutes les charges de travail. Vertex a amélioré les performances de ses charges de travail de calcul haute performance (HPC), a accéléré les analyses de données et a donné à son système une capacité de mise à l'échelle tout en réduisant les coûts globaux de stockage et de calcul de plus de 50 %.
Des scientifiques travaillant dans un laboratoire

Opportunité | Accélération des performances de traitement des flux de travail cryo-EM pour générer des informations plus rapidement 

Vertex utilise la cryo-EM pour découvrir des traitements contre des maladies en analysant la structure moléculaire de cibles médicamenteuses potentielles. « La cryo-EM nous permet d'obtenir une résolution suffisante pour mieux comprendre les structures des protéines que nous n'étions pas en mesure d'étudier il y a seulement quelques années », explique David Posson, chercheur principal chez Vertex Pharmaceuticals.
 
Cependant, si cette technologie avancée a ouvert la voie à de nouvelles découvertes et à de nouveaux traitements, les besoins en capacité de stockage et de calcul ont également augmenté. « L'utilisation d'un microscope pour la cryo-EM génère des téraoctets de données chaque jour », explique Roberto Iturralde, directeur principal du développement logiciel chez Vertex Pharmaceuticals. « Il est courant de générer 1 Po de données en un an. » De plus, les scientifiques ont besoin d'obtenir rapidement des informations. L'infrastructure sur site de Vertex pour exécuter ses charges de travail cryo-EM avait du mal à suivre le rythme de ses demandes croissantes en matière de calcul et de stockage.
 
Vertex devait d'abord transférer toutes les données des microscopes situés dans des installations externes vers son centre de données à l'aide de disques durs, ce qui prenait des semaines. Lorsque de nouvelles données arrivaient, les clusters de HPC sur site de l'entreprise n'étaient pas en mesure de gérer efficacement les pics d'activité. Ils ne pouvaient pas non plus réduire leur échelle pendant les périodes de faible activité.
 
Le stockage de données sur le long terme présentait un autre défi. Après quelques semaines, les scientifiques accédaient rarement aux données les plus anciennes des microscopes. Cependant, l'environnement sur site de Vertex n'était pas optimisé pour réduire les coûts en fonction des modèles d'utilisation et d'accès. Le domaine évoluant rapidement, il devenait coûteux de suivre les mises à niveau continues du matériel, des logiciels, du réseau et de la sécurité nécessaires à la gestion de l'infrastructure cryo-EM sur site. Au début de l'année 2022, Vertex a réalisé qu'elle avait besoin d'une solution plus élastique offrant de meilleures performances.
 
Vertex utilisait déjà AWS depuis 2015 pour différentes charges de travail. Inspirée par les nouvelles fonctionnalités lancées lors de la conférence AWS re:Invent 2021, Vertex a repensé l'ensemble de sa charge de travail cryo-EM et l'a migrée vers AWS. L'entreprise a conçu un prototype de la nouvelle architecture en seulement 3 mois. « AWS possède l'ensemble de technologies natives cloud le plus vaste et le plus complet que nous souhaitons utiliser chez Vertex », déclare Roberto Iturralde. « Grâce à AWS, nous sommes rapidement passés à une nouvelle conception qui répondait mieux aux exigences changeantes de nos scientifiques. »
kr_quotemark

En travaillant sur AWS, nous pouvons consacrer plus de temps à réfléchir à des moyens d'innover. Nous pouvons faire preuve de créativité et tirer parti du cloud pour accélérer notre science. »

Roberto Iturralde
Directeur principal du développement logiciel, Vertex Pharmaceuticals

Solution | Réduction des coûts de stockage de données et accélération du traitement à l'aide d'AWS ParallelCluster 

En migrant vers AWS, Vertex a rapproché ses charges de travail des points d'arrivée des données dans Amazon Simple Storage Service (Amazon S3), un service de stockage d'objets offrant une capacité de mise à l'échelle, une disponibilité des données, une sécurité et des performances de pointe. Vertex utilise également Amazon FSx pour Lustre, un stockage partagé et entièrement géré, conçu sur l'un des systèmes de fichiers hautes performances les plus populaires au monde, afin de fournir aux scientifiques exactement la quantité de ressources de stockage dont ils ont besoin lors d'une analyse active.

Après le traitement, Vertex renvoie les données à Amazon S3. L'entreprise trie efficacement les données à l'aide des politiques d'Amazon S3 relatives au cycle de vie, des ensembles de règles qui définissent les actions qu'Amazon S3 applique à un groupe d'objets. « Grâce aux politiques d'Amazon S3 relatives au cycle de vie, nous pouvons répartir les données dans différents niveaux afin de réduire les coûts de stockage », explique Roberto Iturralde. L'entreprise peut également mettre à l'échelle son stockage de manière aisée, limitant ainsi les frais généraux du centre de données.

Pour gérer le calcul nécessaire au traitement des données, Vertex utilise AWS ParallelCluster, un outil de gestion de clusters open source qui facilite le déploiement et la gestion de clusters HPC élastiques sur AWS. Il mettra en service ou arrêtera les nœuds de HPC en fonction des exigences du logiciel d'analyse. « Une fois terminés, nous pourrons revenir à une facture presque nulle », explique Roberto Iturralde. « Nous n'avons pas à craindre que la rapidité de l'évolution scientifique ne surcharge nos ressources ou ne détourne notre attention vers la maintenance de l'infrastructure. »

En adaptant ses coûts de calcul aux demandes de charge de travail, Vertex a réduit ses coûts de 50 %. De plus, elle a atteint des performances deux fois supérieures à celles de son architecture précédente. Vertex a également supprimé les goulots d'étranglement auxquels son équipe de cryo-EM était confrontée dans l'environnement sur site lorsqu'elle partageait des ressources avec d'autres groupes, ce qu'elle faisait souvent. « Auparavant, il fallait plusieurs semaines pour analyser les données de cryo-EM, même lorsque personne d'autre n'utilisait de ressources », explique David Posson. « Nous pouvons désormais fournir des données de manière fiable en moins d'une semaine grâce à AWS. »

Vertex a ajouté la prise en charge native de l'authentification unique à l'aide d'Amazon Cognito, que les entreprises peuvent utiliser pour ajouter rapidement et facilement des fonctions d'inscription, de connexion et de contrôle d'accès aux applications web et mobiles. « L'utilisation d'Amazon Cognito nous offre l'assurance supplémentaire que seuls les employés concernés ont accès au logiciel », explique Roberto Iturralde. Vertex utilise également Application Load Balancer, qui équilibre la charge du trafic HTTP et HTTPS grâce à un routage de requêtes avancé destiné à la livraison d'applications modernes, pour sécuriser son réseau.

Sur AWS, Vertex a rendu ses processus efficaces, ils peuvent être mis à l'échelle et sont rentables tout en réduisant la maintenance manuelle. Et en développant sur AWS, l'entreprise a également accès aux ressources de calcul et GPU les plus récentes, sans avoir à attendre plusieurs mois comme c'est généralement le cas lors de l'achat du matériel du centre de données. Par exemple, Vertex exécute des instances Amazon EC2 G5, qui offrent une combinaison puissante de capacité CPU, de capacité de mémoire hôte et de capacité GPU. En exécutant des processus de cryo-EM dans le cloud, les scientifiques peuvent effectuer des analyses en temps quasi réel. Vertex optimise mieux les coûts importants liés à l'utilisation des microscopes et facilite les avancées scientifiques.

Résultat | Accélération du traitement des données pour accélérer la recherche à l'aide d'Amazon EC2 

Vertex a déjà réduit le temps nécessaire à la fourniture des résultats d'analyse et espère l'accélérer encore. « Grâce au traitement en temps réel, nous pouvons démarrer rapidement l'analyse dès que les données sortent du microscope », explique David Posson. « Nous pourrions peut-être réduire de moitié notre délai d'une semaine. »
 
Vertex prévoit également de continuer à rendre son infrastructure de HPC plus élastique et native cloud afin de réduire les coûts. « En travaillant sur AWS, nous pouvons consacrer plus de temps à réfléchir à des moyens d'innover, » explique Roberto Iturralde. « Nous pouvons faire preuve de créativité et tirer parti du cloud pour accélérer notre science. »

À propos de Vertex Pharmaceuticals

Vertex est une entreprise pharmaceutique dont le siège social se situe à Boston. Elle étudie des molécules complexes et recherche des traitements pour des maladies graves à l'aide des dernières technologies de microscopie dans le monde entier.

Services AWS utilisés

Amazon S3

Amazon Simple Storage Service (Amazon S3) est un service de stockage d'objets qui offre une capacité de mise à l'échelle, une disponibilité des données, une sécurité et des performances de pointe.

En savoir plus »

Amazon EC2

Amazon Elastic Compute Cloud (Amazon EC2) fournit une capacité de calcul sécurisée et redimensionnable pour pratiquement toutes les charges de travail.

En savoir plus »

AWS ParallelCluster

AWS ParallelCluster est un outil de gestion de clusters open source qui facilite le déploiement et la gestion de clusters de calcul haute performance (HPC) sur AWS.

En savoir plus »

Amazon FSx pour Lustre

Amazon FSx pour Lustre offre un stockage partagé entièrement géré avec la capacité de mise à l'échelle et les performances du célèbre système de fichiers Lustre.

En savoir plus »

Démarrer

Les organisations de toutes tailles et de tous secteurs transforment leur activité et exécutent leurs missions au quotidien à l'aide d'AWS. Contactez nos experts et démarrez votre transition vers AWS dès aujourd'hui.