Genentech 使用 AWS 將臨床生物標記資料的價值最大化
2022 年
提及轉譯研究時,多數人會想到實驗室到臨床轉譯,這些洞察始於實驗室,最終作為新的療法或治療策略進入臨床。但在生命科學的大數據時代中,研究人員也可以思考「反向轉譯」,臨床中所收集的資訊會在實驗室中產生新發現。但是,需要安全、可存取、穩定和可搜尋的臨床資料才能夠獲取這些洞察,這通常說比做容易。
Genentech 開發科學資訊學資料管理暨工程主管 Christina Lu 表示:「您必須具備正確且優質的資料。如果將一堆不需要的資料放入複雜的分析演算法中,產物仍然會是不需要的資料。」
Genentech 為 Roche 集團成員之一,是業界領導的生物科技和製藥公司。其從多年的臨床試驗和研究中積累了大量的真實世界生物資料。2017 年,Genentech 內部的開發科學部門實施一項策略,將該資料最佳化以利進行研發,旨在回應諸如「我們的下一個藥物標靶是什麼?」,以及「已完成臨床試驗中的資料如何改善未來的試驗設計?」等重要問題。 這項策略包含在 AWS 平台上建立資料生態系統,以將資料回溯處理至可搜尋的儲存庫中,並提供工具和程序,以便未來進行資料管理。
「過去需要數週時間來進行臨床資料分析,現在研究人員只需要數小時就能完成。採用這種方式,我們能夠考慮每個資料點,以便適時地為相應的患者提供正確的藥物。」
Christina Lu
Genentech 開發科學資訊學資料管理暨工程主管
資料管理創造臨床洞察
Lu 表示:「我們正處於臨床研究的轉折點。現在,如果沒有備妥資料,實際上已失去開發新治療方法和改善患者照護的重要機會。」在 Genentech 的案例中,許多機會都集中於分析生物標記 (人體中的可測量分子,與特定生物狀態相關) 上,以利了解疾病進程和分子機制。
「備妥資料」的目標是為滿足 FAIR 標準:可查找、可存取、可互操作和可重複使用。據 2018 年報告估計,因使用非 FAIR 研究資料,單是歐盟經濟體每年就損失 102 億歐元。但事實上,資料科學家在可以善用其專業知識建置模型或執行其他專業任務時,卻花費多達 80% 的時間手動收集、清理和組織資料。
Lu 表示:「傳統資料管理成本高昂、耗時且無法擴展。」為了節省成本並實現可擴展性和效率,Genentech 將現有的生物標記資料從其委託研究組織 (CRO) 網路整合並移轉至物件儲存服務-Amazon Simple Storage Service (Amazon S3) 上管理完善的集中式儲存庫中。這使 Genentech 科學家和外部研究人員能以簡化的方式存取更大量資訊,這反過來又為可能揭示新基因治療或癌症藥物標靶的研究提升統計檢定力。
Lu 說道:「如果我們可以前瞻性地應用此類資料管理策略,就能實現更多可以影響人類健康的目標。」
在 AWS 上建立資料生態系統
Lu 表示:「我們在 AWS 上建立的生物標記資料儲存庫包含數 PB 的探索性生物標記資料,並提供科學家可以輕鬆尋找特定研究所需資料的介面。」
生物標記儲存庫儲存於 Amazon S3 上,而 Amazon Relational Database Service (Amazon RDS) 是一款受管的關聯式資料庫服務,其可處理關聯的中繼資料,並透過 Amazon Elasticsearch Service 啟用索引和快速搜尋功能。Genentech 使用 Amazon API Gateway 建立 API,根據需要為研究人員提供安全、特定研究的存取權。
Lu 表示:「由於這種簡化的架構,過去需要數週時間來進行臨床資料分析,現在研究人員只需要數小時就能完成。採用這種方式,我們能夠考慮每個資料點,以便適時地為相應的患者提供正確的藥物。」
進一步了解
關於 Genentech
Genentech 生物科技公司為 Roche 集團成員之一,致力針對嚴重和危及生命的疾病開發新療法。
AWS 的優勢
- 安全儲存 PB 級的探索性生物標記資料
- 可透過回溯及前瞻性方式查找、存取、互操作和重複使用 (FAIR) 管理的資料
使用的 AWS 服務
Amazon RDS
Amazon Relational Database Service (Amazon RDS) 讓使用者能夠在雲端中輕鬆設定、操作和擴展關聯式資料庫。
Amazon S3
Amazon Simple Storage Service (Amazon S3) 物件儲存服務提供領先業界的可擴展性、資料可用性、安全性及效能。
Amazon API Gateway
Amazon API Gateway 是一種全受管的服務,可讓開發人員輕鬆地建立、發佈、維護、監控和保護任何規模的 API。
AWS Lambda
AWS Lambda 是一項運算服務,讓您建立可快速回應新資訊和事件的應用程式。
Amazon EC2
Amazon Elastic Compute Cloud (Amazon EC2) 提供最廣泛、最深入的運算平台,擁有超過 500 個執行個體,可選擇最新處理器、儲存、聯網、作業系統和購買模型,以協助您最有效地滿足工作負載需求。
Amazon Elasticsearch Service
Amazon Elasticsearch Service 是全受管服務,可讓您輕鬆大規模部署、保護及以經濟實惠的方式執行 Elasticsearch。
入門
各行各業、各種規模的公司每天都在使用 AWS 來轉型業務。聯絡我們的專家,立即開始 AWS 雲端之旅。