Gilead 使用 AWS 上的機器學習加快企業搜尋工具的開發速度
2022
生物科技公司 Gilead Sciences Inc. (Gilead) 想要提高員工的生產力並簡化其藥物開發和製造 (PDM) 業務單位中的內部資料管理流程,如此就能夠迅速為患有危害生命疾病的病患推出更多治療方法。為了努力實踐此目標,Gilead 想要建置一種可擴展的企業搜尋工具,該工具使用人工智慧 (AI) 和機器學習 (ML) 來提供預測分析,並在一個集中位置尋找重要文件、知識和資料。為了使工具能夠在每次自然語言查詢中持續產生相關的結果,Gilead 需要一套解決方案,來組織來自高達九個企業系統的結構化和非結構化資料,以及來自知識庫的文件。
為了縮短其專案時程,Gilead 的 PDM 團隊選擇 Amazon Web Services (AWS),並採用 Amazon Kendra (這是一項採用 ML 技術的高度準確智慧搜尋服務)。在得到 AWS 的支援後,PDM 團隊用 9 個月的時間就完成資料湖的建置,之後,僅用 3 個月的時間就完成搜尋工具的建置,最終在其預估的 3 年時程內完成其專案。自從推出其企業搜尋工具後,PDM 的使用者就能夠大幅降低手動資料管理的任務數量,並將搜尋資訊所需的時間減少約 50%,進而推動研究、實驗和製藥方面的突破。
Amazon Kendra 是一個一站式 AI 解決方案,如果設定正確,它能夠跨越組織中的每個網域,同時易於實作。」
Jeremy Zhang
Gilead Sciences Inc. 資料科學與知識管理總監
從 Amazon Machine Learning Solutions Lab 中獲得支援
總部位於加州福斯特城的 Gilead 專門從事抗病毒技術和藥物的研究和開發,包括愛滋病毒和病毒性肝炎的潛在治療方法。在 2021 年四月,Gilead 製造業務單位中的資料科學團隊構思了 Morpheus,這是一款企業搜尋工具,使用 AI 和 ML 從大約 25 萬份文件和 1 TB 非結構化的資料中快速擷取相關資訊和洞察。在 PDM 內部成立的由資料科學家和工程師組成的專案團隊,致力於將此概念付諸實現,如此其研究人員和科學家就能夠從監管、合規、供應鏈和製造資料中獲得更深入的洞察,進而更快速地將能夠拯救生命的藥物提供給病患。
Morpheus 團隊面臨的艱鉅挑戰,即將來自許多企業系統的資料集結在一起,以便實施單一的 AI 和 ML 策略來尋找知識。Gilead 的資料科學和知識管理團隊的總監 Jeremy Zhang 表示:「我們意識到,透過設計和實作基礎設施,將大規模建置 AI 搜尋所需的資料、知識和資訊集結在一起,我們就有機會在 Gilead 的知識 AI 領域進行創新。」
為了開發企業搜尋工具,Morpheus 專案小組聘請 Amazon Machine Learning Solutions Lab,該實驗室將組織團隊與 ML 專家配對,以協助識別和建置 ML 解決方案,來處理對組織而言投資報酬率最高的 ML 機會。透過與 Amazon ML Solutions Lab 團隊合作,此專案小組得以深入了解其雲端最佳實務,並了解如何設計和執行概念證明。此團隊也得以了解 Amazon Kendra。Zhang 表示:「Amazon Kendra 是一個一站式 AI 解決方案,如果設定正確,它能夠跨越組織中的每個網域,同時易於實作。」在 4 週內,此團隊決定朝著完全在 AWS 上開發企業搜尋工具的目標邁進。
建置其 Morpheus 應用程式來促進組織變革
Gilead 的 PDM 團隊透過使用 Amazon Simple Storage Service (Amazon S3) 建置資料湖,來啟動 Morpheus 專案;Amazon Simple Storage Service (Amazon S3) 是一項物件儲存服務,提供領先業界的可擴展性、資料可用性、安全性和效能。這個資料湖可作為集中的儲存庫,來存放幾乎任何規模的所有 PDM 非結構化資料。Zhang 表示:「為了在 AWS 擁有企業搜尋工具,我們必須有相關的強大資料管理。」「我們用 9 個月的時間在 AWS 上建置資料湖;這是許多人都認為需要好多年才能實現的目標。」 Gilead 使用資料湖,不僅作為 AI 和 ML 的基礎,也可執行分析並從開發和製造的資料中獲得深入的洞察。先前,Gilead 的團隊必須提交票證給其資訊科技團隊來進行分析,在某些情況下,甚至需要 1 年的時間才能滿足要求。現在,Gilead 可以在數個工作日內提供分析和 AI 推論。
接下來,PDM 團隊專注於透過使用 Amazon SageMaker 為其文件填補遺失或不完整的中繼資料,來豐富其搜尋內容;Amazon SageMaker 可協助使用者透過全受管基礎設施、工具和工作流程,為幾乎任何使用案例建置、訓練和部署 ML 模型。Gilead 透過此解決方案,協助其研究人員使用幾個關鍵字就能輕鬆搜尋相關資訊。該公司還使用 Amazon Textract,這是一種 ML 服務,可自動從掃描的文件中擷取文字、手寫內容和資料。Gilead 使用 Amazon Textract 來偵測其文件中相關的資訊,與先前的光學字元辨識解決方案相比,此服務將每次操作的相關成本降低了好幾個數量級。Zhang 表示「Amazon Textract 真的很棒,不只是因為確實節省了成本,也因為其擷取資訊的技術能力真的很優異。」
此團隊還使用 Amazon Kendra 搭配其應用程式來從資料湖中搜尋結果。透過這樣做,Gilead 就能將在系統中搜尋相關資訊所需的時間減少約 50%,進而提高員工生產力並簡化團隊的工作流程。「使用 Amazon Kendra 帶來很明顯的效率提升。有了這個服務,我們團隊就能減少人員需要查看來尋找正確資訊的位置數量。」Zhang 表示。
在 2021 年十一月,該團隊能夠推出其 Morpheus 應用程式,以 5 個員工的核心團隊完成其專案的第一階段。自此之後,該應用程式就成為組織變革的催化劑。在推出應用程式的 3 個月內,超過 100 名員工都採用企業搜尋工具。Zhang 表示:「Morpheus 讓我們推翻必須進行程式庫科學或本體論來組織和尋找知識的想法。」「這已經成為向資深領導階層展示 AI 和 ML 價值的簡單方式。」
從 AI 和 ML 技術獲得更多價值
Gilead 內部的開發和製造團隊目前致力於改善其資料湖,來實現 GxP 合規性,包含遵循良好的製造實務,並期望在 2022 年六月前完成資料湖的重構。該公司還計畫建置更多 AI 和 ML 技術,來提供預測性中繼資料、個人化的 AI 和知識圖形。Zhang 表示:「Morpheus 讓我們意識到,使用這種規模的工具如何為整個組織帶來優勢。」「此應用程式真的協助我們了解,Gilead 如何使用資料科學,來推動我們可以從 AWS 上的 AI 和 ML 獲得的下一波價值。」
關於 Gilead Sciences
總部位於加州福斯特城的生物科技公司 Gilead 專門從事抗病毒技術和藥物的研究和開發,包括愛滋病毒和病毒性肝炎的潛在治療方法,以及潛在的 COVID-19 療法。
AWS 的優勢
- 在不到 1 年內建置使用 AI 和 ML 的企業搜尋工具
- 為九個不同的企業系統建立作為儲存庫的資料湖
- 減少與資料管理相關的人工任務
- 將搜尋時間減少約 50%
- 簡化內部工作流程,提高員工生產力
- 在數天內就能獲得深入的分析和洞察
- 節省更多成本
- 促進組織變革
使用的 AWS 服務
Amazon Kendra
Amazon Kendra 是採用機器學習技術的智慧搜尋服務。Kendra 可重新構思網站和應用程式的企業搜尋方式,讓您的員工和客戶輕鬆找出所需內容,即使內容分散在貴組織的多個位置和內容儲存庫也沒問題。
Amazon SageMaker
Amazon SageMaker 匯集了一系列專為機器學習 (ML) 建置的功能,有助於資料科學家和開發人員快速準備、構建、訓練和部署高品質的 ML 模型。
Amazon Textract
Amazon Textract 是一項機器學習服務,可自動從掃描文件中擷取文字、手寫內容和資料,不僅可實現簡單的光學字元辨識 (OCR),還可以識別、理解和擷取表單和表格中的資料。
Amazon Simple Storage Service (Amazon S3)
Amazon Simple Storage Service (Amazon S3) 物件儲存服務提供領先業界的可擴展性、資料可用性、安全性及效能。
入門
各行各業各種規模的組織每天都在使用 AWS 來變革其業務和履行其使命。聯絡我們的專家,立即開始您的專屬 AWS 雲端之旅。