概觀
AWS 上的擴展運算效能解決方案可協助客戶部署和操作運算密集型工作流程所用的多使用者環境,例如:電腦輔助工程 (CAE)。此 AWS 解決方案具有大量的運算資源選擇、快速的網路骨幹、無限儲存空間以及和 AWS 直接整合的預算與成本管理。
優勢
部署並設定隨附通用 API 集的使用者介面 (UI) 範例,允許管理員和使用者利用此 API 與其 Amazon Elastic Compute Cloud (Amazon EC2) 叢集互動。
透過桌面雲端視覺化 (DCV) 圖形化工作階段,來協助使用者輕鬆存取 EC2 叢集,以執行視覺化操作的任何預先及後續處理。
近乎即時地擷取排程器和應用程式日誌,並將其存放於資料湖以便後續處理。
自訂並擴展與解決方案一起部署的指令碼集合,以協助使用者收集資料和執行公共叢集任務。
技術詳細資訊
您可以使用實作指南來自動部署此架構。
步驟 1
Amazon EC2 Auto Scaling,以自動佈建執行叢集使用者任務 (例如擴展運算效能的任務) 所需的資源。
步驟 2
該解決方案還部署用於持久性儲存的 Amazon Elastic File System (Amazon EFS)、用於持久性日誌的 Amazon Simple Storage Service (Amazon S3) 和選用的平行檔案系統 Amazon FSx for Lustre。
步驟 3
在其核心,Amazon Elastic Compute Cloud (Amazon EC2) 執行個體會實作一個排程器,以動態佈建使用者所提交任務所需的 AWS 資源。該排程器執行個體還託管允許使用者和管理員與環境互動的 Web 介面。
步驟 4
啟動使用 Amazon DCV 的 2D 或 3D 工作站,以用於提交批次任務和執行 GUI 工具。
步驟 5
使用的安全服務和資源包括 AWS Secrets Manager、AWS Certificate Manager、安全群組和 AWS Identity and Access Management (IAM)。
步驟 6
AWS Lambda 函數,用於驗證所需的先決條件並為 Application Load Balancer (ALB) 建立預設簽章證書,以管理對 DCV 工作站工作階段的存取。
步驟 7
Amazon OpenSearch Service 叢集,用於存放任務和主機資訊。
步驟 8
Elastic Load Balancing 用於確保跨可用區域的可存取性,成本分配標籤與 AWS Cost Explorer 配合使用。
相關內容
本影片展示了 re:Invent 2020 簡報,詳細介紹了 Rivian 如何克服障礙,改善工程體驗,同時透過以雲端為基礎的服務和自動化鼓勵自助服務。
本影片展示了如何實作 AWS 上的橫向擴展運算解決方案,以部署和操作運算密集型工作流程所用的多使用者環境。