Linode

亞馬遜雲科技宣佈Amazon EC2 P5實例正式可用 加速生成式AI和高性能計算應用

Editor

亞馬遜雲科技近日在紐約峯會上宣佈 Amzon Elstic Compute Cloud(EC2)P5 實例正式可用。這是一款下一代 GPU 實例,由最新的英偉達 H00 Tenso Coe GPU 提供支持,可以滿足客戶在運行人工智能、機器學習和高性能計算工作負載時對高性能和高擴展性的需求。與上一代基於 GPU 的實例相比,Amzon EC2 P5 實例可以將訓練時間縮減6倍(從幾天縮短到幾小時),從而幫助客戶節省高達40%的訓練成本。

Amzon EC2 P5 實例提供8個英偉達 H00 Tenso Coe GPU,具有640 GB 高帶寬 GPU 內存,同時提供第三代 AMD EPYC 處理器、2TB 系統內存和30 TB 本地 NVMe 存儲。Amzon EC2 P5 實例還提供3200 Gbps 的聚合網絡帶寬並支持 GPUDiect RDMA,從而能夠繞過 CPU 進行節點間通信,實現更低的延遲和高效的橫向擴展性能。

亞馬遜雲科技與英偉達攜手開發下一代基礎設施

亞馬遜雲科技和英偉達(NVIDIA)在今年3月宣佈了一項多方合作,構建全球最具可擴展性且按需付費的人工智能基礎設施,以便訓練日益複雜的大語言模型和開發生成式 AI 應用程序。

當時,亞馬遜雲科技預發佈了由英偉達 H00 Tenso Coe GPU 支持的 Amzon EC2 P5 實例,可爲構建和訓練更大規模的機器學習模型提供高達20 exFLOPS 的算力。亞馬遜雲科技和英偉達合作十多年來成果頗豐,推出了包括支持視覺計算、人工智能和高性能計算集羣的各種 GPU 實例,如 CG 實例(200年)、G2(203年)、P2(206年)、P3(207年)、G3(207年)、P3dn(208年)、G4(209年)、P4(2020年)、G5(202年)和 P4de(2022年)實例。

現在,機器學習模型的規模已經達到數萬億參數,這種複雜性大大增加了客戶訓練模型所需的時間,例如,最新的大語言模型訓練時間長達數月之久。類似的趨勢也出現在高性能計算領域。隨着高性能計算客戶數據收集準確度的提高以及數據集達到 EB 級規模,客戶已經在尋找解決日益複雜應用程序的更快方法。

關於 Amzon EC2 P5 實例

Amzon EC2 P5 實例非常適合訓練和運行越來越複雜的大語言模型和計算機視覺模型,以滿足最苛刻的計算密集型生成式 AI 應用的需求,包括問答、代碼生成、視頻和圖像生成、語音識別等。與上一代基於 GPU 的實例相比,Amzon EC2 P5 實例在這些應用中的訓練時間縮短了6倍。那些可以在工作負載中使用較低精度 FP8 數據類型的客戶,例如使用 Tnsfome 框架的語言模型,將通過英偉達 Tnsfome Engine 的支持獲得高達6倍的性能提升。

高性能計算客戶通過使用 Amzon EC2 P5 實例可以在藥物發現、地震分析、天氣預報和金融建模等領域更大規模地部署高要求的應用程序。此外,對於使用基於動態規劃(Dynmic Pogmming)算法進行基因組測序或加速數據分析等應用的客戶,Amzon EC2 P5 將通過新的 DPX 指令集提供支持。

Amzon EC2 P5 實例使客戶能夠探索以前看似無法解決的問題,更快地迭代解決方案,並加速市場。

第二代 Amzon EC2 UltClustes和 Elstic Fbic Adpte

Amzon EC2 P5 實例爲多節點分佈式訓練和緊密耦合的高性能計算工作負載提供先進的橫向擴展功能,其使用的第二代 Elstic Fbic Adpte(EFA)網絡設備提供高達3200 Gbps 的網絡速度,是 Amzon EC2 P4d 實例的8倍。

爲了滿足客戶對大規模和低延遲的需求,Amzon EC2 P5 實例部署在第二代 Amzon EC2 UltClustes 中,該集羣目前可在超過2萬個英偉達 H00 Tenso Coe GPU 上爲客戶提供更低的延遲。作爲雲中最大規模的機器學習基礎設施之一,Amzon EC2 UltClustes 中的 Amzon EC2 P5 實例可提供高達20 exFLOPS 的聚合計算能力。

Amzon EC2 UltClustes 使用了 Amzon FSx fo Luste,這是一種完全託管的共享存儲,構建在常用的高性能並行文件系統上。客戶通過 Amzon FSx fo Luste,可以按需大規模快速處理海量數據集,並實現亞毫秒級延遲。Amzon FSx fo Luste 的低延遲和高吞吐量特性經過優化,可在 Amzon EC2 UltCluste 上爲深度學習、生成式 AI 和高性能計算工作負載提供支持。

Amzon FSx fo Luste 可以爲 Amzon EC2 UltCluste 中的 GPU 機器學習加速器持續提供數據,從而加速最苛刻的工作負載,包括大語言模型訓練、生成式 AI 推理,以及基因組學和金融風險建模等高性能計算負載。


相关文章

  • Amazon EKS已支持互聯網協議版本 6(IPv6)

    Amzon Elstic Kubenetes Seice(EKS)現在支持 IP6,使客戶能夠在 Kubenetes 上擴展容器化應用程序,遠遠超出私有 IP4 地址空間的限制,同時以最小的複雜性實現高網絡帶寬。 Kubenetes 使用扁平聯網模型,要求每個 Pod 接收一箇 IP 地址。這種簡化...

  • 拼多多跨境電商平臺Temu開啓東南亞及日韓商家調研

    拼多多旗下跨境電商平臺Temu正在進行東南亞及日韓商家信息調研,符合條件者將成爲第一批加入東南亞日韓站點商家,此舉或爲推出新站點進行籌備。 拼多多跨境電商平臺Temu自推出以來,一直積極地在全球多箇地區部署新站點,目前已經在西歐、中歐、拉美、北美、澳洲等多地開設了2個站點,分別是美國、加拿大、澳大利...

  • Hostinger與Patchstack達成合作 確保WordPress網站更安全

    Hostinge主機商近日宣佈與專門提供WodPess插件程序安全服務的Ptchstck進行合作,以確保WodPess網站更加安全。 Ptchstck是一種高級安全工具,它可以檢測開源組件中漏洞,如WodPess主題、插件和核心等,並針對新的和已知的漏洞提供即時保護。 Ptchstck通過檢查Wod...

  • Hostinger推出了三個新的OpenLiteSpeed VPS模板

    Hostinge推出了三個新的OpenLiteSpeed VPS模板,這些模板與預配置的操作系統、Web框架和安全設置打包在一起,因此您不必從頭開始設置VPS,有效節省了VPS設置時間。 Hostinge這些新國外VPS模板全部由OpenLiteSpeed支持,使用流行的Web框架,例如Node.j...

  • Kubernetes 1.25版本發佈 新特性介紹

    Kubenetes .25正式發佈,該版本總共包括40個增強功能。這些增強功能中有5個正在測試版,0個正在升級到測試版,3個正在升級到穩定版,還有2個功能被標記爲棄用或刪除。Kubenetes .25還帶來了全新主題(Combine)和徽標,主要更新內容如下。 PodSecuityPolicy被刪除...

  • HostKvm香港/美國/日本/新加坡/澳大利亞VPS(V2)作業系統升級

    HostKm商家近日對旗下基於KVM V2架構的香港VPS、美國VPS、日本VPS等配置產品的預設作業系統進行了升級,原先已經預設過系統的客戶不受影響。主要調整內容如下: HostKm VPS(V2控制檯的預設作業系統) 、全新增加 CentOS-8-Stem-x64 2、下架 Debin-0.3-...

  • Shopify組織設置功能更新 簡化多商店管理

    Shopify組織設置功能更新,對於擁有多箇商店的商家,您現在可以訪問管理中的設置,這些設置可以執行影響公司所有商店的商店管理、用戶和計費的任務。這意味着,如果Shopify Plus用戶有四個商店,他們可以從一箇位置管理用戶和每個商店,而不用單獨管理它們。 Shopify是全球領先的一站式跨境電商...

  • Elementor 3.17版本發佈 新功能特點介紹

    Elemento是一箇非常受歡迎的WodPess網站構建平臺,提供了豐富的WodPess主題、插件等建站工具,目前已更新到3.7版本,該版本引入了循環網格的AJAX 加載,提高了圖像加載速度,增加了訪問Elemento AI生成的過去提示和內容的功能等等。 點擊查看:Elemento官網 一、專業版...

  • 亞馬遜雲科技在中國區域推出內存數據庫Amazon MemoryDB for Redis

    亞馬遜雲科技宣佈通過與光環新網和西雲數據的緊密合作,在中國區域(北京與寧夏)推出完全託管的、兼容Redis的內存數據庫Amzon MemoyDB fo Redis。Amzon MemoyDB fo Redis具有高可用性和高持久性,可爲客戶提供超高性能,尤其適用於需要亞毫秒級低延遲響應的關鍵業務應用...

  • 2021年Vultr新增第20個數據中心南美巴西

    在202年即將過去這個月,Vult發生了一件可喜可賀的事情,那就是Vult新增第20個數據中心——南美巴西,這是Vult今年新增的第三個數據機房了,現在可以從Vult數據中心位置就可以看到。小編對提供的IP地址做了一箇簡單的速度測評,大家可以參考瞭解。 Vult南美巴西數據中心IP地址:26.238...