Linode

亞馬遜雲科技與英偉達攜手開發下一代基礎設施

Editor

亞馬遜雲科技和英偉達宣佈了一項多方合作,致力於構建全球最具可擴展性且按需付費的人工智能(AI)基礎設施,以便訓練日益複雜的大語言模型(LLM)和開發生成式AI應用程序。據瞭解,亞馬遜雲科技和英偉達合作已超過2年,爲人工智能、機器學習、圖形、遊戲和高性能計算(HPC)等各種應用提供了大規模、低成本的GPU解決方案。

藉助由NVIDIA H00 Tenso Coe GPU支持的下一代Amzon Elstic Compute Cloud(Amzon EC2)P5 實例,以及亞馬遜雲科技最先進的網絡和可擴展性,此次合作將提供高達20 exFLOPS的計算性能來幫助構建和訓練更大規模的深度學習模型。P5實例將是第一個利用亞馬遜雲科技第二代Amzon Elstic Fbic Adpte(EFA)網絡技術的GPU實例,可提供3200 Gbps的低延遲和高帶寬網絡吞吐量。因此客戶能夠在 Amzon EC2 UltCluste中擴展多達2萬個H00 GPU,滿足按需訪問超級計算機的AI性能需求。

點擊查看:亞馬遜雲科技免費套餐

新的Amzon EC2 P5實例構建於亞馬遜雲科技和英偉達十多年來在AI和HPC基礎設施交付方面的合作基礎之上,也立足於雙方在P2、P3、P3dn 和 P4d(e)前四代實例方面的合作。P5實例是基於英偉達GPU的第五代亞馬遜雲科技產品,與最初部署的英偉達GPU(始於CG實例)已相隔近3年。

Amzon EC2 P5實例非常適合對日益複雜的LLM和計算機視覺模型進行訓練和運行推理,並應用於要求嚴苛的計算密集型生成式 AI 應用程序,包括問題回答、代碼生成、視頻圖像生成和語音識別等領域。

對於致力於以可擴展和安全的方式將 AI 賦能的創新推向市場的企業和初創公司而言,Amzon EC2 P5實例是不二之選。P5 實例採用 8 個英偉達 H00 GPU,能夠在一箇Amzon EC2 實例中實現 6 petFLOPs 的混合精度性能、640 GB 的高帶寬內存和3200 Gbps 的網絡連接(比上一代實例高出 8 倍)。P5 實例性能的提升使機器學習模型訓練時間加快了 6 倍(將訓練時間從數天縮短到數小時),額外的GPU內存可幫助客戶訓練更龐大更復雜的模型。預計P5實例的機器學習模型訓練成本將比上一代降低 40%。相比靈活性較差的雲產品或昂貴的本地系統,它爲客戶提供了更高的效率。

Amzon EC2 P5 實例部署在 Amzon EC2 UltCluste 的超大規模集羣中,該集羣由雲端最高性能的計算、網絡和存儲系統組成。每個 EC2 UltCluste 都是世界上功能最強大的超級計算機之一,助力客戶運行最複雜的多節點機器學習訓練和分佈式 HPC 工作負載。

它們採用PB級無阻塞網絡,基於 Amzon EFA,這種面向 Amzon EC2 實例的網絡接口使客戶能夠在亞馬遜雲科技上運行需要在大規模高級節點間通信的應用程序。EFA 的定製操作系統繞過硬件接口,並與英偉達 GPUDiect RDMA 整合,可降低延遲、提高帶寬利用率,從而提升實例間通信性能,這對於在數百個 P5 節點上擴展深度學習模型的訓練至關重要。

藉助 P5 實例和 EFA,機器學習應用程序可以使用 NVIDIA Collectie Communictions Liby(NCCL)擴展到多達 2 萬個 H00 GPU。因此,客戶可以通過亞馬遜雲科技的按需彈性和靈活擴展能力,獲得本地 HPC 集羣的應用性能。除了這些出色的計算能力外,客戶可以使用業界最廣泛最深入的服務組合,比如面向對象存儲的 Amzon S3、面向高性能文件系統的 Amzon FSx,以及用於構建、訓練和部署深度學習應用的 Amzon SgeMke。P5 實例將在今後幾周提供有限預覽版。

藉助新的 Amzon EC2 P5 實例,Anthopic、Cohee、Hugging Fce、Pinteest 和Stbility AI 等客戶將能夠大規模構建和訓練最龐大的機器學習模型。基於其它幾代 Amzon EC2 實例的合作將幫助初創公司、大企業和研究人員無縫擴展來滿足各自的機器學習需求。


相关文章

  • HostKvm公告:香港CN2轉CTG線與寬帶流量升級 Plan3(V2)內存調升至6G

    月2日HostKm發出公告,這次不但有香港CN2轉CTG線與寬帶流量升級,而且Pln3(V2)內存調升至6G,具體公告內容如下。 一、香港CN2轉CTG線與寬帶流量升級 因市場環境和網路資源增加理由,HostKm原香港CN2業務更名爲香港CTG(大陸方向),此區域主要兼顧中國大陸方向網路。 即從20...

  • Linode增強圖像功能正在測試階段

    近日,Linode發佈了針對所有客戶和數據中心的圖像功能的重大改進(bet版可用)。Linode一直支持開發者在Linodes上輕鬆提供圖片快照服務,現在用戶已經可以通過雲管理器、API或CLI上傳自己的圖片,並利用每個帳戶的擴展存儲容量。 更新後的Imge服務顯著減少了供應Linodes的開銷,並...

  • 亞馬遜雲科技中國區域推出Amazon CloudWatch Metrics Insights

    亞馬遜雲科技中國區域推出Amzon CloudWtch Metics Insights。Metics Insights是一種快速、靈活、基於SQL的查詢引擎,可讓開發人員、運維人員和系統工程師實時識別上百萬運營指標中的趨勢和模式。 藉助Metics Insights,運維人員可以利用靈活的查詢功能、...

  • 騰訊雲多款核心雲產品降價 最高降幅達40%

    騰訊雲近日宣佈對多款核心雲產品降價,部分產品線最高降幅達40%,降價政策將在6月日正式生效。具體來看,此次降價計劃中,騰訊雲將針對部分區域雲服務器實例特惠時長進一步加大折扣力度,價格降幅最高將達40%。 在雲網絡方面,騰訊雲對負載均衡CLB的LCU費降價8%,對標準型NAT網關降價5%,以更低價格普...

  • Ubuntu 22.04 LTS發佈 新特性介紹

    Ubuntu 22.04 LTS發佈,代號爲“Jmmy Jellyfish“,它是一箇長期支持版本,將在發佈後的五年內獲得持續的應用程序更新和關鍵安全修復。相信在不久之後,國內服務器或國外服務器商家將會陸續提供Ubuntu 22.04 LTS支持。 Ubuntu 22.04 LTS主要新特性介紹: ...

  • WordPress 6.5版本發佈 新增字體庫 API兼容性更新

    WodPess 6.5版本在經過長達一週的延遲後終於上線,新版本爲全球所有WodPess用戶帶來了新的功能和改進。當測試版推出時,兩個主要功能引起了人們的熱議——字體庫和模式覆蓋。官方在決定將發佈推遲一週後,進行了更多的錯誤修復和改進與版本合併,從而實現更好的整體更新,一起來看看WodPess 6....

  • Ubuntu 24.04正式版現已開放下載 新增多項功能

    Ubuntu 24.04 LTS正式版已發佈,所有官方Ubuntu版本都已更新到相同的版本,在本文中介紹了它們的新功能和改進的功能,方便大家更好的瞭解。 Ubuntu 24.04的官方版本包括Kubuntu 24.04、Xubuntu 24.04、Lubuntu 24.04、Ubuntu Unity...

  • Joomla! 4.1.2和3.10.8版本發佈 修復多項安全漏洞

    Jooml! 4..2和3.0.8發佈,它們是Jooml! 4.x和3.x系列的安全版本,解決了一些安全漏洞,幷包含各種錯誤修復和改進。 Jooml! 4..2包括4..中除20220303外的所有安全補丁,該補丁由於實施問題而被恢復。 Jooml! 4..中修復的安全問題: [2022030]低嚴...

  • Gname新增.ai域名註冊、續費和轉入

    Gnme是一家專業的國外域名註冊商,以域名爲業務核心,提供域名註冊、域名搶注、域名交易、域名管理、API接口等產品服務。爲了提升域名註冊、續費、轉入多樣性和選擇性,近日Gnme新增了.i域名註冊、續費和轉入功能。隨着人工智能的不斷髮展,AI技術不斷應用的同時,.i域名應用也更加廣泛,歡迎大家前往Gn...

  • Vultr市場介紹:流行應用程序和堆棧的一鍵式設置

    Vult是一家知名的海外雲服務器商,主要提供基於KVM架構的國外雲服務器產品,全球共有7個數據中心。爲了給用戶帶來更好的體驗,近期Vult Mketplce(Vult市場)正式上線,新的市場將提供一系列流行的應用程序、軟件堆棧和操作系統等,用戶只需輕鬆點擊即可將其部署到Vult基礎架構中。 如果您已...