Linode

亞馬遜雲科技與英偉達攜手開發下一代基礎設施

Editor

亞馬遜雲科技和英偉達宣佈了一項多方合作,致力於構建全球最具可擴展性且按需付費的人工智能(AI)基礎設施,以便訓練日益複雜的大語言模型(LLM)和開發生成式AI應用程序。據瞭解,亞馬遜雲科技和英偉達合作已超過2年,爲人工智能、機器學習、圖形、遊戲和高性能計算(HPC)等各種應用提供了大規模、低成本的GPU解決方案。

藉助由NVIDIA H00 Tenso Coe GPU支持的下一代Amzon Elstic Compute Cloud(Amzon EC2)P5 實例,以及亞馬遜雲科技最先進的網絡和可擴展性,此次合作將提供高達20 exFLOPS的計算性能來幫助構建和訓練更大規模的深度學習模型。P5實例將是第一個利用亞馬遜雲科技第二代Amzon Elstic Fbic Adpte(EFA)網絡技術的GPU實例,可提供3200 Gbps的低延遲和高帶寬網絡吞吐量。因此客戶能夠在 Amzon EC2 UltCluste中擴展多達2萬個H00 GPU,滿足按需訪問超級計算機的AI性能需求。

點擊查看:亞馬遜雲科技免費套餐

新的Amzon EC2 P5實例構建於亞馬遜雲科技和英偉達十多年來在AI和HPC基礎設施交付方面的合作基礎之上,也立足於雙方在P2、P3、P3dn 和 P4d(e)前四代實例方面的合作。P5實例是基於英偉達GPU的第五代亞馬遜雲科技產品,與最初部署的英偉達GPU(始於CG實例)已相隔近3年。

Amzon EC2 P5實例非常適合對日益複雜的LLM和計算機視覺模型進行訓練和運行推理,並應用於要求嚴苛的計算密集型生成式 AI 應用程序,包括問題回答、代碼生成、視頻圖像生成和語音識別等領域。

對於致力於以可擴展和安全的方式將 AI 賦能的創新推向市場的企業和初創公司而言,Amzon EC2 P5實例是不二之選。P5 實例採用 8 個英偉達 H00 GPU,能夠在一箇Amzon EC2 實例中實現 6 petFLOPs 的混合精度性能、640 GB 的高帶寬內存和3200 Gbps 的網絡連接(比上一代實例高出 8 倍)。P5 實例性能的提升使機器學習模型訓練時間加快了 6 倍(將訓練時間從數天縮短到數小時),額外的GPU內存可幫助客戶訓練更龐大更復雜的模型。預計P5實例的機器學習模型訓練成本將比上一代降低 40%。相比靈活性較差的雲產品或昂貴的本地系統,它爲客戶提供了更高的效率。

Amzon EC2 P5 實例部署在 Amzon EC2 UltCluste 的超大規模集羣中,該集羣由雲端最高性能的計算、網絡和存儲系統組成。每個 EC2 UltCluste 都是世界上功能最強大的超級計算機之一,助力客戶運行最複雜的多節點機器學習訓練和分佈式 HPC 工作負載。

它們採用PB級無阻塞網絡,基於 Amzon EFA,這種面向 Amzon EC2 實例的網絡接口使客戶能夠在亞馬遜雲科技上運行需要在大規模高級節點間通信的應用程序。EFA 的定製操作系統繞過硬件接口,並與英偉達 GPUDiect RDMA 整合,可降低延遲、提高帶寬利用率,從而提升實例間通信性能,這對於在數百個 P5 節點上擴展深度學習模型的訓練至關重要。

藉助 P5 實例和 EFA,機器學習應用程序可以使用 NVIDIA Collectie Communictions Liby(NCCL)擴展到多達 2 萬個 H00 GPU。因此,客戶可以通過亞馬遜雲科技的按需彈性和靈活擴展能力,獲得本地 HPC 集羣的應用性能。除了這些出色的計算能力外,客戶可以使用業界最廣泛最深入的服務組合,比如面向對象存儲的 Amzon S3、面向高性能文件系統的 Amzon FSx,以及用於構建、訓練和部署深度學習應用的 Amzon SgeMke。P5 實例將在今後幾周提供有限預覽版。

藉助新的 Amzon EC2 P5 實例,Anthopic、Cohee、Hugging Fce、Pinteest 和Stbility AI 等客戶將能夠大規模構建和訓練最龐大的機器學習模型。基於其它幾代 Amzon EC2 實例的合作將幫助初創公司、大企業和研究人員無縫擴展來滿足各自的機器學習需求。


相关文章

  • 騰訊宣佈自研業務完成全面上雲 近三年累計節省成本超過30億

    今天,騰訊雲官微宣佈,內部海量自研業務已實現全面上雲。這意味着包括QQ、微信、騰訊視頻、王者榮耀等在內的騰訊內部業務,和騰訊雲百萬級外部客戶一樣基於公有云的模式來開發運營。 據統計,近三年來,騰訊的自研業務上雲規模突破5000萬核,累計節省成本超過30億。數千萬核的自研業務上雲規模,推動騰訊雲的自研...

  • HawkHost老鷹主機新增微信支付方式

    HwkHost老鷹主機近日宣佈已支持微信支付方式(WeCht Py),使用微信支付不需要額外的費用和複雜的步驟,您只需從HwkHost提供的發票下拉列表中選擇一箇選項,然後按照提示完成支付! 爲了給亞太地區用戶提供熟悉且易於使用的支付方式,HwkHost老鷹主機除了本次新增的微信支付外,還支持支付寶...

  • RAKsmart企業雲服務器新品上線 價格低至 $33.60/月

    老牌美國服務器商RAKsmt近幾年爲了滿足廣大用戶的需求一直在不斷優化產品性能和豐富產品種類,近日RAKsmt新增企業雲服務器產品,具有簡單高效、安全可靠、彈性伸縮和即開即用等優勢,適合大數據分析、深度學習、跨境電商、Web應用和遊戲業務等場景。 RAKsmt企業雲服務器有基礎型、計算型、通用型和內...

  • 新通用頂級域名.bond/.cyou已獲得工信部許可 國內可註冊備案

    9月22日,新通用頂級域名.bond、.cyou的註冊局格域(北京)科技有限公司正式通過工信部資質審批,這意味着.bond域名、.cyou域名可以在中國境內無阻註冊、使用和申請備案。 .bond、.cyou域名是ShotDot SA註冊局,在中國境內也就是格域(北京)科技有限公司運營下的頂級域名。在...

  • 阿里雲產品全線降價 最高幅度達55%

    阿里雲將於3月日起,下調部署在中國大陸地域的部分公共雲產品,這是阿里雲史上最大力度的一次降價,涉及00多款產品、500多箇產品規格,覆蓋計算、存儲、數據庫等所有核心產品,數百萬新老客戶可在本次降價中直接獲益。 本次降價採用官網直降的形式,對在官網採購的新老客戶均適用。其中,雲服務器ECS最高降36%...

  • Vultr推出Kubernetes Engine Beta版 支持雲原生應用

    Kubenetes是一箇可移植的、可擴展的開源平臺,主要用於管理容器化的工作負載和服務。美國主機商Vult近期推出了Kubenetes Engine Bet 版,這是一款使用完全託管的服務部署和擴展容器化應用程序,目前可在洛杉磯和新澤西洲地區使用。 Vult Kubenetes Engine主要特點...

  • Sectigo證書將於2022年7月1日起棄用OU字段

    根據CA/B論壇最新規定:從2022年9月日開始,所有CA頒發的可信SSL/TLS數字證書將不再使用OU字段。爲遵循行業新規,提前應對SSL證書策略變更,Sectigo證書將於2022年7月日棄用OU字段,相關內容如下。 主要變更: 從2022年7月日開始,Sectigo不再簽發含有OU字段信息的S...

  • Elementor 3.19發佈 新功能特點介紹

    Elemento迎來了最新的3.9版本,更新了很多功能,例如根據各種條件和參數顯示元素,可以從元素管理器中自定義團隊的微件面板,從而簡化協作;通過表單生成器和Akismet垃圾郵件過濾器之間的無縫集成;在Elemento模板庫中集成了AI容器的強大功能,以生成專業設計模板的內容和樣式變體等。 點擊訪...

  • Vultr獲得著名的MACH聯盟認證 唯一一家認證的獨立雲提供商

    Vult最近獲得了著名的 MACH 聯盟的認證,MACH聯盟是一箇由公司和組織組成的全球聯盟,致力於促進技術行業的開放標準、互操作性和供應商選擇。與 Vult 一樣,MACH 聯盟旨在創建一箇更加透明和值得信賴的數字生態系統,讓客戶可以更好地控制他們的數據和技術選擇。MACH 認證與 Vult 堅定...

  • Ubuntu 21.04 正式發佈 默認使用 Wayland

    4 月 24 日Ubuntu 正式發佈了 2.04 版本,該版本採用了 Linux 5. 穩定版內核,同時內置了微軟 Actie Diectoy 集成、用於 Flutte 應用開發的 SDK,以及默認啓用 Wylnd 替換了已有 36 年曆史的 X Window System。 雖然 Ubuntu ...