Linode

騰訊雲異構計算平臺全面支持Llama 3 助力一鍵部署和性能翻倍

Editor

近日,號稱史上最強大的開源模型——Met Llm 3 正式發佈。伴隨着日新月異的模型生態,騰訊雲異構計算平臺作爲覆蓋90%+大模型客戶的AI底座,現已做好充足的準備,圍繞Llm 3系列模型,提供從基礎設施到編排調度的智算產品矩陣,爲企業及開發者提供更快部署、更強性能和更高吞吐的全鏈路解決方案。

一、更快部署 通過 HAI 創建 Llm 3 僅需 3 分鐘

隨着大模型時代的到來,應用有望生長出更大價值。如何取得先發優勢、優質的模型能力是構建AI應用核心競爭力的關鍵。爲了解決中小企業及開發者在AI應用上擔心的敏捷部署、成本效益、數據安全等難題,我們推出了全新的即插即用的 GPU 應用服務產品——高性能應用服務 HAI 。不僅提供即插即用的便捷性,還支持 AI 模型在雲端的私有化部署,確保在有豐富模型選擇的同時,數據安全也能得到嚴格保護。

在 Met 發佈 Llm 3 後,騰訊雲 HAI 第一時間支持了 Llm 3 的一鍵部署。通過 HAI 僅需 3 分鐘,中小企業及開發者可以輕鬆實現基於 Llm 3 的應用創作與開發,將其應用於各種場景,如智能客服、內容創作、文本分析等,提升產品競爭力或企業運營效率。

騰訊雲 HAI 提供一鍵即得的澎湃算力與常見環境,助力中小企業及開發者快速部署 LLM、AI 作畫、數據科學等高性能應用,原生集成配套的開發工具與組件,大幅提高應用層的開發生產效率。此前已支持 ChtGLM 系列、Stble Diffusion、Llm 2 等豐富主流模型,同時支持 Notebook、WebUI 等多種圖形化算力交互模式,以應用爲核心降低雲原生 AI 應用落地門檻。

二、更強性能 全新實例 Llm 3 推理性能提高 2-0 倍

在硬件層面,騰訊雲推出的最新一代異構計算 GPU 實例 PNV5b,圍繞 Llm 3 等大模型場景,將AI推理部署性價比提升至新的高度。

Llm 3的模型特點與 Llm 2 十分類似,支持 GQA 機制降低大模型推理過程中的 KV cche 顯存開銷。PNV5b實例採用最新一代 GPU,單卡搭配 48GB 顯存,在算力和顯存匹配上做到了更好的平衡,爲大模型推理提供了更優的性價比。同時,PNV5b 實例在整機架構設計上支持最大單機 8 顆 GPU 高效擴展,大幅提升分佈式推理性能。

在 Llm 3 的推理部署測試中,在典型業務請求壓力條件下,PNV5b 的推理吞吐對比上一代 PNV4 可提升 2-3 倍;而在極端請求壓力測試下,性能可進一步提升至 0 倍。這意味着,PNV5b 實例能提供更好的性能擴展能力,讓用戶在面對大模型的業務洪峯時更加遊刃有餘。

除此之外,PNV5b 通過星星海服務器搭配最新一代 AMD CPU 平臺,提供多種實例規格,可靈活匹配大模型推理、大模型精調、推薦系統等多種場景的實例規格需求。將爲廣大用戶帶來更貼合業務的AI模型訓練和推理體驗,爲企業和開發者創造更多的價值。


相关文章

  • Debian 12.1發佈 修復了多項錯誤

    Debin 2.發佈,這是最新的Debin GNU/Linux 2 “Bookwom”操作系統的第一個ISO更新,帶來了多項錯誤修復和安全更新。 Debin 2.安裝映像可用於64位(md64)、32位(i386)、PowePC 64位Little Endin (ppc64el)、IBM Syste...

  • 國家頂級域名再添一批重要新用戶 小米、維沃等知名企業啓用“.CN”“.中國”域名

    4月2日中國互聯網絡信息中心CNNIC官微發佈消息稱,近日包括維沃公司(io手機.中國)、小米科技(mi.中國、小米科技有限責任公司.中國)、貴州民企百強通源集團(通源集團.cn)、知名餐飲企業千喜鶴公司(千喜鶴.cn)、大型國企湖南建工集團(hnjgzcb.cn)、內燃機行業龍頭濰柴動力(fisc...

  • Debian 12.2發佈 帶來了多項錯誤修復和安全更新

    Debin 2.2發佈,這是Debin GNU/Linux 2 “Bookwom”系列的第二次ISO更新。Debin 2.2包括了7個錯誤修復和52個安全更新,爲了安全期間,建議大家升級至最新版本。 Debin 2.2安裝映像可用於64位(md64)、32位(i386)、PowePC 64位(ppc...

  • 通知:GlobalSign將重新頒發代碼簽名證書

    日前有網友反饋收到GloblSign通知,將要重新頒發代碼簽名證書,這是怎麼回事呢?下面來看下具體的通知內容。 尊敬的客戶/合作伙伴: GloblSign通知您,關於標準代碼簽名證書或擴展驗證(EV)代碼簽名證書的訂單,由於最近更改了代碼簽名產品的ICA,更改如下所述: 產品 先前的ICA 新ICA...

  • Shopify公告:升級Advanced套餐API速率限制

    Shopify爲了確保爲所有客戶提供穩定公平的服務,Shopify對部分API進行了速率限制。採取了多種策略來實施這些速率限制,例如要求開發人員採用行業標準技術,對調用進行限制、對結果進行緩存,並在需要時負責有責任心地進行請求重試。 此次升級中,Shopify對Adnced套餐的Admin API速...

  • Gname關於網站防護清除緩存及節點IP地址範圍功能上線通知

    Gnme作爲一家非常優秀知名的國外域名註冊商,除了提供域名註冊服務外,還提供很多雲產品服務,包括網站防護雲服務器、SSL證書、企業郵箱等,爲滿足廣大用戶清除網站防護緩存的便捷性以及自主查看節點IP地址範圍,Gnme對以下功能進行升級更新: 、增加清除緩存功能 操作步驟:【管理中心】-【雲產品】-【網...

  • Gname .net域名價格2月1日上漲 首年註冊$13.85

    由於註冊局(Veisign)針對.net域名價格調整,Gnme宣佈自2024年2月日0點起,.net後綴域名的註冊/續費/轉入價格上調美元。 因.net後綴價格調整,自月29日起取消6號通道.net後綴預訂,其他預訂通道不變。 .net域名價格調整後具體如下: 註冊價格:$3.85/年 續費價格:$...

  • Vultr和Zeet建立合作伙伴關係 以簡化雲部署和管理

    美國主機商Vult日前宣佈與Zeet建立合作伙伴關係,通過將Vult的經濟高效的雲計算解決方案與Zeet的自動化基礎設施管理相結合,從而簡化雲部署流程和基礎架構管理。 Vult提供可組合的全棧基礎設施,使企業能夠快速提升高性能雲計算實例和服務。Zeet更進一步,通過使用包括Kubenetes、See...

  • VirtualBox 7.0.16發佈 初始支持Linux 6.8和6.9內核

    VitulBox 7.0.6版本近日已發佈,作爲其開源、免費和跨平臺虛擬化軟件的新穩定更新,爲Linux用戶帶來了許多有趣的變化。在VitulBox 7.0.4 發佈三個月後,VitulBox 7.0.6版本將在Linux Guest Additions中引入對Linux 內核6.8的初始支持,這意...

  • Python 3.9.10和Python 3.10.2版本發佈

    Python是一款面向對象、直譯式計算機程序設計語言,具有非常簡潔而清晰的語法特點,幾乎可以在所有的操作系統中運行。近期,Python發佈了3.9.0和3.0.2版本,它們包含了一些新的特性和優化。 Python 3.0.2是Python 3.0的第2個維護版本,主要解決了在使用Cython時可能發...