Linode

騰訊雲異構計算平臺全面支持Llama 3 助力一鍵部署和性能翻倍

Editor

近日,號稱史上最強大的開源模型——Met Llm 3 正式發佈。伴隨着日新月異的模型生態,騰訊雲異構計算平臺作爲覆蓋90%+大模型客戶的AI底座,現已做好充足的準備,圍繞Llm 3系列模型,提供從基礎設施到編排調度的智算產品矩陣,爲企業及開發者提供更快部署、更強性能和更高吞吐的全鏈路解決方案。

一、更快部署 通過 HAI 創建 Llm 3 僅需 3 分鐘

隨着大模型時代的到來,應用有望生長出更大價值。如何取得先發優勢、優質的模型能力是構建AI應用核心競爭力的關鍵。爲了解決中小企業及開發者在AI應用上擔心的敏捷部署、成本效益、數據安全等難題,我們推出了全新的即插即用的 GPU 應用服務產品——高性能應用服務 HAI 。不僅提供即插即用的便捷性,還支持 AI 模型在雲端的私有化部署,確保在有豐富模型選擇的同時,數據安全也能得到嚴格保護。

在 Met 發佈 Llm 3 後,騰訊雲 HAI 第一時間支持了 Llm 3 的一鍵部署。通過 HAI 僅需 3 分鐘,中小企業及開發者可以輕鬆實現基於 Llm 3 的應用創作與開發,將其應用於各種場景,如智能客服、內容創作、文本分析等,提升產品競爭力或企業運營效率。

騰訊雲 HAI 提供一鍵即得的澎湃算力與常見環境,助力中小企業及開發者快速部署 LLM、AI 作畫、數據科學等高性能應用,原生集成配套的開發工具與組件,大幅提高應用層的開發生產效率。此前已支持 ChtGLM 系列、Stble Diffusion、Llm 2 等豐富主流模型,同時支持 Notebook、WebUI 等多種圖形化算力交互模式,以應用爲核心降低雲原生 AI 應用落地門檻。

二、更強性能 全新實例 Llm 3 推理性能提高 2-0 倍

在硬件層面,騰訊雲推出的最新一代異構計算 GPU 實例 PNV5b,圍繞 Llm 3 等大模型場景,將AI推理部署性價比提升至新的高度。

Llm 3的模型特點與 Llm 2 十分類似,支持 GQA 機制降低大模型推理過程中的 KV cche 顯存開銷。PNV5b實例採用最新一代 GPU,單卡搭配 48GB 顯存,在算力和顯存匹配上做到了更好的平衡,爲大模型推理提供了更優的性價比。同時,PNV5b 實例在整機架構設計上支持最大單機 8 顆 GPU 高效擴展,大幅提升分佈式推理性能。

在 Llm 3 的推理部署測試中,在典型業務請求壓力條件下,PNV5b 的推理吞吐對比上一代 PNV4 可提升 2-3 倍;而在極端請求壓力測試下,性能可進一步提升至 0 倍。這意味着,PNV5b 實例能提供更好的性能擴展能力,讓用戶在面對大模型的業務洪峯時更加遊刃有餘。

除此之外,PNV5b 通過星星海服務器搭配最新一代 AMD CPU 平臺,提供多種實例規格,可靈活匹配大模型推理、大模型精調、推薦系統等多種場景的實例規格需求。將爲廣大用戶帶來更貼合業務的AI模型訓練和推理體驗,爲企業和開發者創造更多的價值。


相关文章

  • WordPress母公司宣佈收購Frontity 未來將不再繼續開發和維護該框架

    近日WodPess的母公司 Automttic宣佈已經收購了 Fontity,包括創始人 Pblo Postigo 和 Luis Henz 在內的 Fontity 整個團隊都將加入 Automttic。Fontity 是一箇開源的 Rect 框架,主要用於由 WodPess 所驅動的那些網站。未來...

  • VMware正式推出雲計算靈活存儲服務

    VMwe宣佈正式推出雲計算靈活存儲服務(VMwe Cloud Flex Stoge),它是針對亞馬遜雲科技AWS上的VMwe Cloud的全新託管和本機集成的分類存儲服務。客戶現在只需從VMwe雲服務控制檯點擊幾下,即可按需調配存儲容量,而無需添加主機。 VMwe Cloud Flex Stoge構...

  • 亞馬遜AWS在亞太地區(雅加達)推出AWS DataSync服務

    AWS DtSync現在面向AWS亞太地區(雅加達)區域推出。AWS DtSync是一項安全的在線數據傳輸服務,它可以簡化、自動執行和加速向AWS存儲服務和從AWS存儲服務複製數TB數據的過程,讓數據上雲更快速便捷。 AWS DtSync可以在網絡文件系統 (NFS) 共享、服務器消息數據塊 (SM...

  • HostXen雲主機全新Linux系統上線

    HostXen主要提供高性價比的雲主機服務,包括香港雲主機、美國雲主機、日本雲主機等,擁有99%的服務器在線率。根據市場環境需求,HostXen全新增加4個基於Linux底層系統,均爲64位架構,目前可以新下單/重裝系統選用。 AlmLinux-9.2 AlmLinux-8.8 Rocky-linu...

  • DigitalOcean產品價格調整通知 便宜的海外雲服務器$4/月起

    知名的美國服務器提供商DigitlOcen近日宣佈對旗下Doplets、快照等產品進行價格調整,新定價預計於2022年7月日生效。DigitlOcen本次除了調整Doplets價格外,還計劃推出一款新的海外雲服務器套餐,配有個CPU、52MB內存、500GB月流量和0GB固態硬盤,每月僅需4美元。 ...

  • HostKvm公告:香港CN2轉CTG線與寬帶流量升級 Plan3(V2)內存調升至6G

    月2日HostKm發出公告,這次不但有香港CN2轉CTG線與寬帶流量升級,而且Pln3(V2)內存調升至6G,具體公告內容如下。 一、香港CN2轉CTG線與寬帶流量升級 因市場環境和網路資源增加理由,HostKm原香港CN2業務更名爲香港CTG(大陸方向),此區域主要兼顧中國大陸方向網路。 即從20...

  • WHMCS 8.3.2版本發佈 支持自動升級更新

    WHMCS 8.3.2正式版發佈,它是WHMCS 8.3目前最新的維護版本,該版本的模板尚未進行更改,支持自動升級更新,我們也可以選擇在官網手動下載安裝。 WHMCS 8.0引入了對PHP 7.4的支持,早期版本不支持PHP 7.4。如果運行的是PHP 7.2及更高版本,則可以使用WHMCS內置的自...

  • Drupal 10計劃於2022年8月發佈

    Dupl是一箇免費的、開源的內容管理系統,它的基本特點包括易於使用、模塊化和支持最新技術的協作功能。Dupl 0計劃於2022年8月發佈,它將是Dupl 9的改進版本,帶來了諸多改進和新功能。另外,從Dupl 9升級到Dupl 0會像從Dupl 8升級到Dupl 9一樣簡單。 Dupl 0部分關鍵特...

  • ShockHosting新增日本東京機房 多款主機享五折優惠

    美國主機商ShockHosting主要提供虛擬主機、VPS主機、獨立服務器等產品服務,近期新增了日本東京機房,同時多款主機套餐享有五折優惠促銷,下面一起來看下活動方案詳情。 美國主機商ShockHosting除了這次新增的日本機房,還有美國洛杉磯、新澤西、芝加哥、達拉斯、荷蘭阿姆斯特丹、英國和澳大利...

  • Vultr市場介紹:流行應用程序和堆棧的一鍵式設置

    Vult是一家知名的海外雲服務器商,主要提供基於KVM架構的國外雲服務器產品,全球共有7個數據中心。爲了給用戶帶來更好的體驗,近期Vult Mketplce(Vult市場)正式上線,新的市場將提供一系列流行的應用程序、軟件堆棧和操作系統等,用戶只需輕鬆點擊即可將其部署到Vult基礎架構中。 如果您已...