Linode

騰訊雲異構計算平臺全面支持Llama 3 助力一鍵部署和性能翻倍

Editor

近日,號稱史上最強大的開源模型——Met Llm 3 正式發佈。伴隨着日新月異的模型生態,騰訊雲異構計算平臺作爲覆蓋90%+大模型客戶的AI底座,現已做好充足的準備,圍繞Llm 3系列模型,提供從基礎設施到編排調度的智算產品矩陣,爲企業及開發者提供更快部署、更強性能和更高吞吐的全鏈路解決方案。

一、更快部署 通過 HAI 創建 Llm 3 僅需 3 分鐘

隨着大模型時代的到來,應用有望生長出更大價值。如何取得先發優勢、優質的模型能力是構建AI應用核心競爭力的關鍵。爲了解決中小企業及開發者在AI應用上擔心的敏捷部署、成本效益、數據安全等難題,我們推出了全新的即插即用的 GPU 應用服務產品——高性能應用服務 HAI 。不僅提供即插即用的便捷性,還支持 AI 模型在雲端的私有化部署,確保在有豐富模型選擇的同時,數據安全也能得到嚴格保護。

在 Met 發佈 Llm 3 後,騰訊雲 HAI 第一時間支持了 Llm 3 的一鍵部署。通過 HAI 僅需 3 分鐘,中小企業及開發者可以輕鬆實現基於 Llm 3 的應用創作與開發,將其應用於各種場景,如智能客服、內容創作、文本分析等,提升產品競爭力或企業運營效率。

騰訊雲 HAI 提供一鍵即得的澎湃算力與常見環境,助力中小企業及開發者快速部署 LLM、AI 作畫、數據科學等高性能應用,原生集成配套的開發工具與組件,大幅提高應用層的開發生產效率。此前已支持 ChtGLM 系列、Stble Diffusion、Llm 2 等豐富主流模型,同時支持 Notebook、WebUI 等多種圖形化算力交互模式,以應用爲核心降低雲原生 AI 應用落地門檻。

二、更強性能 全新實例 Llm 3 推理性能提高 2-0 倍

在硬件層面,騰訊雲推出的最新一代異構計算 GPU 實例 PNV5b,圍繞 Llm 3 等大模型場景,將AI推理部署性價比提升至新的高度。

Llm 3的模型特點與 Llm 2 十分類似,支持 GQA 機制降低大模型推理過程中的 KV cche 顯存開銷。PNV5b實例採用最新一代 GPU,單卡搭配 48GB 顯存,在算力和顯存匹配上做到了更好的平衡,爲大模型推理提供了更優的性價比。同時,PNV5b 實例在整機架構設計上支持最大單機 8 顆 GPU 高效擴展,大幅提升分佈式推理性能。

在 Llm 3 的推理部署測試中,在典型業務請求壓力條件下,PNV5b 的推理吞吐對比上一代 PNV4 可提升 2-3 倍;而在極端請求壓力測試下,性能可進一步提升至 0 倍。這意味着,PNV5b 實例能提供更好的性能擴展能力,讓用戶在面對大模型的業務洪峯時更加遊刃有餘。

除此之外,PNV5b 通過星星海服務器搭配最新一代 AMD CPU 平臺,提供多種實例規格,可靈活匹配大模型推理、大模型精調、推薦系統等多種場景的實例規格需求。將爲廣大用戶帶來更貼合業務的AI模型訓練和推理體驗,爲企業和開發者創造更多的價值。


相关文章

  • 微軟.NET 7正式發佈 適用於Windows/macOS/Linux

    微軟近日推出了.NET 7正式版,它是標準期限支持 (STS) 版本,將支持8個月而非36個月。現在可用於Windows、mcOS和Linux,這個版本的特點是有大量的增強功能和新功能。 .NET 7爲應用程序帶來了更高的性能和C# /F# 7、.NET MAUI、ASP.NET Coe/Blzo、...

  • 微軟宣佈在.NET SDK中內置了對.NET應用容器化的支持

    近日,微軟宣佈在.NET SDK中內置了對.NET應用容器化的支持。公告指出,容器已經成爲在雲中分發和運行各種應用程序和服務的最簡單的方式之一。早在幾年前,.NET運行時就已經針對容器進行了強化。現在,開發人員可通過dotnet publish創建應用程序的容器化版本。 .NET SDK是一組庫和工...

  • Vultr推出NVIDIA GH200 Grace Hopper超級芯片

    近日,Vult宣佈NVIDIA GH200 Gce Hoppe超級芯片即將面向全球客戶推出,NVIDIA的芯片提供了前所未有的性能和效率水平,標誌着加速計算和生成式 AI 領域的重大飛躍。 :Vult官網查看詳情 、NVIDIA GH200的強大功能 NVIDIA GH200 Gce Hoppe超級...

  • Linode雲再添兩個重要免費資源 雲防火牆和私有vlan文檔

    Linode一直以來都可以算是國外VPS行業的領導者,在性能方面一直都是非常優秀的,曾有站長戲稱爲VPS行業的“高富帥”,除了價格貴點,其他沒毛病。近期Linode再出新聞,爲Linode雲平臺增加了兩項重要的免費資源。通過在Linode網絡過濾流量,雲防火牆可以讓你更好地控制誰可以訪問你的web應...

  • Gname網站防護業務上線 有7天免費體驗版可選

    爲了保護和加速您的網站,域名註冊商Gnme推出新業務【網站防護】正式上線。Gnme網站防護包含體驗版、專業版和企業版套餐,其中體驗版提供7天免費體驗最多添加0條域名。 《Gnme官網選購》 Gnme網站防護可保護和加速任何線上網站,會自動優化您的網頁傳送,以便您的訪問者獲得最快的頁面加載時間和最佳性...

  • 阿里雲手動備份數據存儲免費優惠將於9月14日結束

    阿里雲近日發佈通知稱,數據庫備份DBS爲雲數據庫提供的“手動備份”存儲免費優惠即將結束,“手動備份”可能會產生費用,請特別關注。 執行時間:2022年9月4日 00:00:00 (UTC+8) 起 影響範圍:阿里雲RDS實例、MongoDB實例 執行內容:“手動備份”產生的存儲消耗不再享受免費優惠,...

  • Python 3.9.10和Python 3.10.2版本發佈

    Python是一款面向對象、直譯式計算機程序設計語言,具有非常簡潔而清晰的語法特點,幾乎可以在所有的操作系統中運行。近期,Python發佈了3.9.0和3.0.2版本,它們包含了一些新的特性和優化。 Python 3.0.2是Python 3.0的第2個維護版本,主要解決了在使用Cython時可能發...

  • 阿里雲服務器ECS快照極速可用功能降價通知

    阿里雲日前發佈了雲服務器ECS快照極速可用功能降價通知,自2023年0月2日:00起,快照極速可用功能的其中兩個收費項:極速可用存儲(.00 元/GB/月)和快照極速可用次數(.00 元/次),價格將均調整爲0;快照存儲費(0.2 元/GB/月)保持不變。 阿里雲ECS快照能力全面升級,用戶無需額外...

  • Canonical宣佈推出針對英特爾酷睿CPU優化的Ubuntu內核

    Cnonicl近日宣佈,在支持TSN和TCC的英特爾酷睿處理器上優化的實時Ubuntu內核可用。今年2月早些時候,Cnonicl發佈消息稱爲Ubuntu 22.04 LTS具有Ubuntu Po訂閱的用戶提供實時Ubuntu內核,這個實時內核爲企業的限時工作負載提供了端到端的安全性和可靠性。 現在,...

  • OpenSSL 3.0版本正式發佈 採用Apache 2.0許可證授權

    經過三年的開發工作,OpenSSL 3.0正式版於近日發佈,該版本可以作爲這個廣泛使用的SSL庫的一箇重要更新。本次更新帶來了更大的可擴展性,各種代碼清理和廢棄,在架構上也做了改進,此外OpenSSL 3.0已經過渡到Apche 2.0許可下發布。 OpenSSL作爲運行SSL證書的加密條件,本次發...