Linode

亞馬遜推出高性能 PyTorch 數據集庫—S3 Plugin

Editor

近日亞馬遜雲科技爲 Fcebook 的 PyToch 機器學習框架推出了一箇名爲S3 Plugin的數據集庫,旨在幫助數據科學家訪問存儲在 AWS S3(Amzon Web Seices Simple Stoge Seice) 中的數據集。它專爲低延遲而設計,S3 Plugin 爲任何規模的數據集提供了流式傳輸數據的功能,消除了提供本地存儲容量的需要。

PyToch 是一箇基於 Toch 庫的開源機器學習庫,用於計算機視覺和自然語言處理等應用,主要由 Fcebook 的 AI 研究實驗室開發。它是在修改的 BSD 許可下發布的免費開源軟件,底層由 C++ 實現。

許多深度學習軟件都建立在 PyToch 之上,包括特斯拉自動駕駛、Ube 的 Pyo 和 HuggingFce 的 Tnsfomes 等。PyToch 主要提供了兩個高級功能:

  • Tenso 計算(如 NumPy),通過圖形處理單元(GPU)進行強力加速
  • 建立在基於類型的自動微分系統上的深度神經網絡

自 206 年 0 月發佈以來,PyToch 在數據科學和開發人員社區中得到快速成長。209 年,該平臺的貢獻者數量同比增長超過 50%,達到近 200 人。根據研究機構的分析發現,209 年的每個主要的人工智能會議都有大部分論文是用 PyToch 實現的,209 年上半年,論文中 PyToch 的引用量增長了 94% 以上。

有了 PyToch 深度學習容器中的這項功能,用戶可以利用 PyToch 數據集和數據加載器 API 直接使用 S3 中的數據,而不需要先在本地存儲中下載。針對 PyToch 開發的 S3 Plugin 提供了從 Amzon S3 到 PyToch 使用數據的原生體驗,而無需在代碼中增加複雜性。

S3 Plugin 的優勢包括:

、PyToch 支持兩種不同類型的數據集,適用於 PyToch 的 S3 Plugin 可根據你的需要靈活地使用兩者;

2、S3 Plugin 可以使用各種格式的訓練數據來訓練機器學習模型。它與文件格式無關,並將 Amzon S3 上的對象呈現爲 blob,並能對從 Amzon S3 接收的輸入進行其他轉換;

3、S3 Plugin 提供了一種方法,可以使用ShuffleDtset在內存中洗數據,或者在擴展S3ItebleDtset時通過提供輸入參數shuffle_uls在內存中洗數據;

PyToch 的 S3 Plugin 提供了一種從 S3 並行傳輸數據的方法,以及對來自歸檔文件的數據流的支持。亞馬遜表示,由於該插件是 PyToch 內部接口的實現,它不需要修改現有的代碼就可以與 S3 配合使用。適用於 PyToch 的 S3 Plugin 提升了 PyToch 的易用性和靈活性,感興趣的開發者可以通過預配置的 PyToch Docke 鏡像使用,或直接從 GitHub 倉庫使用。


相关文章

  • Ubuntu 23.10將搭載Linux內核6.5

    Ubuntu 23.0 (代號爲Mntic Minotu)版本將搭載Linux內核6.5,這將是默認的內核產品。在9月6日發佈的最新每日構建ISO映像由Linux內核6.5提供支持,這也是爲那些試用Ubuntu 23.0的用戶提供的升級選項。 Linux內核6.5提供了不少新功能,如Wi-Fi 7支...

  • AlmaLinux 8.7穩定版發佈

    AlmLinux操作系統基金會近日宣佈AlmLinux OS 8.7穩定版發佈,代號爲̶Stone Smilodon̶,它支持在Intel/AMD (x86_64)、ARM64 (ch64)、IBM PowePC (ppc64le)或IBM Z (s390x)架構上運行。 Alm...

  • Java 21正式發佈 新增虛擬線程、AI接口 最新LTS版本支持8年

    9月9日,Ocle 公司宣佈推出 J2的正式版本,以及相應的 JDK 2 開發工具包,該版本是繼 JDK 7 之後最新的長期支持(LTS)版本,將獲得至少 8 年的支持。同時還宣佈對五年前發佈的 J 的長期支持已延長至 2032 年 月。 在最新的J 2 版本中, Ocle 開發團隊爲其帶來了5大功...

  • Hostinger推出了三個新的OpenLiteSpeed VPS模板

    Hostinge推出了三個新的OpenLiteSpeed VPS模板,這些模板與預配置的操作系統、Web框架和安全設置打包在一起,因此您不必從頭開始設置VPS,有效節省了VPS設置時間。 Hostinge這些新國外VPS模板全部由OpenLiteSpeed支持,使用流行的Web框架,例如Node.j...

  • Fedora Linux發行版Nobara 39發佈 優化遊戲體驗 多項功能更新

    Linux發行版Nob最近推出了39版本,主要改進了“Gmescope 合成器”,並更新了OBS Studio、部分驅動程序及Nutilus文件管理器。 Nob是一款基於Fedo的Linux發行版,支持Stem Deck等遊戲掌機,號稱專爲“Linux 遊戲玩家”優化,該系統默認使用 KDE Pls...

  • 美國主機商BuyVM宣佈收購AnyNode

    美國時間202年5月27日美國主機商AnyNode發送郵件宣佈與BuyVM合作,BuyVM收購所有AnyNode VPS客戶,所有AnyNode VPS將於202年8月日關閉。 BuyVM是託管領域的知名提供商,也是AnyNode的長期合作伙伴,收購後BuyVM會爲大家提供更高質量的服務,一箇新的虛...

  • 騰訊雲星星海SA3重磅發佈 已開放內測申請

    ​​騰訊雲星星海SA3服務器重磅發佈,騰訊雲星星海聯合AMD EPYC,引領高效計算新風向!騰訊自研服務器星星海和傳統服務器相比,星星海統一的整機方案可以支持不同的CPU主機,前瞻性的高兼容架構,統一規劃的硬件底座,可以支持未來3-5年的服務器產品演進。目前,騰訊雲官方已經開始啓動星星海SA3服務器...

  • 雅虎問答Yahoo Answers宣佈5月4日永久關閉

    4月6日雅虎旗下知名問答平臺雅虎問答(Yhoo Answes)將於202年5月4日關閉。雅虎將於4月20日開始停用該平臺,計劃停止接受新的內容提交。5月4日之後,用戶必須在6月30日之前將其發佈內容下載備份。備份結束之後,雅虎問答網頁將重定向到雅虎主頁,該平臺的所有內容將不復存在。但Yhoo不會終止...

  • 阿里雲文件存儲HDFS版將於2022年7月1日起正式商業化

    阿里雲近日宣佈文件存儲HDFS版將於2022年7月日起正式商業化。商業化後,存儲空間費用(根據使用容量計費)將按0.5元/GB/月進行收費,預置吞吐費用將按2.46元/MB/s/月進行收費,具體定價可前往阿里雲官網查看。 點擊訪問:阿里雲官網 阿里雲文件存儲HDFS版(Aps File Stoge ...

  • Krypt聖荷西機房新增獨立服務器

    Kypt是一家老牌的網站美國服務器託管公司,目前有六個機房,在今天小編郵箱收到了來自Kypt官方郵件,目前Kypt聖荷西數據中心新增了一款獨立服務器配置,並且可以享受八五折優惠,具體內容如下: 各位Kypt好友們: Kypt聖荷西數據中心(SV7)新增一款獨立服務器配置。 聖荷西數據中心默認爲優化網...