Accessibility Statement Skip Navigation
  • 數據隱私
  • 聯繫我們
  • 發佈新聞稿
  • 新聞
  • 產品
    • 概覽
    • 美通社發佈
    • 贊助廣告
    • Cision Global Media Monitoring
    • Cision投資者關係
    • 媒體新聞室
    • 所有產品
  • 聯繫
    • 一般資訊
    • 申請諮詢
    • 合作
    • 媒體諮詢
When typing in this field, a list of search results will appear and be automatically updated as you type.

搜索您的內容

未找到結果。請更改搜索條件並重試。
  • 焦點新聞
      • 瀏覽新聞稿

      • 所有新聞稿
      • 所有上市公司
      • 所有多媒體

      • 所有多媒體
      • 所有照片
      • 所有影片
  • 商業與財經
      • 一般商業

      • 人事公告
      • 人力資源與勞動力管理
      • 企業擴張
      • 住宅房地產
      • 商業地產
      • 外包業務
      • 小型企業服務
      • 展會新聞
      • 房地產交易
      • 新產品與服務
      • 業績公佈
      • 海外房地產(非美國)
      • 牌照許可和營銷協議
      • 獎項
      • 環境、社會和治理
      • 社會責任投資
      • 訃告
      • 調查、民意測驗和研究
      • 所有 一般商業

      • 商業科技

      • 互聯網技術
      • 區塊鏈
      • 半導體
      • 外圍設備
      • 廣播技術
      • 數據分析
      • 納米技術
      • 網絡
      • 金融科技
      • 電子元件
      • 電子商務
      • 電子設計自動化
      • 電腦硬件
      • 電腦網絡
      • 電腦與電子產品
      • 電腦軟件
      • 電腦配件
      • 高科技安全
      • 所有 商業科技

      • 所有娛樂與媒體

      • 出版與信息服務
      • 圖書
      • 娛樂
      • 廣告
      • 廣播與播客
      • 藝術、文化和設計
      • 雜誌
      • 電影
      • 電視
      • 音樂
      • 所有 所有娛樂與媒體

      • 汽車與運輸

      • 供應鏈/物流
      • 卡車和公路運輸
      • 旅遊
      • 汽車
      • 海事與造船
      • 航空公司與航空
      • 航空航天與國防
      • 航空貨運
      • 運輸、卡車和鐵路
      • 鐵路與多式聯運
      • 所有 汽車與運輸

      • 財經服務和投資

      • A股東激進主義
      • 保險
      • 債券與股票評級
      • 共同基金
      • 加密貨幣
      • 合同
      • 合資企業
      • 房地產
      • 投資意見
      • 收購、合併和接管
      • 會計新聞與問題
      • 業績公佈
      • 業績預測
      • 產品
      • 破產
      • 私募
      • 紅利
      • 股東大會
      • 股票分割
      • 融資協議
      • 重組與資本結構調整
      • 銀行與金融服務
      • 銷售報告
      • 電話會議公告
      • 風險投資
      • 所有 財經服務和投資

  • 科學與技術
      • 消費科技

      • STEM(科學、技術、工程、數學)
      • 人工智能
      • 加密貨幣
      • 區塊鏈
      • 娛樂與媒體
      • 數據分析
      • 消費電子產品
      • 無線通信
      • 社交媒體
      • 移動設備/應用程序
      • 金融科技
      • 雲計算 物聯網
      • 電子商務
      • 電子設計自動化
      • 電腦硬件
      • 電腦網絡
      • 電腦與電子產品
      • 電腦軟件
      • 電腦配件
      • 所有 消費科技

      • 環境

      • 保護與回收
      • 環保產品與服務
      • 環境問題
      • 環境政策
      • 綠色科技
      • 自然災害
      • 所有 環境

      • 能源與自然資源

      • 一般製造業
      • 公用事業
      • 化學
      • 天然氣
      • 採礦
      • 採礦與金屬
      • 替代能源
      • 水務
      • 石油和天然氣發現
      • 石油和能源
      • 電力設施
      • 所有 能源與自然資源

      • 重工業和製造業

      • 一般製造業
      • 化學
      • 建築與建造
      • 採礦
      • 採礦與金屬
      • 暖通空調(供暖、通風與空調)
      • 機床、金屬加工和冶金
      • 機械
      • 煙草
      • 紙張、林產品和集裝箱
      • 紡織品
      • 航空航天與國防
      • 貴金屬
      • 農業
      • 電腦配件
      • 所有 重工業和製造業

      • 電信

      • 無線通信
      • 移動設備/應用程序
      • 網絡電話
      • 運營商和服務
      • 電信
      • 電信設備
      • 電信運營商和服務
      • 電腦網絡
      • 電腦配件
      • 所有 電信

  • 生活與健康
      • 健康

      • FDA 批准
      • 保健與醫院
      • 健康保險
      • 健身保健
      • 傳染病控制
      • 制藥業
      • 國際醫療審批
      • 心理健康
      • 牙科
      • 生物技術
      • 生物統計學
      • 臨床試驗與醫學發現
      • 輔助藥物
      • 醫療制藥
      • 醫療設備
      • 所有 健康

      • 所有娛樂與媒體

      • 出版與信息服務
      • 圖書
      • 娛樂
      • 廣告
      • 廣播與播客
      • 藝術、文化和設計
      • 雜誌
      • 電影
      • 電視
      • 音樂
      • 所有 所有娛樂與媒體

      • 旅遊

      • 休閒與旅遊
      • 客運航空
      • 戶外、露營和遠足
      • 旅遊
      • 賭博與賭場
      • 遊樂場和旅遊景點
      • 酒店和度假村
      • 所有 旅遊

      • 消費產品及零售

      • 傢具與裝修
      • 動物與寵物
      • 化妝品與個人護理
      • 啤酒、葡萄酒和烈酒
      • 大麻
      • 婚慶服務
      • 家居用品、消費品和化妝品
      • 家庭裝修
      • 家用產品
      • 時尚
      • 有機食品
      • 玩具
      • 珠寶
      • 產品召回
      • 超市
      • 辦公用品
      • 零售業
      • 非酒精飲料
      • 食品與飲料
      • 飲料
      • 餐飲業
      • 所有 消費產品及零售

      • 體育

      • 戶外、露營和遠足
      • 運動器材和配件
      • 體育
      • 體育賽事
      • 所有 體育

  • 政策與公共利益
      • 政策和公共利益

      • 企業社會責任
      • 公共安全
      • 動物福利
      • 勞工與工會
      • 教育
      • 歐洲政府
      • 環保產品與服務
      • 經濟新聞、趨勢和分析
      • 自然災害
      • 非營利
      • 所有 政策和公共利益

  • 人文與文化
      • 人文和文化

      • 兒童相關新聞
      • 多元化、公平與包容
      • 婦女相關新聞
      • 宗教
      • 殘疾人新聞
      • 男女同性戀、雙性戀和變性者
      • 老年公民
      • 西班牙語新聞
      • 退伍軍人
      • 所有 人文和文化

  • 概覽
  • 美通社發佈
  • 贊助廣告
  • Cision Global Media Monitoring
  • Cision投資者關係
  • 媒體新聞室
  • 所有產品
  • 一般資訊
  • 申請諮詢
  • 合作
  • 媒體諮詢
  • Hamburger menu
  • PR Newswire: news distribution, targeting and monitoring Home
  • 發佈新聞稿
    • 交談

    • 所有聯繫資訊
    • 聯繫我們


  • 新聞稿
  • 發佈新聞稿
  • 數據隱私
  • 焦點新聞
    • 瀏覽所有新聞
    • 所有新媒體
  • 商業與財經
    • 一般商業
    • 商業科技
    • 所有娛樂與媒體
    • 汽車與運輸
    • 財經服務和投資
  • 科學與技術
    • 消費科技
    • 環境
    • 能源與自然資源
    • 重工業和製造業
    • 電信
  • 生活與健康
    • 健康
    • 所有娛樂與媒體
    • 旅遊
    • 消費產品及零售
    • 體育
  • 政策與公共利益
  • 人文與文化
    • 人文和文化
  • 新聞稿
  • 發佈新聞稿
  • 數據隱私
  • 概覽
  • 美通社發佈
  • 贊助廣告
  • Cision Global Media Monitoring
  • Cision投資者關係
  • 媒體新聞室
  • 所有產品
  • 新聞稿
  • 發佈新聞稿
  • 數據隱私
  • 一般資訊
  • 申請諮詢
  • 合作
  • 媒體諮詢
  • 新聞稿
  • 發佈新聞稿
  • 數據隱私

WEKA 憑藉 NeuralMesh 上的 Augmented Memory Grid 衝破 AI 記憶體屏障
  • USA - English
  • Middle East - English
  • APAC - English
  • France - Français
  • Deutschland - Deutsch
  • India - English
  • India - Hindi
  • Korea - 한국어
  • Middle East - Arabic

WEKA:企業人工智能的基礎

新聞提供者

WEKA

20 11月, 2025, 06:34 CST

分享這篇文章

Share toX

分享這篇文章

Share toX

突破性記憶體擴展技術經 Oracle Cloud Infrastructure 驗證,實現推論普及化,為 NeuralMesh 客戶帶來 1000 倍記憶體容量,首個 Token 生成時間加快 20 倍

聖路易斯和加州坎貝爾 2025年11月20日 /美通社/ -- 於 SC25 大會上:AI 儲存公司 WEKA今日宣佈,正式於 NeuralMesh™ 上推出 Augmented Memory Grid™(增強記憶體網格)。這項革命性的記憶體擴展技術,旨在解決窒礙 AI 創新的根本樽頸:GPU 記憶體。該技術已在 Oracle Cloud Infrastructure (OCI) 及其他領先的 AI 雲端平台上通過驗證,能將 GPU 記憶體容量大幅擴展 1000 倍(由 GB 級提升至 PB 級),同時將首個 Token 生成時間縮短高達 20 倍。這項突破賦能 AI 開發者優化長文本推理和代理式 AI 的工作流程,顯著提升以往難以擴展的推論工作負載效率。

從創新到投產:解決 AI 記憶體牆難題
自 NVIDIA GTC 2025 亮相以來,Augmented Memory Grid 已在包括 OCI 在內的領先 AI 雲端生產環境中,經過嚴格的強化、測試與驗證。結果證實了早期測試的預期:隨著 AI 系統演進至更長、更複雜的互動——從程式碼編寫助手到研究助理及推理代理——記憶體已成為限制推論效能與經濟效益的關鍵樽頸。

Continue Reading
WEKA 的突破性 Augmented Memory Grid 現已於 NeuralMesh 上正式推出。
WEKA 的突破性 Augmented Memory Grid 現已於 NeuralMesh 上正式推出。

「我們正推出一個經 Oracle Cloud Infrastructure 及其他領先 AI 基礎設施平台驗證的成熟解決方案。」WEKA 聯合創始人兼行政總裁 Liran Zvibel 表示,「擴展代理式 AI 不僅取決於原始運算力,更在於透過智能數據路徑來解決記憶體牆問題。Augmented Memory Grid 讓客戶能在每個 GPU 上運行更多 Token,支援更多並發用戶,並為長文本工作負載解鎖全新的服務模式。OCI 的裸機基礎設施配合高性能 RDMA 網絡及 GPUDirect Storage 功能,使其成為大規模加速推論的獨特平台。」

現今的推論系統面臨一項根本限制:GPU 高頻寬記憶體 (HBM) 速度極快但容量有限,而系統 DRAM 雖空間較大但頻寬不足。一旦這兩層記憶體飽和,鍵值緩存數據便會被清除,迫使 GPU 重新運算已處理過的 Token,造成運算週期、電力與時間的浪費。

WEKA 的 Augmented Memory Grid 透過在 GPU 記憶體(通常是 HBM)與快閃儲存之間建立高速橋樑,成功突破 GPU 記憶體牆。它利用 RDMA 及 NVIDIA Magnum IO GPUDirect Storage 技術,在 GPU 記憶體與 WEKA 的 Token 倉庫之間持續傳輸鍵值緩存數據,從而達致記憶體級別的速度。這讓大型語言模型及代理式 AI 模型能夠存取更多語境資訊,無需重新運算先前的 KV Cache 或已生成的 Token,大幅提升效率與可擴展性。

經 OCI 驗證的效能與生態系統整合
獨立測試(包括在 OCI 上的驗證)已確認以下成果:

  • KV Cache 容量增加 1000 倍,同時保持接近記憶體的效能。
  • 在處理 128,000 個 Token 時,相較於重新運算預填充階段,首個 Token 生成時間加快 20 倍。
  • 在八節點叢集中錄得 750 萬次讀取 IOP 及 100 萬次寫入 IOP。

對於 AI 雲端供應商、模型供應商及企業 AI 開發者而言,這些效能提升從根本上改變了推論的經濟效益。透過消除多餘的預填充操作並維持高緩存命中率,機構可最大化租戶密度,減少閒置 GPU 週期,並顯著提高每千瓦時的投資回報率 (ROI)。模型供應商現可具成本效益地提供長文本模型服務,大幅削減輸入 Token 成本,並圍繞持久、具狀態的 AI 會話建立全新商業模式。

本次正式商用反映了 WEKA 與 NVIDIA 及 Oracle 等領先 AI 基礎設施夥伴的深度合作。該解決方案與 NVIDIA GPUDirect Storage、 NVIDIA Dynamo及 NVIDIA NIXL 緊密整合,WEKA 更為 NVIDIA Inference Transfer Library (NIXL) 開源了一個專用插件。OCI 的裸機 GPU 運算配合 RDMA 網絡及 NVIDIA GPUDirect Storage 功能,提供了 WEKA 所需的高效能基礎,確保在雲端 AI 部署中提供效能毫不妥協的 Augmented Memory Grid。

「大規模推論的經濟性是企業的重要考量。」Oracle 雲端基礎架構多雲端副總裁 Nathan Thomas 表示,「WEKA 的 Augmented Memory Grid 正面迎擊了這一挑戰。我們在 OCI 聯合測試中錄得首個 Token 生成時間加快 20 倍的提升,這不僅是效能指標,更從根本上重塑了運行 AI 工作負載的成本結構。對我們的客戶而言,這意味著部署下一代 AI 將變得更簡單、更具成本效益。」

正式商用資訊
Augmented Memory Grid 現已作為 NeuralMesh 部署的一項功能正式推出,並已上架 Oracle Cloud Marketplace,未來將支援更多雲端平台。

有意部署 Augmented Memory Grid 的機構,請瀏覽WEKA 的 Augmented Memory Grid 頁面,以了解更多解決方案詳情及資格標準。

關於 WEKA
WEKA 憑藉其智能、適應性網狀儲存系統 NeuralMesh™,正在變革機構建立、運行和擴展 AI 工作流程的方式。傳統的數據基礎設施會隨著工作負載擴展而變得更慢、更脆弱,與此不同,NeuralMesh 會隨著規模擴展而變得更快、更強、更高效,動態適應 AI 環境,為企業級 AI 和代理式 AI 創新提供靈活的基礎。NeuralMesh 深受 30% 的《財富》50 強企業信賴,幫助領先企業、AI 雲端服務供應商和 AI 開發者優化 GPU、加速擴展 AI 並降低創新成本。如欲了解更多,請瀏覽 www.weka.io 或追蹤我們的 LinkedIn 和 X。

WEKA 和 W 標誌乃 WekaIO, Inc. 的註冊商標,而此處其他商品名稱可能是其各自擁有人的商標。

SOURCE WEKA

Modal title

來自同一來源

WEKA 推出新一代 WEKApod 設備,重新定義人工智能儲存經濟效益

WEKA 推出新一代 WEKApod 設備,重新定義人工智能儲存經濟效益

於 SC25 大會上:人工智能 (AI) 儲存公司 WEKA 宣布推出新一代 WEKApod™ 設備,旨在顛覆傳統效能與成本之間的取捨關係。全新設計的 WEKApod Prime 設備透過智能化配置混合快閃記憶體架構,實現數據智能佈局,將性價比提升...

WEKA 宣佈推出為 NVIDIA BlueField-4 打造的全新 NeuralMesh 架構

WEKA 宣佈推出為 NVIDIA BlueField-4 打造的全新 NeuralMesh 架構

2025 年華盛頓 GTC 大會消息:WEKA 宣佈,正為 NVIDIA 新發布的 BlueField-4 數據處理單元 (DPU) 開發下一代 WEKA® NeuralMesh™ 智能儲存系統,此舉標誌著 AI 基礎設施架構與部署方式的革命性轉變。這種突破性方法無需獨立的 CPU...

此來源更多新聞稿

探索

電腦與電子產品

電腦與電子產品

電腦與電子產品

電腦與電子產品

電腦軟件

電腦軟件

電腦軟件

電腦軟件

相關題材的新聞稿

聯繫Cision

  • [email protected]
  • 一般資訊
  • 申請咨詢
  • 合作
  • 媒體咨詢

產品

  • Cision傳播雲平台
  • 營銷人
  • 公關
  • 投資者關係和合規
  • 代理商
  • 小型企業
  • 所有產品

關於

  • 關於美通社
  • 關係 Cision
  • 工作機會
  • 無障礙聲明
  • 亞太地區 - 簡體中文
  • 亞太地區
  • 亞太地區—繁體中文
  • 阿拉伯
  • 巴西
  • 加拿大
  • 捷克共和國
  • 丹麥
  • 芬蘭
  • 法國
  • 德國
  • 印度
  • 以色列
  • 印尼
  • 意大利
  • 墨西哥
  • 中東
  • 荷蘭
  • 挪威
  • 波蘭
  • 葡萄牙
  • 俄羅斯聯邦
  • 斯洛伐克
  • 西班牙
  • 瑞典
  • 英國
  • 美國

我的服務

  • 所有新聞稿
  • 平台

Do not sell or share my personal information:

  • Submit via [email protected] 
  • Call Privacy toll-free: 877-297-8921

聯繫Cision

產品

關於

Dịch vụ của tôi
  • 所有新聞稿
  • Platform
[email protected]
  • 使用條款
  • 隱私條款
  • 信息安全政策
  • 網站地圖
  • RSS
  • Cookie設定
  • 無障礙
版權所有 © 2025 Cision US Inc.