Accessibility Statement Skip Navigation
  • 數據隱私
  • 聯繫我們
  • 發佈新聞稿
  • 新聞
  • 產品
    • 概覽
    • 美通社發佈
    • 贊助廣告
    • Cision Global Media Monitoring
    • Cision投資者關係
    • 媒體新聞室
    • 所有產品
  • 聯繫
    • 一般資訊
    • 申請諮詢
    • 合作
    • 媒體諮詢
When typing in this field, a list of search results will appear and be automatically updated as you type.

搜索您的內容

未找到結果。請更改搜索條件並重試。
  • 焦點新聞
      • 瀏覽新聞稿

      • 所有新聞稿
      • 所有上市公司
      • 所有多媒體

      • 所有多媒體
      • 所有照片
      • 所有影片
  • 商業與財經
      • 一般商業

      • 人事公告
      • 人力資源與勞動力管理
      • 企業擴張
      • 住宅房地產
      • 商業地產
      • 外包業務
      • 小型企業服務
      • 展會新聞
      • 房地產交易
      • 新產品與服務
      • 業績公佈
      • 海外房地產(非美國)
      • 牌照許可和營銷協議
      • 獎項
      • 環境、社會和治理
      • 社會責任投資
      • 訃告
      • 調查、民意測驗和研究
      • 所有 一般商業

      • 商業科技

      • 互聯網技術
      • 區塊鏈
      • 半導體
      • 外圍設備
      • 廣播技術
      • 數據分析
      • 納米技術
      • 網絡
      • 金融科技
      • 電子元件
      • 電子商務
      • 電子設計自動化
      • 電腦硬件
      • 電腦網絡
      • 電腦與電子產品
      • 電腦軟件
      • 電腦配件
      • 高科技安全
      • 所有 商業科技

      • 所有娛樂與媒體

      • 出版與信息服務
      • 圖書
      • 娛樂
      • 廣告
      • 廣播與播客
      • 藝術、文化和設計
      • 雜誌
      • 電影
      • 電視
      • 音樂
      • 所有 所有娛樂與媒體

      • 汽車與運輸

      • 供應鏈/物流
      • 卡車和公路運輸
      • 旅遊
      • 汽車
      • 海事與造船
      • 航空公司與航空
      • 航空航天與國防
      • 航空貨運
      • 運輸、卡車和鐵路
      • 鐵路與多式聯運
      • 所有 汽車與運輸

      • 財經服務和投資

      • A股東激進主義
      • 保險
      • 債券與股票評級
      • 共同基金
      • 加密貨幣
      • 合同
      • 合資企業
      • 房地產
      • 投資意見
      • 收購、合併和接管
      • 會計新聞與問題
      • 業績公佈
      • 業績預測
      • 產品
      • 破產
      • 私募
      • 紅利
      • 股東大會
      • 股票分割
      • 融資協議
      • 重組與資本結構調整
      • 銀行與金融服務
      • 銷售報告
      • 電話會議公告
      • 風險投資
      • 所有 財經服務和投資

  • 科學與技術
      • 消費科技

      • STEM(科學、技術、工程、數學)
      • 人工智能
      • 加密貨幣
      • 區塊鏈
      • 娛樂與媒體
      • 數據分析
      • 消費電子產品
      • 無線通信
      • 社交媒體
      • 移動設備/應用程序
      • 金融科技
      • 雲計算 物聯網
      • 電子商務
      • 電子設計自動化
      • 電腦硬件
      • 電腦網絡
      • 電腦與電子產品
      • 電腦軟件
      • 電腦配件
      • 所有 消費科技

      • 環境

      • 保護與回收
      • 環保產品與服務
      • 環境問題
      • 環境政策
      • 綠色科技
      • 自然災害
      • 所有 環境

      • 能源與自然資源

      • 一般製造業
      • 公用事業
      • 化學
      • 天然氣
      • 採礦
      • 採礦與金屬
      • 替代能源
      • 水務
      • 石油和天然氣發現
      • 石油和能源
      • 電力設施
      • 所有 能源與自然資源

      • 重工業和製造業

      • 一般製造業
      • 化學
      • 建築與建造
      • 採礦
      • 採礦與金屬
      • 暖通空調(供暖、通風與空調)
      • 機床、金屬加工和冶金
      • 機械
      • 煙草
      • 紙張、林產品和集裝箱
      • 紡織品
      • 航空航天與國防
      • 貴金屬
      • 農業
      • 電腦配件
      • 所有 重工業和製造業

      • 電信

      • 無線通信
      • 移動設備/應用程序
      • 網絡電話
      • 運營商和服務
      • 電信
      • 電信設備
      • 電信運營商和服務
      • 電腦網絡
      • 電腦配件
      • 所有 電信

  • 生活與健康
      • 健康

      • FDA 批准
      • 保健與醫院
      • 健康保險
      • 健身保健
      • 傳染病控制
      • 制藥業
      • 國際醫療審批
      • 心理健康
      • 牙科
      • 生物技術
      • 生物統計學
      • 臨床試驗與醫學發現
      • 輔助藥物
      • 醫療制藥
      • 醫療設備
      • 所有 健康

      • 所有娛樂與媒體

      • 出版與信息服務
      • 圖書
      • 娛樂
      • 廣告
      • 廣播與播客
      • 藝術、文化和設計
      • 雜誌
      • 電影
      • 電視
      • 音樂
      • 所有 所有娛樂與媒體

      • 旅遊

      • 休閒與旅遊
      • 客運航空
      • 戶外、露營和遠足
      • 旅遊
      • 賭博與賭場
      • 遊樂場和旅遊景點
      • 酒店和度假村
      • 所有 旅遊

      • 消費產品及零售

      • 傢具與裝修
      • 動物與寵物
      • 化妝品與個人護理
      • 啤酒、葡萄酒和烈酒
      • 大麻
      • 婚慶服務
      • 家居用品、消費品和化妝品
      • 家庭裝修
      • 家用產品
      • 時尚
      • 有機食品
      • 玩具
      • 珠寶
      • 產品召回
      • 超市
      • 辦公用品
      • 零售業
      • 非酒精飲料
      • 食品與飲料
      • 飲料
      • 餐飲業
      • 所有 消費產品及零售

      • 體育

      • 戶外、露營和遠足
      • 運動器材和配件
      • 體育
      • 體育賽事
      • 所有 體育

  • 政策與公共利益
      • 政策和公共利益

      • 企業社會責任
      • 公共安全
      • 動物福利
      • 勞工與工會
      • 教育
      • 歐洲政府
      • 環保產品與服務
      • 經濟新聞、趨勢和分析
      • 自然災害
      • 非營利
      • 所有 政策和公共利益

  • 人文與文化
      • 人文和文化

      • 兒童相關新聞
      • 多元化、公平與包容
      • 婦女相關新聞
      • 宗教
      • 殘疾人新聞
      • 男女同性戀、雙性戀和變性者
      • 老年公民
      • 西班牙語新聞
      • 退伍軍人
      • 所有 人文和文化

  • 概覽
  • 美通社發佈
  • 贊助廣告
  • Cision Global Media Monitoring
  • Cision投資者關係
  • 媒體新聞室
  • 所有產品
  • 一般資訊
  • 申請諮詢
  • 合作
  • 媒體諮詢
  • Hamburger menu
  • PR Newswire: news distribution, targeting and monitoring Home
  • 發佈新聞稿
    • 交談

    • 所有聯繫資訊
    • 聯繫我們


  • 新聞稿
  • 發佈新聞稿
  • 數據隱私
  • 焦點新聞
    • 瀏覽所有新聞
    • 所有新媒體
  • 商業與財經
    • 一般商業
    • 商業科技
    • 所有娛樂與媒體
    • 汽車與運輸
    • 財經服務和投資
  • 科學與技術
    • 消費科技
    • 環境
    • 能源與自然資源
    • 重工業和製造業
    • 電信
  • 生活與健康
    • 健康
    • 所有娛樂與媒體
    • 旅遊
    • 消費產品及零售
    • 體育
  • 政策與公共利益
  • 人文與文化
    • 人文和文化
  • 新聞稿
  • 發佈新聞稿
  • 數據隱私
  • 概覽
  • 美通社發佈
  • 贊助廣告
  • Cision Global Media Monitoring
  • Cision投資者關係
  • 媒體新聞室
  • 所有產品
  • 新聞稿
  • 發佈新聞稿
  • 數據隱私
  • 一般資訊
  • 申請諮詢
  • 合作
  • 媒體諮詢
  • 新聞稿
  • 發佈新聞稿
  • 數據隱私

基於 NVIDIA BlueField-4 STX,WEKA 以更低的每 Token 成本將 Token 輸出推至極限
  • Deutschland - Deutsch
  • Korea - 한국어
  • APAC - English
  • France - Français
  • India - Hindi
  • Deutschland - English
  • USA - English

WEKA: The Foundation for Enterprise AI

新聞提供者

WEKA

18 3月, 2026, 20:05 CST

分享這篇文章

Share toX

分享這篇文章

Share toX

NeuralMesh 及 Augmented Memory Grid 與 NVIDIA STX 整合,能在相同 GPU 佔用空間下,將 Token 產量提升 6.5 倍,大減 AI 驅動機構的推理成本

加州聖荷西和加州坎貝爾2026年3月18日 /美通社/ -- 在 2026 年圖形處理器 (GPU) 技術大會 (GTC 2026) 上,人工智能 (AI) 儲存與記憶體系統公司 WEKA 今日宣佈,已將其 NeuralMesh™ 軟件與 NVIDIA STX 參考架構整合。 WEKA 基於 NeuralMesh 運行的突破性 Augmented Memory Grid™ 記憶體擴展技術,將支援 NVIDIA STX,為代理型 AI 工廠帶來高吞吐量的情境記憶儲存,使跨會話、工具和任務的長語境推理變得無縫流暢。 基於 NVIDIA STX 的 NeuralMesh 解決方案,運用 NVIDIA Vera Rubin NVL72、NVIDIA BlueField-4 及 NVIDIA Spectrum-X 以太網絡,預計能將情境記憶體的每秒 Token 生成量提升 4 至 10 倍,同時為 AI 工作負載提供每秒不少於 320 GB 讀取和 150 GB 寫入的吞吐量,較傳統 AI 儲存平台的吞吐量高出逾一倍。

Continue Reading
WEKA 與 NVIDIA 合作實現具成本效益的大規模人工智能 (AI) 推論。
WEKA 與 NVIDIA 合作實現具成本效益的大規模人工智能 (AI) 推論。

利用共享鍵值 (KV) 緩存基礎設施解決推理成本問題
擴展代理型系統,尤其在軟件工程應用領域,揭示一個殘酷真相:現今 AI 的經濟效益取決於記憶體基礎設施層。 每個大規模推理集群都會撞上記憶體牆:GPU 上有限的高頻寬記憶體 (HBM) 很快便耗盡,導致 KV 快取被逐出、情境丟失,系統被迫重複已經完成的工作。 這種架構效率低下,令推理成本急升。 解決之道在於建立共享的 KV 快取基礎設施,讓情境在代理、用戶與會話之間保持活躍。 這樣能消除重複計算、維持 Token 吞吐量,並保持效能穩定可測。 缺乏共享 KV 快取基礎設施的話,每增加一批並發用戶及代理,都會成為負累——成本上漲、體驗變差,推理集群規模越大,營運就越難。 NVIDIA 推出專為語境記憶而設的 STX,提供一套藍圖,旨在破解核心推理瓶頸。

上下文記憶體儲存:代理型 AI 工廠的基礎
透過基於 NVIDIA STX 架構聯合設計的 WEKA 解決方案,AI 雲端、企業及 AI 模型構建者,均可部署所需基建,讓 GPU 以頂尖效能運行,維持海量 Token 生成,同時提升大規模推理的能源效益及成本效益。

領先在前的 AI 創新者及雲端供應商,例如 Firmus,已開始應用 NeuralMesh 上的 Augmented Memory Grid,重塑其推理經濟模式。

Firmus 技術總監 Daniel Kearney 表示:「現實世界的 AI 並非在實驗室運行,而是要面對電力限制、散熱限制,以及源源不絕的工作負載需求。 Firmus 正是為此而生。 與 NVIDIA AI 基礎設施雙劍合璧之下,WEKA Augmented Memory Grid 可於大規模運行時,實現每秒 Token 數提升 6.5 倍,首個 Token 生成時間 (TTFT) 加快 4 倍,證明在相同 GPU 配置下,效能可提升至更高層次。 隨著 NeuralMesh 和 Augmented Memory Grid 整合到我們與 NVIDIA 一致的 AI Factory 和 NVIDIA STX 參考架構中,就能提供最快的情境記憶體網絡,實現可預測且高效的大規模推理。」

NeuralMesh 與 NVIDIA STX:專為代理型 AI 而設
NeuralMesh 是 WEKA 建基於超過 170 項專利的智能自適應儲存系統。 這將貫穿全棧 STX 參考架構,為企業提供所需的新一代儲存方案,旨在將高性能 AI 數據服務標準化,從而加快實現代理型 AI 的價值。 WEKA 的 Augmented Memory Grid 是專為擴展記憶體而設的技術層,能於 GPU 記憶體以外,將 KV 快取整合成池並持久保存。即使推理工作負載不斷增加,長情境會話依然穩定,並發量亦能維持高水平。 Augmented Memory Grid 於 GTC 2025 首次亮相,今日起正式向 NeuralMesh 客戶全面供應。該技術已在 Supermicro 平台上,搭配 NVIDIA Grace 中央處理器 (CPU) 及 BlueField-3 數據處理單元 (DPU) 完成驗證,能帶來多項提升 AI 成本效益的優勢,包括:

  • 用戶體驗,大幅躍升:NeuralMesh 上的 Augmented Memory Grid 能將首個 Token 生成時間大幅縮短 4 至 20 倍,確保 AI 代理及應用程式在真實負載下依然反應迅速。
  • 相同硬件,收益更高:毋須增建基礎設施,每個 GPU 就能多處理 6.5 倍的 Token。
  • 規模擴張,效能恒久:隨著會話、代理及情境窗口增加,Augmented Memory Grid 依然能維持高 KV 快取命中率,避免純 DRAM 架構出現效能急跌的瓶頸。
  • GPU 原生效率:整合 BlueField-4 能將儲存數據路徑從 CPU 卸載,讓 GPU 全速運算,並消除輸入/輸出 (I/O) 瓶頸從此絕跡。

WEKA 聯合創始人兼行政總裁 Liran Zvibel 表示:「隨著編碼大型語言模型 (LLM) 不斷進步,軟件工程領域對代理型 AI 應用的採納程度可謂前所未見,生產力因此提升了 100 到 1000 倍。 當編碼助手反覆調用近乎相同的代碼庫及提示時,WEKA 的 Augmented Memory Grid 會重複使用已快取的語境,即使語境窗口長度已發展至難以置信,亦不用強制進行冗餘的預填充。 此舉大幅縮短回應時間,亦讓同一基礎設施上支援的並發用戶數目顯著增加。 WEKA 在一年多前便率先洞悉市場對情境記憶儲存的需求,並於 GTC 2025 推出 Augmented Memory Grid。 如今,NVIDIA STX 的出現,為企業打開大門,讓其能在最先進的 NVIDIA Vera Rubin 架構(包括 NVIDIA BlueField-4 及 NVIDIA Spectrum-X 以太網絡)上,運行儲存及記憶體擴展基礎設施。 為 NVIDIA STX 在 NeuralMesh 上運行 Augmented Memory Grid,將帶來無與倫比的效能及效率,直接實現顛覆市場的 AI 成本效益。」

供應情況

WEKA 的 Augmented Memory Grid 現已隨 NeuralMesh 一併正式推出市場。

今天對記憶體高牆視而不見的企業,日後將會面對更艱難、更昂貴的擴展挑戰。 隨著代理型工作負載增加,情境窗口不斷擴大,純 DRAM 架構將面對成本持續疊加的問題:每新增一個並發用戶或會話,重算開銷、GPU 閒置時間及營運成本便隨之上升。 現在就為持久 KV 快取規劃架構的企業,將比那些等待觀望的對手取得結構性成本及效能優勢。

如欲進一步了解 NeuralMesh,請瀏覽:weka.io/NeuralMesh。
如欲進一步了解 Augmented Memory Grid,請瀏覽:weka.io/augmented-memory-grid。

企業可瀏覽 weka.io/nvidia 獲取更多資訊,或親臨 GTC 2026 大會 WEKA 的 #1034 展位參觀。

關於 WEKA
WEKA 正憑藉其自適應智能網格儲存系統 NeuralMesh™ by WEKA®,徹底革新機構建立、運行和擴展 AI 工作流程的模式。 有別於傳統數據基礎設施會隨著工作負載擴展而變得緩慢不穩,NeuralMesh 在擴容時反而會變得更快速、更穩健、更高效。它能動態適應 AI 環境,為企業 AI 及代理型 AI 的創新,提供靈活穩固的基石。 NeuralMesh 備受財富 50 強中 30% 企業的信賴,致力協助頂尖企業、AI 雲端供應商及 AI 建構者,充分發揮 GPU 效能、加快 AI 擴展步伐,並降低創新成本。 在 www.weka.io 了解更多,或在 LinkedIn 及 X 與我們聯繫。

WEKA 及 W 標誌為 WekaIO, Inc. 的註冊商標。本文中出現的其他商業名稱,可能為其各自擁有者的商標。

SOURCE WEKA

Modal title

來自同一來源

WEKA 憑藉 NeuralMesh 上的 Augmented Memory Grid 衝破 AI 記憶體屏障

WEKA 憑藉 NeuralMesh 上的 Augmented Memory Grid 衝破 AI 記憶體屏障

於 SC25 大會上:AI 儲存公司 WEKA今日宣佈,正式於 NeuralMesh™ 上推出 Augmented Memory Grid™(增強記憶體網格)。這項革命性的記憶體擴展技術,旨在解決窒礙 AI 創新的根本樽頸:GPU 記憶體。該技術已在 Oracle Cloud...

WEKA 推出新一代 WEKApod 設備,重新定義人工智能儲存經濟效益

WEKA 推出新一代 WEKApod 設備,重新定義人工智能儲存經濟效益

於 SC25 大會上:人工智能 (AI) 儲存公司 WEKA 宣布推出新一代 WEKApod™ 設備,旨在顛覆傳統效能與成本之間的取捨關係。全新設計的 WEKApod Prime 設備透過智能化配置混合快閃記憶體架構,實現數據智能佈局,將性價比提升...

此來源更多新聞稿

探索

人工智能

人工智能

電腦與電子產品

電腦與電子產品

電腦與電子產品

電腦與電子產品

電腦軟件

電腦軟件

相關題材的新聞稿

聯繫Cision

  • [email protected]
  • 一般資訊
  • 申請咨詢
  • 合作
  • 媒體咨詢

產品

  • Cision傳播雲平台
  • 營銷人
  • 公關
  • 投資者關係和合規
  • 代理商
  • 小型企業
  • 所有產品

關於

  • 關於美通社
  • 關係 Cision
  • 工作機會
  • 無障礙聲明
  • 亞太地區 - 簡體中文
  • 亞太地區
  • 亞太地區—繁體中文
  • 阿拉伯
  • 巴西
  • 加拿大
  • 捷克共和國
  • 丹麥
  • 芬蘭
  • 法國
  • 德國
  • 印度
  • 以色列
  • 印尼
  • 意大利
  • 墨西哥
  • 中東
  • 荷蘭
  • 挪威
  • 波蘭
  • 葡萄牙
  • 俄羅斯聯邦
  • 斯洛伐克
  • 西班牙
  • 瑞典
  • 英國
  • 美國

我的服務

  • 所有新聞稿
  • 平台

Do not sell or share my personal information:

  • Submit via [email protected] 
  • Call Privacy toll-free: 877-297-8921

聯繫Cision

產品

關於

Dịch vụ của tôi
  • 所有新聞稿
  • Platform
[email protected]
  • 使用條款
  • 隱私條款
  • 信息安全政策
  • 網站地圖
  • RSS
  • Cookie設定
  • 無障礙
版權所有 © 2026 Cision US Inc.