Accessibility Statement Skip Navigation
  • 數據隱私
  • 聯繫我們
  • 發佈新聞稿
  • 新聞
  • 產品
    • 概覽
    • 美通社發佈
    • 贊助廣告
    • Cision Global Media Monitoring
    • Cision投資者關係
    • 媒體新聞室
    • 所有產品
  • 聯繫
    • 一般資訊
    • 申請諮詢
    • 合作
    • 媒體諮詢
When typing in this field, a list of search results will appear and be automatically updated as you type.

搜索您的內容

未找到結果。請更改搜索條件並重試。
  • 焦點新聞
      • 瀏覽新聞稿

      • 所有新聞稿
      • 所有上市公司
      • 所有多媒體

      • 所有多媒體
      • 所有照片
      • 所有影片
  • 商業與財經
      • 一般商業

      • 人事公告
      • 人力資源與勞動力管理
      • 企業擴張
      • 住宅房地產
      • 商業地產
      • 外包業務
      • 小型企業服務
      • 展會新聞
      • 房地產交易
      • 新產品與服務
      • 業績公佈
      • 海外房地產(非美國)
      • 牌照許可和營銷協議
      • 獎項
      • 環境、社會和治理
      • 社會責任投資
      • 訃告
      • 調查、民意測驗和研究
      • 所有 一般商業

      • 商業科技

      • 互聯網技術
      • 區塊鏈
      • 半導體
      • 外圍設備
      • 廣播技術
      • 數據分析
      • 納米技術
      • 網絡
      • 金融科技
      • 電子元件
      • 電子商務
      • 電子設計自動化
      • 電腦硬件
      • 電腦網絡
      • 電腦與電子產品
      • 電腦軟件
      • 電腦配件
      • 高科技安全
      • 所有 商業科技

      • 所有娛樂與媒體

      • 出版與信息服務
      • 圖書
      • 娛樂
      • 廣告
      • 廣播與播客
      • 藝術、文化和設計
      • 雜誌
      • 電影
      • 電視
      • 音樂
      • 所有 所有娛樂與媒體

      • 汽車與運輸

      • 供應鏈/物流
      • 卡車和公路運輸
      • 旅遊
      • 汽車
      • 海事與造船
      • 航空公司與航空
      • 航空航天與國防
      • 航空貨運
      • 運輸、卡車和鐵路
      • 鐵路與多式聯運
      • 所有 汽車與運輸

      • 財經服務和投資

      • A股東激進主義
      • 保險
      • 債券與股票評級
      • 共同基金
      • 加密貨幣
      • 合同
      • 合資企業
      • 房地產
      • 投資意見
      • 收購、合併和接管
      • 會計新聞與問題
      • 業績公佈
      • 業績預測
      • 產品
      • 破產
      • 私募
      • 紅利
      • 股東大會
      • 股票分割
      • 融資協議
      • 重組與資本結構調整
      • 銀行與金融服務
      • 銷售報告
      • 電話會議公告
      • 風險投資
      • 所有 財經服務和投資

  • 科學與技術
      • 消費科技

      • STEM(科學、技術、工程、數學)
      • 人工智能
      • 加密貨幣
      • 區塊鏈
      • 娛樂與媒體
      • 數據分析
      • 消費電子產品
      • 無線通信
      • 社交媒體
      • 移動設備/應用程序
      • 金融科技
      • 雲計算 物聯網
      • 電子商務
      • 電子設計自動化
      • 電腦硬件
      • 電腦網絡
      • 電腦與電子產品
      • 電腦軟件
      • 電腦配件
      • 所有 消費科技

      • 環境

      • 保護與回收
      • 環保產品與服務
      • 環境問題
      • 環境政策
      • 綠色科技
      • 自然災害
      • 所有 環境

      • 能源與自然資源

      • 一般製造業
      • 公用事業
      • 化學
      • 天然氣
      • 採礦
      • 採礦與金屬
      • 替代能源
      • 水務
      • 石油和天然氣發現
      • 石油和能源
      • 電力設施
      • 所有 能源與自然資源

      • 重工業和製造業

      • 一般製造業
      • 化學
      • 建築與建造
      • 採礦
      • 採礦與金屬
      • 暖通空調(供暖、通風與空調)
      • 機床、金屬加工和冶金
      • 機械
      • 煙草
      • 紙張、林產品和集裝箱
      • 紡織品
      • 航空航天與國防
      • 貴金屬
      • 農業
      • 電腦配件
      • 所有 重工業和製造業

      • 電信

      • 無線通信
      • 移動設備/應用程序
      • 網絡電話
      • 運營商和服務
      • 電信
      • 電信設備
      • 電信運營商和服務
      • 電腦網絡
      • 電腦配件
      • 所有 電信

  • 生活與健康
      • 健康

      • FDA 批准
      • 保健與醫院
      • 健康保險
      • 健身保健
      • 傳染病控制
      • 制藥業
      • 國際醫療審批
      • 心理健康
      • 牙科
      • 生物技術
      • 生物統計學
      • 臨床試驗與醫學發現
      • 輔助藥物
      • 醫療制藥
      • 醫療設備
      • 所有 健康

      • 所有娛樂與媒體

      • 出版與信息服務
      • 圖書
      • 娛樂
      • 廣告
      • 廣播與播客
      • 藝術、文化和設計
      • 雜誌
      • 電影
      • 電視
      • 音樂
      • 所有 所有娛樂與媒體

      • 旅遊

      • 休閒與旅遊
      • 客運航空
      • 戶外、露營和遠足
      • 旅遊
      • 賭博與賭場
      • 遊樂場和旅遊景點
      • 酒店和度假村
      • 所有 旅遊

      • 消費產品及零售

      • 傢具與裝修
      • 動物與寵物
      • 化妝品與個人護理
      • 啤酒、葡萄酒和烈酒
      • 大麻
      • 婚慶服務
      • 家居用品、消費品和化妝品
      • 家庭裝修
      • 家用產品
      • 時尚
      • 有機食品
      • 玩具
      • 珠寶
      • 產品召回
      • 超市
      • 辦公用品
      • 零售業
      • 非酒精飲料
      • 食品與飲料
      • 飲料
      • 餐飲業
      • 所有 消費產品及零售

      • 體育

      • 戶外、露營和遠足
      • 運動器材和配件
      • 體育
      • 體育賽事
      • 所有 體育

  • 政策與公共利益
      • 政策和公共利益

      • 企業社會責任
      • 公共安全
      • 動物福利
      • 勞工與工會
      • 教育
      • 歐洲政府
      • 環保產品與服務
      • 經濟新聞、趨勢和分析
      • 自然災害
      • 非營利
      • 所有 政策和公共利益

  • 人文與文化
      • 人文和文化

      • 兒童相關新聞
      • 多元化、公平與包容
      • 婦女相關新聞
      • 宗教
      • 殘疾人新聞
      • 男女同性戀、雙性戀和變性者
      • 老年公民
      • 西班牙語新聞
      • 退伍軍人
      • 所有 人文和文化

  • 概覽
  • 美通社發佈
  • 贊助廣告
  • Cision Global Media Monitoring
  • Cision投資者關係
  • 媒體新聞室
  • 所有產品
  • 一般資訊
  • 申請諮詢
  • 合作
  • 媒體諮詢
  • Hamburger menu
  • PR Newswire: news distribution, targeting and monitoring Home
  • 發佈新聞稿
    • 交談

    • 所有聯繫資訊
    • 聯繫我們


  • 新聞稿
  • 發佈新聞稿
  • 數據隱私
  • 焦點新聞
    • 瀏覽所有新聞
    • 所有新媒體
  • 商業與財經
    • 一般商業
    • 商業科技
    • 所有娛樂與媒體
    • 汽車與運輸
    • 財經服務和投資
  • 科學與技術
    • 消費科技
    • 環境
    • 能源與自然資源
    • 重工業和製造業
    • 電信
  • 生活與健康
    • 健康
    • 所有娛樂與媒體
    • 旅遊
    • 消費產品及零售
    • 體育
  • 政策與公共利益
  • 人文與文化
    • 人文和文化
  • 新聞稿
  • 發佈新聞稿
  • 數據隱私
  • 概覽
  • 美通社發佈
  • 贊助廣告
  • Cision Global Media Monitoring
  • Cision投資者關係
  • 媒體新聞室
  • 所有產品
  • 新聞稿
  • 發佈新聞稿
  • 數據隱私
  • 一般資訊
  • 申請諮詢
  • 合作
  • 媒體諮詢
  • 新聞稿
  • 發佈新聞稿
  • 數據隱私

WEKA 與 Oracle Cloud Infrastructure 證實長上下文人工智能推論可令吞吐量提升 10 倍

  • Middle East - Arabic
  • Deutschland - Deutsch
  • USA - English
  • Middle East - English
  • France - Français
  • Korea - 한국어
  • APAC - English
  • India - Hindi
(PRNewsfoto/WekaIO)

新聞提供者

WEKA

10 6月, 2026, 06:00 CST

分享這篇文章

Share toX

分享這篇文章

Share toX

在 OCI H100 基礎設施上進行的聯合基準測試顯示,在不增加圖形處理器的情況下,並發用戶數目提升 10 倍,Token 吞吐量提高 10 倍,Token 服務量增加 7 倍

加州坎貝爾2026年6月10日 /美通社/ -- 人工智能 (AI) 數據與記憶體基礎設施公司 WEKA 今日發佈生產規模的基準測試,結果顯示機構在相同圖形處理器 (GPU) 佔用空間下,可服務更多用戶及 Token,從而提升長上下文人工智能推論的經濟效益。 基準測試表明,於 Oracle Cloud Infrastructure (OCI) 上使用配備 Augmented Memory Grid™ (增強記憶體網格) 的 WEKA NeuralMesh™ 平台,在不增加基礎設施的情況下,相比純動態隨機存取記憶體 (DRAM) 配置,能服務多 10 倍的並發用戶、提供高 10 倍的 Token 吞吐量,並讓每個圖形處理器多產生 7 倍 Token。 上述結果經由一個配備 100,000 Token 上下文窗口的 9 節點 OCI 裸機 H100 集群驗證屬實。

Oracle Cloud Infrastructure 軟件開發高級總監 Pablo Selem 說:「企業人工智能工作負載正將上下文窗口及圖形處理器使用率推向新極限。 這些基準測試顯示,在 OCI 上配備 Augmented Memory Grid 的 WEKA NeuralMesh 平台如何幫助消除記憶體瓶頸,使客戶無需單純增加更多圖形處理器,也能支援規模更大、要求更高的推論工作負載。」

改變推論經濟效益的三項成果
該成果在裸機 H100 集群(9 個節點、72 個圖形處理器、100,000 個 Token 上下文窗口、數以千計並發用戶)上經過生產規模驗證,OCI 上配備 Augmented Memory Grid 的 NeuralMesh 交出以下成績:

  • 無需增加基礎設施,服務的並發用戶數提升 10 倍。配備 Augmented Memory Grid 的 NeuralMesh 可擴展至超過 5,000 名並發用戶,反觀純動態隨機存取記憶體配置僅能容納約 600 名。 此做法將活躍快取工作集從 8.64 TiB 動態隨機存取記憶體擴大到 287 TiB 可用非揮發性記憶體表達 (NVMe),從而避免快取飽和時出現的性能急劇下降。 此外,每個圖形處理器能服務更多用戶,代表相同投資可發揮更大價值。
  • Token 吞吐量高出 10 倍。 集群中的每個圖形處理器都能輸出更多結果。在 OCI 上,配備 Augmented Memory Grid 的 NeuralMesh 每秒可處理約 200 萬 Token,而純動態隨機存取記憶體基準配置每秒處理不到 200,000 Token。 對於運行實時人工智能功能,包括搜尋、摘要、程式碼輔助及多輪代理的產品團隊,吞吐量直接決定最多能服務多少用戶、功能回應有多快,以及基礎設施能支撐多少收入。
  • Token 服務量激增 7 倍。 大規模運行時,每個 Token 的成本得以降低。在一個涉及 2,400 名用戶的 1 小時測試中,配備 Augmented Memory Grid 的 NeuralMesh 處理了 50 億 Token,而純動態隨機存取記憶體基準配置只處理了 7 億 Token。 對運行代理型工作流程的機構來說,動態隨機存取記憶體飽和會因持續重複運算而耗盡圖形處理器效能,直接影響每個 Token 的成本及投資回報率 (ROI)。

WEKA 行政總裁 Liran Zvibel 表示:「推論瓶頸在於圖形處理器能使用多少有效記憶體。 這些結果證明,人工智能 Token 的經濟效益問題無法單靠硬件解決,而是必須消除記憶體牆,這才是真正限制現有硬件能力的瓶頸。 在 OCI 上運行配備 Augmented Memory Grid 的 NeuralMesh,能以極具成本效益的方式,為客戶呈獻幾何級數增長的 Token 產能。」

運用上下文記憶體基礎設施,改變人工智能經濟效益
隨著推論需求增長,人工智能基礎架構的低效率問題會不斷加劇。 每次鍵值 (KV) 快取被逐出都會帶來代價:消耗圖形處理器週期、增加延遲、影響用戶體驗,以及提高每個所服務 Token 的成本。 對於輸入動輒達 100,000 Token 或以上的長上下文及代理型工作負載而言,這筆代價絕非無關痛癢的誤差。 這直接撼動每個運行生產級人工智能的機構之單位經濟模型。

Augmented Memory Grid 作為 NeuralMesh 的一項功能,從架構層面解決問題,把鍵值快取與本地圖形處理器記憶體分離,並儲存在一個可供整個集群存取的高效能 Token 倉庫中。 任何主機都能在不影響快取命中率的情況下服務任何工作階段,擺脫了僵化工作階段黏性束縛,同時提供比動態隨機存取記憶體更優越的效能,改善負載平衡,且隨著並發數增加而實現流暢的橫向擴展。 最終帶來人工智能代理所需的持久上下文記憶體,並掌握成本槓桿,令長上下文推論得以在經濟可行的前提下實現大規模運作。

生產級實證
OCI 已於 2026 年 5 月 13 日,在其人工智能與數據科學網誌 (AI & Data Science blog) 上刊載了完整的基準測試方法、系統配置及結果。 這些在 9 節點 OCI 裸機 H100 集群上進行的基準測試,超越了前一階段的驗證結果。前一階段證明了鍵值快取容量增加 1,000 倍,而在 128,000 Token 下,達到首個 Token 的時間縮短高達 20 倍。 這最新階段測試了生產環境中推論的全面經濟效益,包括並發密度、持續吞吐量、快取持久性,以及在高負載下需求突增時的服務水平目標 (SLO) 穩定性。

登陸 Oracle Marketplace
配備 Augmented Memory Grid 的 NeuralMesh 現已全面供應給 WEKA 客戶,並已在Oracle Marketplace上架,OCI 為 WEKA 的獨家雲端發佈合作夥伴。 在 OCI 上運行長上下文推論的機構,現可部署一套既經認證亦可即時投產的架構。 如欲了解更多關於 OCI 及 WEKA Augmented Memory Grid 基準測試的資訊,請參閱 OCI 網誌:https://blogs.oracle.com/ai-and-datascience/scaling-long-context-inference-on-oci-with-wekas-augmented-memory-grid。

關於 WEKA
WEKA 是專注於人工智能數據與記憶體基礎設施的公司,正在革新代理型人工智能的經濟效益。 NeuralMesh™ 平台融合高效能數據儲存與擴充的圖形處理器記憶體,為企業、人工智能雲端服務商及人工智能建構者提供統一基礎,以應對訓練、推論及代理型工作負載。 透過 Augmented Memory Grid,NeuralMesh 能把圖形處理器記憶體容量擴展 1,000 倍,將達到首個 Token 的時間縮短高達 20 倍,並在相同圖形處理器佔用空間下服務多 10 倍的並發用戶,這些結果已在生產基準測試中得到證實。 WEKA 深受《財富》50 強 (Fortune 50) 中三成企業的信賴,能幫助機構加快人工智能的規模化部署、提升圖形處理器的使用效率,並降低每服務一個 Token 所帶來的成本。 歡迎瀏覽 www.weka.io 以了解更多,亦可於 LinkedIn 和 X 上關注我們。

WEKA 及 W 標誌為 WekaIO, Inc. 的註冊商標。本文中出現的其他商業名稱,可能為其各自擁有者的商標。

SOURCE WEKA

Modal title

來自同一來源

WEKA 推出一體化 NVIDIA AI 數據平台解決方案,將 AI 工廠部署時間由數月大幅減至數分鐘

WEKA 推出一體化 NVIDIA AI 數據平台解決方案,將 AI 工廠部署時間由數月大幅減至數分鐘

在 GTC 2026 上: AI 儲存與記憶體系統的公司 WEKA 今日宣布,其企業級 NeuralMesh™ AI 數據平台 (AIDP) 正式全面推出。該平台提供可組合的高性能基礎架構,專為 AI 工廠部署而優化。 該解決方案基於 NVIDIA AI...

基於 NVIDIA BlueField-4 STX,WEKA 以更低的每 Token 成本將 Token 輸出推至極限

基於 NVIDIA BlueField-4 STX,WEKA 以更低的每 Token 成本將 Token 輸出推至極限

在 2026 年圖形處理器 (GPU) 技術大會 (GTC 2026) 上,人工智能 (AI) 儲存與記憶體系統公司 WEKA 今日宣佈,已將其 NeuralMesh™ 軟件與 NVIDIA STX 參考架構整合。 WEKA 基於 NeuralMesh 運行的突破性 Augmented...

此來源更多新聞稿

探索

人工智能

人工智能

電腦硬件

電腦硬件

電腦硬件

電腦硬件

電腦與電子產品

電腦與電子產品

相關題材的新聞稿

聯繫Cision

  • [email protected]
  • 一般資訊
  • 申請咨詢
  • 合作
  • 媒體咨詢

產品

  • Cision傳播雲平台
  • 營銷人
  • 公關
  • 投資者關係和合規
  • 代理商
  • 小型企業
  • 所有產品

關於

  • 關於美通社
  • 關係 Cision
  • 工作機會
  • 無障礙聲明
  • 亞太地區 - 簡體中文
  • 亞太地區
  • 亞太地區—繁體中文
  • 阿拉伯
  • 巴西
  • 加拿大
  • 捷克共和國
  • 丹麥
  • 芬蘭
  • 法國
  • 德國
  • 印度
  • 以色列
  • 印尼
  • 意大利
  • 墨西哥
  • 中東
  • 荷蘭
  • 挪威
  • 波蘭
  • 葡萄牙
  • 俄羅斯聯邦
  • 斯洛伐克
  • 西班牙
  • 瑞典
  • 英國
  • 美國

我的服務

  • 所有新聞稿
  • 平台

Do not sell or share my personal information:

  • Submit via [email protected] 
  • Call Privacy toll-free: 877-297-8921

聯繫Cision

產品

關於

Dịch vụ của tôi
  • 所有新聞稿
  • Platform
[email protected]
  • 使用條款
  • 隱私條款
  • 信息安全政策
  • 網站地圖
  • RSS
  • Cookie設定
  • 無障礙
版權所有 © 2026 Cision US Inc.