Accessibility Statement Skip Navigation
  • 數據隱私
  • 聯繫我們
  • 發佈新聞稿
  • 新聞
  • 產品
    • 概覽
    • 美通社發佈
    • 贊助廣告
    • Cision Global Media Monitoring
    • Cision投資者關係
    • 媒體新聞室
    • 所有產品
  • 聯繫
    • 一般資訊
    • 申請諮詢
    • 合作
    • 媒體諮詢
When typing in this field, a list of search results will appear and be automatically updated as you type.

搜索您的內容

未找到結果。請更改搜索條件並重試。
  • 焦點新聞
      • 瀏覽新聞稿

      • 所有新聞稿
      • 所有上市公司
      • 所有多媒體

      • 所有多媒體
      • 所有照片
      • 所有影片
  • 商業與財經
      • 一般商業

      • 人事公告
      • 人力資源與勞動力管理
      • 企業擴張
      • 住宅房地產
      • 商業地產
      • 外包業務
      • 小型企業服務
      • 展會新聞
      • 房地產交易
      • 新產品與服務
      • 業績公佈
      • 海外房地產(非美國)
      • 牌照許可和營銷協議
      • 獎項
      • 環境、社會和治理
      • 社會責任投資
      • 訃告
      • 調查、民意測驗和研究
      • 所有 一般商業

      • 商業科技

      • 互聯網技術
      • 區塊鏈
      • 半導體
      • 外圍設備
      • 廣播技術
      • 數據分析
      • 納米技術
      • 網絡
      • 金融科技
      • 電子元件
      • 電子商務
      • 電子設計自動化
      • 電腦硬件
      • 電腦網絡
      • 電腦與電子產品
      • 電腦軟件
      • 電腦配件
      • 高科技安全
      • 所有 商業科技

      • 所有娛樂與媒體

      • 出版與信息服務
      • 圖書
      • 娛樂
      • 廣告
      • 廣播與播客
      • 藝術、文化和設計
      • 雜誌
      • 電影
      • 電視
      • 音樂
      • 所有 所有娛樂與媒體

      • 汽車與運輸

      • 供應鏈/物流
      • 卡車和公路運輸
      • 旅遊
      • 汽車
      • 海事與造船
      • 航空公司與航空
      • 航空航天與國防
      • 航空貨運
      • 運輸、卡車和鐵路
      • 鐵路與多式聯運
      • 所有 汽車與運輸

      • 財經服務和投資

      • A股東激進主義
      • 保險
      • 債券與股票評級
      • 共同基金
      • 加密貨幣
      • 合同
      • 合資企業
      • 房地產
      • 投資意見
      • 收購、合併和接管
      • 會計新聞與問題
      • 業績公佈
      • 業績預測
      • 產品
      • 破產
      • 私募
      • 紅利
      • 股東大會
      • 股票分割
      • 融資協議
      • 重組與資本結構調整
      • 銀行與金融服務
      • 銷售報告
      • 電話會議公告
      • 風險投資
      • 所有 財經服務和投資

  • 科學與技術
      • 消費科技

      • STEM(科學、技術、工程、數學)
      • 人工智能
      • 加密貨幣
      • 區塊鏈
      • 娛樂與媒體
      • 數據分析
      • 消費電子產品
      • 無線通信
      • 社交媒體
      • 移動設備/應用程序
      • 金融科技
      • 雲計算 物聯網
      • 電子商務
      • 電子設計自動化
      • 電腦硬件
      • 電腦網絡
      • 電腦與電子產品
      • 電腦軟件
      • 電腦配件
      • 所有 消費科技

      • 環境

      • 保護與回收
      • 環保產品與服務
      • 環境問題
      • 環境政策
      • 綠色科技
      • 自然災害
      • 所有 環境

      • 能源與自然資源

      • 一般製造業
      • 公用事業
      • 化學
      • 天然氣
      • 採礦
      • 採礦與金屬
      • 替代能源
      • 水務
      • 石油和天然氣發現
      • 石油和能源
      • 電力設施
      • 所有 能源與自然資源

      • 重工業和製造業

      • 一般製造業
      • 化學
      • 建築與建造
      • 採礦
      • 採礦與金屬
      • 暖通空調(供暖、通風與空調)
      • 機床、金屬加工和冶金
      • 機械
      • 煙草
      • 紙張、林產品和集裝箱
      • 紡織品
      • 航空航天與國防
      • 貴金屬
      • 農業
      • 電腦配件
      • 所有 重工業和製造業

      • 電信

      • 無線通信
      • 移動設備/應用程序
      • 網絡電話
      • 運營商和服務
      • 電信
      • 電信設備
      • 電信運營商和服務
      • 電腦網絡
      • 電腦配件
      • 所有 電信

  • 生活與健康
      • 健康

      • FDA 批准
      • 保健與醫院
      • 健康保險
      • 健身保健
      • 傳染病控制
      • 制藥業
      • 國際醫療審批
      • 心理健康
      • 牙科
      • 生物技術
      • 生物統計學
      • 臨床試驗與醫學發現
      • 輔助藥物
      • 醫療制藥
      • 醫療設備
      • 所有 健康

      • 所有娛樂與媒體

      • 出版與信息服務
      • 圖書
      • 娛樂
      • 廣告
      • 廣播與播客
      • 藝術、文化和設計
      • 雜誌
      • 電影
      • 電視
      • 音樂
      • 所有 所有娛樂與媒體

      • 旅遊

      • 休閒與旅遊
      • 客運航空
      • 戶外、露營和遠足
      • 旅遊
      • 賭博與賭場
      • 遊樂場和旅遊景點
      • 酒店和度假村
      • 所有 旅遊

      • 消費產品及零售

      • 傢具與裝修
      • 動物與寵物
      • 化妝品與個人護理
      • 啤酒、葡萄酒和烈酒
      • 大麻
      • 婚慶服務
      • 家居用品、消費品和化妝品
      • 家庭裝修
      • 家用產品
      • 時尚
      • 有機食品
      • 玩具
      • 珠寶
      • 產品召回
      • 超市
      • 辦公用品
      • 零售業
      • 非酒精飲料
      • 食品與飲料
      • 飲料
      • 餐飲業
      • 所有 消費產品及零售

      • 體育

      • 戶外、露營和遠足
      • 運動器材和配件
      • 體育
      • 體育賽事
      • 所有 體育

  • 政策與公共利益
      • 政策和公共利益

      • 企業社會責任
      • 公共安全
      • 動物福利
      • 勞工與工會
      • 教育
      • 歐洲政府
      • 環保產品與服務
      • 經濟新聞、趨勢和分析
      • 自然災害
      • 非營利
      • 所有 政策和公共利益

  • 人文與文化
      • 人文和文化

      • 兒童相關新聞
      • 多元化、公平與包容
      • 婦女相關新聞
      • 宗教
      • 殘疾人新聞
      • 男女同性戀、雙性戀和變性者
      • 老年公民
      • 西班牙語新聞
      • 退伍軍人
      • 所有 人文和文化

  • 概覽
  • 美通社發佈
  • 贊助廣告
  • Cision Global Media Monitoring
  • Cision投資者關係
  • 媒體新聞室
  • 所有產品
  • 一般資訊
  • 申請諮詢
  • 合作
  • 媒體諮詢
  • Hamburger menu
  • PR Newswire: news distribution, targeting and monitoring Home
  • 發佈新聞稿
    • 交談

    • 所有聯繫資訊
    • 聯繫我們


  • 新聞稿
  • 發佈新聞稿
  • 數據隱私
  • 焦點新聞
    • 瀏覽所有新聞
    • 所有新媒體
  • 商業與財經
    • 一般商業
    • 商業科技
    • 所有娛樂與媒體
    • 汽車與運輸
    • 財經服務和投資
  • 科學與技術
    • 消費科技
    • 環境
    • 能源與自然資源
    • 重工業和製造業
    • 電信
  • 生活與健康
    • 健康
    • 所有娛樂與媒體
    • 旅遊
    • 消費產品及零售
    • 體育
  • 政策與公共利益
  • 人文與文化
    • 人文和文化
  • 新聞稿
  • 發佈新聞稿
  • 數據隱私
  • 概覽
  • 美通社發佈
  • 贊助廣告
  • Cision Global Media Monitoring
  • Cision投資者關係
  • 媒體新聞室
  • 所有產品
  • 新聞稿
  • 發佈新聞稿
  • 數據隱私
  • 一般資訊
  • 申請諮詢
  • 合作
  • 媒體諮詢
  • 新聞稿
  • 發佈新聞稿
  • 數據隱私

雲知聲Unisound U1-OCR大模型發布!首個工業級文檔智能基礎大模型,開啟OCR 3.0時代
  • USA - English
  • USA - English
  • APAC - English


新聞提供者

Unisound

26 2月, 2026, 21:56 CST

分享這篇文章

Share toX

分享這篇文章

Share toX

北京2026年2月26日 /美通社/ -- 就在剛剛,雲知聲正式推出「Unisound U1-OCR」 文檔智能基礎大模型。作為首個工業級文檔智能基座,該模型憑借 「性能 SOTA、可信可驗、開箱即用、高效部署、強適配」 五大核心優勢,打破傳統文檔處理邊界,樹立起行業新標杆。

一、技術跨越:從 OCR 2.0 邁向 3.0

圖1Unisound U1-OCR在OmniDocBench V1.5的評測得分對比
圖1Unisound U1-OCR在OmniDocBench V1.5的評測得分對比

文檔智能(Document Intelligence)是指利用人工智能技術自動閱讀和理解文檔影像,並進行內容的讀取、理解、分類及關鍵信息提取。傳統視覺方案(OCR 1.0,以 CRNN 為代表)僅能識別文字,新一代多模態方案(OCR 2.0,以VLM為代表 )具備初步版面理解能力。而 「Unisound U1-OCR」 則正式開啟 OCR 3.0 時代——在理解版面的基礎上,進一步洞察文檔深層語義,實現自動分類與業務級信息抽取,完成了從「字符感知」到「文檔認知」的質的飛躍。

二、實力領跑:多項權威評測穩居全球第一梯隊

「Unisound U1-OCR」是一款達到國際頂尖水平(SOTA)的文檔智能理解模型,其核心優勢在於突破了傳統模型「只讀文字、不懂排版」的瓶頸,能夠像人類專家一樣「看懂」複雜文檔。為適應 OCR 3.0 時代對於文檔業務級結構化抽取的新要求,Unisound U1-OCR 采用 ViT + LLM 架構,其中視覺編碼器部分采用 NaViT 架構,實現文檔分辨率動態處理,模型參數規模 3B 量級,兼顧模型計算效率與文檔深層語義信息理解的能力要求。除此之外,模型還提出了多項創新舉措:

首先,它擁有「先懂結構,再讀內容」的智慧。傳統模型往往按順序死板閱讀,而「Unisound U1-OCR」首創了「語義驅動+動態聚焦」策略。如同人類閱讀習慣,先梳理文檔目錄、標題的層級關系,再按需提取內容。模型能自動構建文檔的「語義地圖」,精准識別標題、圖表與正文的從屬關系,即使面對排版混亂的極端場景,也能條理清晰地提取信息。

其次,它具備敏銳的「空間感知力」。通過強化空間對齊模塊,模型能充分利用文字在頁面上的位置信息,主動理解元素間的空間布局。結合動態分辨率技術,無論是密集表格還是圖文混排,它都能精准還原文檔結構,徹底解決了以往模型「張冠李戴」的空間盲區。

此外,模型采用Multi-Token Prediction(MTP)技術——在預測當前 Token時,同步考慮未來多個Token的概率分布,大幅提升長文檔邏輯連貫性。配合全任務強化學習策略,增強模型對版式結構的全局預見性並在推理階段將模型生成效率提升了80%以上。在訓練階段,采用多任務協同強化訓練方案,實現文檔結構還原、文檔分類與信息抽取的深度對齊。強化訓練策略圍繞「語義+坐標」雙目標優化,針對坐標回溯的 IoU 精度進行專項強化,有效遏制定位幻覺,確保輸出結果的物理可信度。通過多檔位分辨率擾動與Mask采樣策略,顯著提升了模型多場景文檔圖像的理解能力。

憑借這些創新,Unisound U1-OCR在多項權威測試中均獲業界SOTA表現,真正實現了從「識別文字」到「理解文檔」的跨越。

1. OmniDocBench V1.5評測SOTA

在OmniDocBench V1.5評測中,Unisound U1-OCR以95.1分取得SOTA表現(如圖1),領先GLM-OCR,Deepseek-OCR2,Gemini-3-Pro,GPT-5.2等主流模型,實現了精度與泛化能力的雙重突破。

2. D4LA評測SOTA

在D4LA評測中, F1 分數達 90.8,大幅領先 DocLayout-YOLO(87.3)、PP-StructureV3(86.0)。無需微調即可高精度解析學術論文、財務報表等 11 類高複雜度文檔。

3. DocLayNet評測SOTA

在DocLayNet評測中,F1 分數 95.9,超越 MinerU 2.5、PP-StructureV3 等模型。在表格識別、跨頁關聯、微小文本檢測等高難任務上優勢顯著,魯棒性極強。

4. 業務相關評測SOTA

在內部業務測試中,其信息抽取與文書分類能力超越 Gemini-2.5-Flash、Qwen-235B-VL 等主流通用商業和開源模型。特別是在醫療入院記錄、出院小結等強業務場景中,領先優勢尤為明顯,Unisound U1-OCR 以 3B 規模的參數獲得比更大規模通用 VLM 更好的評測性能。與較小尺寸的文檔解析任務模型相比,得益於模型多項創新舉措,在業務級信息抽取等深層語義信息理解的能力表現更好。

三、面向真實場景:4大核心能力助推U1-OCR從「讀懂」邁向「執行」

作為開  啟OCR 3.0時代的文檔智能基礎大模型,除了在通用評測中斬獲多項SOTA,Unisound U1-OCR更立足工業級場景需求,打造了四大核心能力,實現從『讀懂』到『執行』的業務落地。

1. 可信可查:精准溯源,結果可驗

模型獨創「坐標-文本-語義」融合架構,實現像素級精准定位與完整證據鏈構建。在完成信息抽取的同時,系統精准標示信息在文檔中的來源位置,使結果審核過程全透明、可追溯,從技術層面保障文檔處理結果的可信度,徹底解決傳統文檔處理「結果不可驗」的行業難題。

例如,在企業審核場景中,審核人員無需大海撈針般翻閱原文,點擊抽取結果即可實時高亮定位原始位置。這種「人機協同」的閉環將審核耗時縮短至秒級,讓人工漏檢率降至最低,真正實現了「可信任的AI」。

2. 業務融合:開箱即用,Agent Ready

通用OCR工具在專業領域存在局限——例如醫保結算單中「自付一」「自付二」與「個人自費」的邏輯關系,或合同中金額大小寫的校驗規則,都需要領域知識支撐。

Unisound U1-OCR在基礎模型之上,融入了雲知聲在醫療、金融等領域的行業知識積累,模型可基於業務邏輯進行多字段關聯校驗。在內部業務測試中,面向50餘種常見業務文書的分類准確率超過99%。

3. 高效部署,安全可控

模型深度支持私有化與離線部署,可在無外網環境下穩定運行,完美匹配政務、醫療、金融等高安全等級行業的數據隱私保護需求。同時,通過版面級並行解碼與多Token預測架構等優化措施,一份十多頁的文檔,整理處理可在數秒內完成,高效的文檔處理能力,讓工業級文檔智能能力觸手可及。

4. 超強適配,攻克複雜場景

針對企業實際業務中遇到的非標准拍照、文檔彎折模糊、複雜花式排版、多語言混排等各類極端複雜文檔場景,Unisound U1-OCR仍能保持穩定、高精度的處理表現,徹底擺脫傳統技術對標准化文檔的依賴,真正適配企業真實業務的全場景需求。

SOURCE Unisound

Modal title

聯繫Cision

  • [email protected]
  • 一般資訊
  • 申請咨詢
  • 合作
  • 媒體咨詢

產品

  • Cision傳播雲平台
  • 營銷人
  • 公關
  • 投資者關係和合規
  • 代理商
  • 小型企業
  • 所有產品

關於

  • 關於美通社
  • 關係 Cision
  • 工作機會
  • 無障礙聲明
  • 亞太地區 - 簡體中文
  • 亞太地區
  • 亞太地區—繁體中文
  • 阿拉伯
  • 巴西
  • 加拿大
  • 捷克共和國
  • 丹麥
  • 芬蘭
  • 法國
  • 德國
  • 印度
  • 以色列
  • 印尼
  • 意大利
  • 墨西哥
  • 中東
  • 荷蘭
  • 挪威
  • 波蘭
  • 葡萄牙
  • 俄羅斯聯邦
  • 斯洛伐克
  • 西班牙
  • 瑞典
  • 英國
  • 美國

我的服務

  • 所有新聞稿
  • 平台

Do not sell or share my personal information:

  • Submit via [email protected] 
  • Call Privacy toll-free: 877-297-8921

聯繫Cision

產品

關於

Dịch vụ của tôi
  • 所有新聞稿
  • Platform
[email protected]
  • 使用條款
  • 隱私條款
  • 信息安全政策
  • 網站地圖
  • RSS
  • Cookie設定
  • 無障礙
版權所有 © 2026 Cision US Inc.