蒙特利爾2025年11月26日 /美通社/ -- 《國際人工智能安全報告》正式發佈第二份「關鍵更新」，針對通用人工智能的風險管理及技術緩減措施，提供適時的分析與建議。

該報告由圖靈獎得主、著名電腦科學家 Yoshua Bengio 領導，匯聚超過 100 位國際專家共同參與，並獲歐盟、經合組織 (OECD) 及聯合國等 30 多個國家及國際組織全力支持。

鑑於 AI 領域發展一日千里，單靠年度報告已難以緊貼趨勢，因此報告引入「關鍵更新」機制，針對關鍵進展提供更聚焦的簡報。本次更新緊接於 2025 年 10 月 15 日發佈的首份關鍵更新。這些更新旨在確保政策制定者能掌握最新的文獻綜合分析，以制定基於實證的決策。

第二份關鍵更新重點探討提升 AI 可靠性及防止濫用的技術方案，以及新興的風險管理體制。報告重點摘要：

訓練模型以防禦惡意攻擊有進展，惟漏洞尚存 。雖然 AI 模型和系統抵禦攻擊的能力有所提升，但技術高超的黑客仍有約 50% 的機會僅透過 10 次嘗試便能突破防線；甚至只需 250 份惡意文件污染訓練數據，即可成功入侵模型。

。雖然 AI 模型和系統抵禦攻擊的能力有所提升，但技術高超的黑客仍有約 50% 的機會僅透過 10 次嘗試便能突破防線；甚至只需 250 份惡意文件污染訓練數據，即可成功入侵模型。 開源差距收窄。 開放權重模型目前的水平落後業界龍頭不足一年，這雖有助技術普及，卻令防止系統失靈及濫用的工作變得更複雜。

開放權重模型目前的水平落後業界龍頭不足一年，這雖有助技術普及，卻令防止系統失靈及濫用的工作變得更複雜。 業界安全努力倍增，實際成效未明。儘管 2025 年採用風險管理框架的 AI 企業數量增加逾倍，但其實際執行成效仍充滿不確定性。

報告主席、蒙特利爾大學正教授、LawZero 科學總監及 Mila - 魁北克 AI 研究所科學顧問 Yoshua Bengio 表示：

「由於我們持續追蹤 AI 能力及風險的變化，提供清晰指引以落實適切有效的風險管理及技術緩減措施至關重要。這份關鍵更新概述了相關領域的進展，以及尚存的缺口與機遇。我們的目標是在 2026 年初於印度舉行的『AI 影響力峰會』前發佈第二份完整的《國際人工智能安全報告》，在此之前，我們致力為全球決策者提供有關 AI 發展的適時更新。」

簡介

國際人工智能安全報告是先進人工智能系統能力與風險證據的合編。它旨在透過為決策者提供證據基礎，而支援全球明智政策制定。本報告由超過 100 位背景多元的獨立專家共同撰寫，並獲得專家顧問小組支持；該小組由來自 30 多個國家及國際組織（包括歐盟、經合組織和聯合國）的提名代表組成，具廣泛代表性。儘管該報告承認人工智能的龐大潛在優勢，但其重點在於識別風險和評估緩解策略，從而確保安全地發展和使用人工智能，造福人群。該報告由英國政府委託，而秘書處設於 UK AI Security Institute。

