去年中國新年期間攪動全球的中國AI初創公司DeepSeek,今年3月份將發布其新大型模型DeepSeek V4。不過,經過一年多的沉澱後,西方輿論已經反轉, DeepSeek所聲稱的廉價高效的模型,實際上並非「獨立自主」,無論晶片還是知識產權都建立在美國科技的基礎至上。

非法使用美晶片

去年年初,DeepSeek一直對外宣稱,其新推出的DeepSeek-V3大模型是使用輝達非高端H800晶片訓練,訓練成本僅557萬美元,但多項數據超越國內外一眾大模型產品,擊敗了美國昂貴的投入。

當時業界頗為震驚,美國科技巨頭如輝達、博通、Alphabet、微軟股價均大幅下跌,有評論甚至認為這是人工智能界的「Sputnik時刻」。

不過,在今年3月DeepSeek V4即將推出之前,這類故事被反轉。

路透社2月22日報道,特朗普政府高級官員證實,DeepSeek即將發布的V4模型是在內蒙古某數據中心內,利用非法走私的Blackwell晶片集群訓練而成,並計劃刪除相關證據(很可能會謊報實際使用的晶片種類)。

目前,DeepSeek V4仍未發布,但DeepSeek V4打破行業慣例,優先向華為等國內硬件廠商開放測試,將輝達、AMD拒之門外。大陸的宣傳是「以實際行動扛起國產算力自主大旗」,但國外專家則認為,這是因為向美國晶片製造商展示該模型,將暴露其真實硬件。

2024年5月21日,位於美國加州聖克拉拉(Santa Clara)的輝達公司(Nvidia,又叫輝達)總部。(Justin Sullivan/Getty Images)
2024年5月21日,位於美國加州聖克拉拉(Santa Clara)的輝達公司(Nvidia,又叫輝達)總部。(Justin Sullivan/Getty Images)

實際上,去年DeepSeek-V3發布之時,國外質疑聲不斷。矽谷科技投資公司Altimeter Capital創辦人格斯特納(Brad Gerstner)直斥DeepSeek的宣稱是「假新聞」。

另有報道說,DeepSeek的主要投資方「幻方量化」(High-Flyer)早在2021年美國出口管制生效前,就囤積了一萬塊輝達(NVIDIA)的A100 GPU。DeepSeek不僅搞到了H100,還搭建了一套完整的「繞過體系」,通過東南亞空殼公司採購晶片,遠程接入當地伺服器調用「雲端算力」,甚至用行李箱裝滿硬碟人肉運輸訓練數據。

《The Information》也曾報道DeepSeek走私晶片到中國,用於訓練其下一代模型。

美國眾議院「對中共特設委員會」(House Select Committee on the CCP)去年4月份報告也指出,DeepSeek使用受出口管制的Nvidia晶片驅動其模型。

台灣安全研究所助理研究員楊一逵。(楊一逵提供)
台灣安全研究所助理研究員楊一逵。(楊一逵提供)

台灣安全研究所助理研究員楊一逵對《大紀元》表示,各界高度懷疑DeepSeek使用了透過灰色管道或利用第三方轉移 Blackwell 晶片,確實充滿爭議。

他認為,這反映出,美方專家已認定DeepSeek V4確實使用了Blackwell,但驗證上需要更多證據佐證,實質證據證實竊取行為難以查找,美方政策圈目前聚焦的討論,已從花費資源與時間去判定DeepSeek到底有無使用禁運的Blackwell晶片,轉向到商討如何更有效的掌握與監控賣出去的晶片,不讓其透過第三方落入中方廠商的手中。

灰色地帶蒸餾

同時,DeepSeek通過灰色地帶蒸餾美國大型AI模型的手法也遭到曝光。

在路透社報道的第二天,2月23日,Anthropic公布詳細證據,指出DeepSeek通過24,000個虛假帳戶進行逾15萬次交互,以此提煉Claude的推理能力。Google同日披露,其Gemini模型遭遇逾10萬次針對推理軌跡的攻擊。

蒸餾(distillation)是指讓一個更成熟、更強大的人工智能模型,評估一個新模型輸出結果的質量,並有效地遷移舊模型的學習成果。

Anthropic表示,採用「蒸餾」的做法,中國AI公司在非法挖取美國競爭對手的模型能力,以此節省研發時間與成本。

Anthropic認為,這已超出一般合法使用範圍,構成刻意「抽取」先進模型能力的蒸餾行為,甚至可能把美國研發的AI能力外溢到外國軍事與情報系統,對美國國家安全構成潛在風險。

此前, OpenAI發布了一份備忘錄,警告中國人工智能公司DeepSeek正以ChatGPT和Claude為目標,試圖複製美國的AI模型並將其用於自身訓練。

引發英國政府和馬斯克交鋒的是Grok人工智能工具被人利用來製作不道德的圖片。(RICCARDO MILANI/Hans Lucas/AFP via Getty Images)
引發英國政府和馬斯克交鋒的是Grok人工智能工具被人利用來製作不道德的圖片。(RICCARDO MILANI/Hans Lucas/AFP via Getty Images)

國防安全研究院中共政軍與作戰概念研究所助理研究員王綉雯對《大紀元》表示,在中國人或企業心中根本不認為「盜竊美國知識產權」違法,這其實反映出中國AI技術落後美國的事實,否則他們不必想方設法盜竊美國企業技術或利用開源AI技術,以及走私輝達先進晶片。

台灣防衞院中共政軍與作戰概念研究所助理研究員王綉雯。(王綉雯提供)
台灣防衞院中共政軍與作戰概念研究所助理研究員王綉雯。(王綉雯提供)

她指出,「遙遙領先」原本就是中共大內宣的欺騙伎倆,若他們對外宣稱「遙遙領先」,就只好接受全球檢視。

楊一逵表示,從技術上來看,讓小模型學習大模型的推理與邏輯並不違法,但在業界中,公司往往因為訓練資料來源是否有正當授權而引發爭端。

他說,多數美國AI公司在提供服務的合約中,都會禁止競爭者使用特殊程式大規模收集其模型輸出、複製其推論過程或爬取「思維鏈」(Chain of Thought),再以此訓練自家模型。這種「搭便車」的模型複製,在合約上是違法的。

楊一逵指出,中國公司常以大量虛假帳號,日以繼夜地爬取美國模型的思維鏈與推論邏輯,刻意維持在難以查證、難以舉證的灰色地帶。即使違反公平競爭的規範,卻因取證困難,使得法律訴訟難以成立。目前美國政策圈正在嘗試跳脫這類辯論框架,回到更關鍵的問題,去研究中國(中共,下同)如何以國家資本推動AI技術? 中國如何強化其AI相關的基礎建設,例如電力? 中國如何透過外交工具、國際市場與輿論操作,推廣中國AI技術的擴散,建立國際市場規模?

拆穿「獨立自主」謊言  

在美中科技競爭中,凡涉及到AI、晶片、量子科技等前沿科技領域,中共就會對美大肆展開「獨立自主」的輿論戰。

2023年華為8月底華為發布 Mate 60 Pro 時,時任美國商務部長雷蒙多(Gina Raimondo)正好在中國訪問。而去年Deepseek發布新模型的時間,恰好選擇在特朗普就職美國總統期間,與美國叫板的意味很濃。

DeepSeek創辦人梁文鋒在接受媒體的訪問時稱,他的核心團隊「沒有海歸人士,都是本地人才」,他還強調,中國的AI產業「不能永遠做跟隨者」,宣傳中共所謂獨立自主敘事。

在2026年馬年央視春晚上國產人形機械人密集亮相,也被中共媒體吹噓為「遙遙領先」。

如今,Deepseek在新模型發布之前,美國曝光了其對美科技的依賴鏈,揭示出來的真相是:DeepSeek既依賴禁運的美國晶片,又使用禁運的美國模型進行訓練,還編造獨立自主的故事來推銷產品。

對外關係委員會(CFR)中國與新興技術高級研究員克里斯‧麥圭爾(Chris McGuire)在社交平台X上發文回應:當Deepseek發布其新模型,並聲稱使用2000個H800晶片從零開始訓練時,希望世人能夠識破這是謊言。事實上,Deepseek幾乎完全依賴於被禁的美國技術和知識產權。它通過非法使用美國晶片和非法竊取美國知識產權來訓練模型。

「這些行為必須承擔後果」,他寫道。

王綉雯表示,路透社報道其實反映出一個事實:技術發展從來就不是橫空出世,必須建立在長期摸索嘗試的基礎上。DeepSeek大模型雖然在2025年令世界驚艷,但追蹤到底,還是必須依賴美國的先進技術。

她補充,DeepSeek說謊造假並不意外,他們是新創公司,急需大量資金投入,為了搶快搶錢,大概甚麼手段都使得出來。特別是這還和中國人的所謂民族自尊心掛在一起,不大力灌水怎麼騙得到資金和市場?這種前例太多了,眼下還有個人形機械人產業之例。

王綉雯表示,DeepSeek被美國企業指控利用盜竊,反映出中共抄捷徑、想一步登天,結果卻連馬步都蹲不好,就算一時令世界驚艷,時間久了就會真相大白。這對中共的國際名譽是大大損傷,日後中共又發布殊麼「遙遙領先」的技術,很多人大概會認為「又來騙人」。

楊一逵認為,中方大肆宣傳其AI技術如何突破美國封鎖的與論,是一種擴展市場應用與需求的策略,試圖形塑美國晶片抵擋不住中國AI產業的崛起,凸顯美國禁運政策的失敗,間接說服美方政策圈開放更多的高階晶片出口,同時也向其它國家展現中國在美方晶片制裁下的創新能力。藉此吸納外國的資本與投資,以及外國的人才。

楊一逵表示,中國的AI當然不是「遙遙領先」,美方最新的政策走向已不再著眼於強調中國AI發展的虛假性,務實地分析中國AI產業的真正實力、限制與脆弱性,以及防堵美國高階晶片在地下市場的外流,可能才是美國政策圈當前的方向。

加大出口管制

Anthropic報告同時指出,這些中國AI實驗室看似迅速取得的進展被錯誤解讀為出口管制無效,且可以通過創新規避管制。實際上,這些進展在很大程度上依賴於從美國模型中提取的能力,而大規模提取這些能力需要獲得先進晶片。

「因此,蒸餾攻擊強化了出口管制的合理性:限制晶片訪問權限既限制了直接模型訓練,也限制了非法蒸餾的規模。」報告寫道。

王綉雯表示,是否加大對中出口管制,要看特朗普怎麼想。一方面有輝達不願失去龐大的中國市場,一方面有Anthropic暴露中國企業的盜竊。若按照特朗普1.0時期的進展,習特會後,如果覺不滿意,可能隨後就採取更嚴格的措施。不過,現在中共祭出稀土管制,可能美國要設法拖延時間、迂迴作戰。

楊一逵表示,美方目前正研擬如何強化受管制高階晶片的追蹤技術與管制模式。例如在晶片中嵌入俗稱「晶片指紋」的溯源機制,並加入地理圍欄(Geofencing)功能,讓晶片一旦在未授權地區啟動,就能自動回傳異常訊號,便於主管機關追蹤其流向並防止第三方轉運至中國。但這類措施在產業界,尤其是像Nvidia這樣的主要供應商可能引發反彈。AI 企業擔心,強制性的追蹤功能會削弱客戶的信任,甚至帶來新的網絡資安風險,使晶片成為黑客攻擊與植入惡意程式的目標。因此,這項政策構想目前仍處於美方內部討論階段,尚未形成定案。

楊一逵表示,美方未來的政策走向將呈現表面放寬、實質強化追蹤的雙軌模式。也就是說,表面上可能有條件地放鬆部份高階晶片出口(例如開放 H200),以維持中國企業對美製晶片的高度依賴。但在實質操作上,美方會同步加強對高階晶片的流向監管與追蹤機制,確保關鍵硬體不會被第三方轉移與走私。#

-------------------
局勢持續演變
與您見證世界格局重塑
-------------------

🔔下載大紀元App 接收即時新聞通知:
🍎iOS:https://bit.ly/epochhkios
🤖Android:https://bit.ly/epochhkand

📰周末版實體報銷售點👇🏻
http://epochtimeshk.org/stores