最近,中國人工智能公司DeepSeek推出一款新的AI推理模型,衝擊了美國科技、金融及政策等多個領域,成為推動美中AI大戰的一個導火線。

中共官方炒作DeepSeek   

1月20日,就在特朗普總統上任首日,中國人工智能公司DeepSeek發布了一款AI推理模型DeepSeek-R1,稱其功能媲美OpenAI,還使用更少算力與更低成本。

同日,DeepSeek創始人梁文鋒成為唯一一位與李強會面的AI界領袖,中共央視《新聞聯播》給了他清晰的近景畫面。

去年在接受媒體的訪問時,梁文鋒稱他的核心團隊「沒有海歸人士,都是本地人才」,他還強調,中國的AI產業「不能永遠做跟隨者」。這種說法類似於官方宣傳的獨立自主敘事。

讓人們意想不到的是,在中國黃曆新年期間,兩年前還默默無聞的DeepSeek,突然成為一股攪動世界的力量,並登上了海內外的新聞頭條。

1月26日,該模型已經超越ChatGPT,成為蘋果應用商店排名第一的應用。同日,億萬富翁投資者安德松(Marc Andreessen)稱,R1模型為「人工智能的斯普特尼克時刻」。

圖為美國晶片公司英偉達(Nvidia)的產品示意圖。(Sam Yeh/AFP)
圖為美國晶片公司英偉達(Nvidia)的產品示意圖。(Sam Yeh/AFP)

1月27日周一開盤,美國人工智能領軍企業遭遇慘重損失,微軟下跌4%,Tesla下跌2%,英偉達跌近17%,市值蒸發近6,000億美元,成為歷史上市值最大的單日跌幅。

目前,對於DeepSeek聲稱的一些說法,有不同的觀點。但DeepSeek不同之處在於,其背後有中共國家力量的推動。

台灣人工智慧實驗室(Taiwan AI Labs)創辦人杜奕瑾對《大紀元》表示,在AI領域不管是開源或閉源,過去這幾年來,每幾個月都有很大的更新。但DeepSeek特別之處在於,它不單單推出DeepSeek開源模型訊息。

杜奕瑾指出,DeepSeek很多訊息操作,(中共)官媒主導的成份非常高,在微博和Facebook上,可以看到很多不是真正使用者的帳號非常活躍,內容主要是:DeepSeek模型推出後美國科技股大跌,美國AI的優勢沒有了。

「這種訊息非常多,而且是在美國股市盤前交易(Pre-Market)時操作的,造成盤前交易市場下跌,實際真的造成正常交易股票的下跌。」

Taiwan AI Labs創辦人杜奕瑾。資料圖片。(宋碧龍/大紀元)
Taiwan AI Labs創辦人杜奕瑾。資料圖片。(宋碧龍/大紀元)

杜奕瑾認為,如果說DeepSeek推出造成美國股票大跌,有點倒果為因。因為是大量訊息操作造成盤前交易下跌後,大家才去注意到DeepSeek,而不是相反。

杜奕瑾表示,這些虛假訊息,在油管或Facebook上大量的短影音在講, DeepSeek模型的橫空出世,造成中美科技競爭。

他說,DeepSeek模型的確有獨到之處,但也不至於需要如此大肆渲染,這些短影音渲染帳號,很多都是用AI生成的農場帳號,平常也沒甚麼訂戶。現在不斷放大美股下跌的訊息。

「從我的角度,有點像把一個很簡單的開源成果,變成國家層級的科技競爭的訊息操作。」他說,這類似以前中國(中共)在國家主導的俄羅斯議題上面的炒作方式。網軍帳號配合官媒帳號,不斷地去做宣傳。很難讓人認為這不是一次有組織的宣傳,這背後有國家力量在推動。

杜奕瑾表示,它藉由的操作,展現的就是中國(中共)並不需要靠最高算力的晶片,也可以把模型做得很好。

DeepSeek低成本之謎      

DeepSeek最讓外界關注的一點,是其所聲稱的低成本和低算力。

DeepSeek的原始報告顯示,DeepSeek-R1在預訓練階段,每兆個token上訓練DeepSeek-V3僅需要180K H800 GPU小時。假設H800 GPU的租賃價格為每GPU小時2美元,我們的總訓練成本僅為557.6萬美元。

業界人士認為,DeepSeek使用一種名為「專家混合」(mixture of experts)的技術,類似於將問題交給特定領域的專家,從而減輕了晶片同時處理所有任務的壓力。但這種技術本身並不新鮮。

杜奕瑾指出,傳統商業公司也採用「多專家模式」以降低大模型的成本,這非常普遍,也不算甚麼創新,因為大部份AI新創公司比較沒有GPU資源。DeepSeek v3創新之處在於多頭、多精度的混合訓練,可以把模型訓練成本有效降低。

「但是DeepSeek並沒有說,原本的訓練資料是從哪裏來的,以及原本訓練的資料是用甚麼樣方法去做訓練,這部份其實不是非常清楚。」

杜奕瑾說,如果下載DeepSeek的原始碼就可以看到,DeepSeek模型其實是利用OpenAI的all one模型的蒸餾技術,把大模型的知識提取出來之後,再交給小模型去做訓練。

「早期DeepSeek在剛發布的時候,你問DeepSeek是一個甚麼樣的模型,它會回答說ChatGPT,就可以知道,它原始資料跟蒸餾對象應該就是ChatGPT。」

OpenAI在29日的一份聲明表示,正在審查有關DeepSeek可能「不當」使用其模型的輸出數據來開發其AI模型的報告。(Lionel Bonaventure/AFP via Getty Images)
OpenAI在29日的一份聲明表示,正在審查有關DeepSeek可能「不當」使用其模型的輸出數據來開發其AI模型的報告。(Lionel Bonaventure/AFP via Getty Images)

OpenAI在29日的一份聲明表示,正在審查有關DeepSeek可能「不當」使用其模型的輸出數據來開發其AI模型的報告,這種方法被稱為「蒸餾」。「我們採取積極主動的對策來保護我們的技術,並將繼續與美國政府密切合作,以保護在這裏建造的最強大的模型。」OpenAI發言人說。

杜奕瑾表示,DeepSeek在使用OpenAI模型蒸餾方式的時候,提取很多相關資料做訓練。OpenAI的授權原本是不允許的,就把它的帳號關閉了。

杜奕瑾表示, OpenAI提供的模型蒸餾技術,也不是一個新的技術,大概是2015年就提出來了。OpenAI原本用意是all one模型跑起來成本非常高,提供模型蒸餾是為了讓小的模型跟大的模型去學習,跑起來成本會有效降低,而且近似於大模型某個特殊領域的跑分結果。

他舉例說,這有點類似以前要請一個非常有經驗、非常昂貴的作業員,現在作業員只要把標準的工作經驗寫下來,就可以找一個比較廉價的工讀生來取代。

杜奕瑾指出,是不是未來就不需要比較有經驗、比較高階的作業員,其實不盡然。實際上透過蒸餾的方式,去做到近似複雜模型的結果,並不代表這種訓練出來的模型,會比原本複雜的模型做得好。

「因為它的模型參數沒有那麼多,沒有那麼聰明、那麼有經驗,成果就會下降很多,這也非常常見。」

台灣工研院政策與區域研究組組長李冠樺(李冠樺)
台灣工研院政策與區域研究組組長李冠樺(李冠樺)

台灣工研院政策與區域研究組組長李冠樺對《大紀元》表示,DeepSeek的低成本模式,事實上是因為利用了別人已經訓練好的模型,進行進一步的優化。這種低成本嚴格來說,其實是別人幫它分攤的。

「它事實上是站在別人的肩膀上再往上走,不應該把它跟OpenAI等同看待。它更像是在OpenAI基礎模型上面,做了一些更有針對性的優化。」

特朗普政府反應 美中AI大戰升溫   

DeepSeek不斷激起了華爾街及科技界的震盪,也延及了新上任的特朗普政府。白宮是否會因此加碼,制定更嚴格的對華科技限制政策,成為一個焦點。

1月27日,特朗普總統表示,「中國公司發布DeepSeek人工智能, 應該給我們的行業敲響警鐘,我們需要集中精力進行競爭。」

特朗普表示,他認為低成本模式對人工智能整體而言是「非常積極的發展」,因為「你不必花費數十億美元,而是花費更少,但希望能找到相同的解決方案。」

1月27日,特朗普總統表示,「中國公司發布DeepSeek人工智能, 應該給我們的行業敲響警鐘,我們需要集中精力進行競爭。」 (Joe Raedle/Getty Images)
1月27日,特朗普總統表示,「中國公司發布DeepSeek人工智能, 應該給我們的行業敲響警鐘,我們需要集中精力進行競爭。」 (Joe Raedle/Getty Images)

同日,眾議院中共特別委員會呼籲加強對DeepSeek人工智能基礎設施所依賴技術的出口管制。

1月28日,白宮新聞秘書萊維特表示,美國官員正在調查中國人工智能應用程式DeepSeek對國家安全的影響。

1月29日,兩名美國國會議員呼籲特朗普政府考慮限制英偉達生產的H20人工智能晶片出口,因為中國人工智能公司DeepSeek依賴這些晶片。

同日,特朗普提名的商務部長盧特尼克(Howard Lutnick)在確認聽證會上對DeepSeek進行了猛烈抨擊,他說:「他們購買了大量Nvidia的晶片,並找到了繞過這些晶片的方法,從而推動了他們的DeepSeek模型。這種做法必須結束。」

據彭博社援引匿名消息人士稱,特朗普正考慮對英偉達向中國銷售半導體晶片,施加比拜登政府更嚴格的限制,以限制中國在人工智能方面的發展。

李冠樺表示,2023年華為釋放了7納米的手機晶片,反而讓美國更了解原先的圍堵網中的一些漏洞,進一步把它圍堵起來。從這個角度來看,其實對他們一點好處都沒有。

「DeepSeek展現以後,美國也開始對它進行更進一步的檢視,對一家公司來講,都不是一個好事情。事情走到這一步,可能已經不是他們能夠控制的了。」

李冠樺表示,從硬體或算力的角度來看,美國絕對還是會持續地卡住中國獲得算力,包含調查DeepSeek是不是從非法管道獲得Nvidia晶片,國家力量是不是在後面幫助獲得一些算力。

「從另外一個角度來看,特朗普的警鐘,也包含對美國AI發展的警告,是不是太著重硬體或資本的投入,而忽略了應用商業應用的實現。」

有種說法認為,DeepSeek帶來的衝擊證明美國晶片管制的失敗。

但李冠樺認為,這不代表晶片禁令失效 ,而代表晶片禁令的確有它的效果。導致中共在AI的模型的訓練上面,必須要找很多的方法,去達到一樣的效果。

杜奕瑾表示,晶片禁令的確在AI訓練上面,會造成一些不方便。今天的禁令是有效的,但並不能完全阻止AI的發展。

「我感覺很多反應有點過頭了,造成很多不是資訊專業的評語參與其中,讓原本簡單的科技就變得很複雜。」他說。

「DeepSeek發布的技術,包含怎麼用強化學習去把模型做好,怎麼減少對晶片的依賴,同樣的方式美國公司實際上也可以利用。並不是說,因為有了比較不依賴晶片的DeepSeek模型,美國公司就沒有競爭力,也不會(造成)哪個美國公司成果受到威脅。」

美中AI大戰的未來

李冠樺表示,在最領先的一些AI技術的發展上,甚至軍事的AI,美中差距會拉大。但涉及到怎麼運用到商業,中方可能會有一些成果。

杜奕瑾表示,現在人工智能已經慢慢變成各個國家的國家級戰略,誰掌握到超強的人工智能,對一個國家跟整個產業,都是會有革命性的影響。

「美國過去在科技發展勝出,並不是純粹因為掌握晶片或掌握算力,主要還是掌握創新環境、人才環境、資本環境及軟件生態,讓好的人才願意加入,作出貢獻有該有的回報,才會讓美國人工智慧不斷在成長。」

他指出,現在的關稅壁壘、晶片壁壘、算力壁壘,未來如果競爭越高的話,就很有可能各國會趨於脫鉤。

「從2019年開始,就慢慢開始有分隊狀態,走美國供應鏈就不好走中國(中共)的,走中國(中共)就不好走美國的。往下來看的話,未來大國因為爭奪AI科技而造成的脫鉤,也是顯而易見的。在這種潮流之下,相關的立法會出台,造成彼此之間的壓力,慢慢形成分隊的狀況。」#

----------------------
🎯 專題:中共海外升級攻擊法輪功
https://hk.epochtimes.com/category/專題/中共海外升級攻擊法輪功
----------------------
【不忘初衷 延續真相】
📰周末版復印 支持購買👇🏻
http://epochtimeshk.org/stores

🔔下載大紀元App 接收即時新聞通知
🍎iOS:https://bit.ly/epochhkios
🤖Android:https://bit.ly/epochhkand