中國人工智能公司「深度求索」(DeepSeek)在AI研發上的異常表現引發美議員關注。
周一(1月27日),中國人工智能公司DeepSeek引發華爾街震盪,導致市值蒸發近6000億美元,成為美股史上規模最大的一次金融衝擊事件。
DeepSeek發布的R1推理模型,其表現超越一眾美國開源語言模型。這讓許多人工智能研究人員和美國官員感到驚訝和質疑。
美國國會議員周一呼籲,採取行動減緩DeepSeek這家中國科技初創公司的發展,還有人認為,DeepSeek是「嚴重威脅」。
眾議院對中共委員會委員會主席、共和黨聯邦眾議員穆羅爾(John Moolenaar)表示,美國政府應努力對DeepSeek AI基礎設施關鍵技術實施更嚴格的出口管制。
參議院少數黨領袖、民主黨聯邦參議員舒默(Chuck Schumer)表示,「我們的競爭對手將利用他們得到的每一個機會超越美國在未來技術領域的領先地位。我們必須引領潮流。」
舒默表示,他將繼續致力於將發展美國人工智能放到最高優先事宜上。
美股暴跌 奇怪的延遲反應
彭博社說,DeepSeek引發美股暴跌是一種奇怪的延遲反應。周一引發的對美國高科技公司股票的拋售,實際上是投資者可能採取行動的第五個交易日。
DeepSeek在1月20日發布了這款應用程式,那天是美國總統就職典禮日。一開始,外界對它並沒有太多關注,到了24日,涉及DeepSeek的新聞開始激增。當天網絡上突然出現878篇相關報道,比前一天多出了接近600篇。
緊接著周末,DeepSeek在社交媒體上出現得越來越多。到了26日晚上,根據Google Trends的顯示,對DeepSeek的搜索活動激增。
市場對新聞的反應應該是隨機的,但一般來說,當新聞剛出爐時,市場會試圖做出迅速反應。而關於DeepSeek的報道已經存在了好幾個月。
報道指出,在社交媒體時代,訊息達到臨界點然後突然傳播開來很常見,不過當DeepSeek的訊息突然聚集了臨界點,並在27日一天內造成了華爾街5800億美元的損失,肯定很難有別的故事能與之匹敵。
「低成本訓練」具誤導性
外界質疑DeepSeek低成本訓練有很大的誤導性,此外,其使用非高端晶片進行訓練也存在疑問。
DeepSeek在2024年12月發布了一份報告,聲稱他們即將在1月10日推出的免費開源大型語言模型V3在多項數據上超越國內外一眾大模型產品。該公司聲稱該模型僅用兩個月就建成,成本僅為557萬美元,且使用非高端的H800晶片訓練。
557萬美元忽略了DeepSeek背後的重要基礎設施,包括大量可能將實際成本推高至數億美元的晶片。
它在報告中也說,這些成本並不包括與架構、演算法或數據方面的先前研究和實驗相關的所有其它成本。
1月20日,該公司發布了一個推理模型R1,稱性能比肩OpenAI o1正式版。他們未公布R1的成本數據。
但557萬美元卻成為了美國媒體報道的噱頭,同時也被混淆為是R1的成本。如伯恩斯坦研究公司高級分析師斯Stacy Rasgon調侃說:「DeepSeek真的『以五百多萬美元創立了OpenAI』嗎?當然不是。」
非高端晶片謎團
美國從事數據標註服務的領先公司Scale AI的CEO Alexandr Wang指出,DeepSeek可能實際擁有50,000顆H100 GPU,但可能因出口管制限制而無法公開此事。
Futurum Group行政總裁Daniel Newman也認為,倘若DeepSeek獲取不該擁有的設備,一定會招來進一步的調查。他預計美國政府將調查DeepSeek的硬件是否違反出口禁令。
總部位於杭州的初創公司DeepSeek表示,它使用英偉達(Nvidia,輝達)H800晶片來構建模型,該模型一直可用,直到2023年10月美國政府擴大禁令。
根據公開資料和DeepSeek創辦人梁文鋒接受大陸媒體採訪的報道,早在預期的美國制裁實施之前,梁就購買了大量英偉達A100晶片,這種晶片目前已被禁止出口到中國。
中國科技刊物「36氪」(36Kr)估計,該公司庫存晶片超過1萬片,但人工智能研究顧問公司SemiAnalysis的創始人Dylan Patel估計,其庫存至少有5萬片。這些儲備對訓練人工智能具有潛力,也可以將它們與低功耗晶片(比如H800)結合使用來開發模型。
「我們面臨的問題從來不是錢,而是高端晶片被禁運。」梁文鋒告訴「36氪」說。
尚不清楚DeepSeek的R1模型有無使用被禁高端晶片,以及數量如何。
出口管制的爭議
普渡大學克拉奇技術外交研究所(Krach Institute for Tech Diplomacy)行政總裁Michelle Giuda告訴彭博電視台,美國必須通過加強出口管制,來保持「真正強大的防禦」。她補充道,與此同時,如果美國想在科技競賽中保持領先,就需要在培養優秀工程師方面趕上中國。
「我們應該做的就是加倍努力,讓美國在人工智能創新方面行動得更快、更聰明、成本更低。」她說道。
前OpenAI研究主管Miles Brundage在接受自媒體ChinaTalk時說,他擔心有人會將DeepSeek此事作為反對出口管制的最終敘事論點。
「雖然我不認為這個論點成立,但我理解為甚麼人們可能會看到它並得出結論,認為出口管制適得其反。」他說,「出口管制是有效的——你不能否認這種情況正在發生,而且由於出口管制,這種情況更有可能發生。」#
----------------------
🎯 專題:中共海外升級攻擊法輪功
https://hk.epochtimes.com/category/專題/中共海外升級攻擊法輪功
----------------------
【不忘初衷 延續真相】
📰周末版復印 支持購買👇🏻
http://epochtimeshk.org/stores
🔔下載大紀元App 接收即時新聞通知
🍎iOS:https://bit.ly/epochhkios
🤖Android:https://bit.ly/epochhkand