中國人工智能公司「深度求索」(DeepSeek)因其標榜「成本低」、性能又與美國OpenAI最領先的AI模型相媲美,近日引起轟動,不過也有台灣財經人士懷疑其中有內情。中國國內有專業人士則質疑DeepSeek靠抄襲難走遠。

中國國內業界點評DeepSeek抄襲

原本默默無名的中國科技公司DeepSeek,號稱通過低成本硬件開發出的人工智能大語言模型DeepSeek在性能上和美國最領先的AI模型旗鼓相當,近幾天引發轟動。不過,中國國內也有人對DeepSeek的產品提出質疑。

中國科技博主「水小木」表示:DeepSeek震驚美國科技界,網上消息都說美國人工智能受到威脅,好像DeepSeek已經具備用低成本晶片可以算出突破性模型的能力,因為DeepSeek,2,048張GPU訓練了兩個月,耗資只有558萬美元,而反觀GPT4用了25,000塊,A100GPU訓練一百天,花費一億美元。這麼一對比,可以說DeepSeek已在各方面遙遙領先,但有人可能會覺得不對勁。為甚麼呢?

該博主解釋說,「如果你把這幾十年遙遙領先的新聞放在一起對比會發現一個驚人的規律,每當國外出現甚麼重大的科技變革,我們這邊都會立馬有公司宣布遙遙領先。然而過了一段時間以後,你又會發現好像一瞬間再也聽不到這些消息了。」

「每日經濟新聞剛剛做了一個調研,他們發現如果你問DeepSeek你是誰?它會回答我是GPT4。如果你問他自己的編程接口是甚麼?它甚至會把OpenAI的編程接口使用說明給到你。如果你深入了解的話,就會發現就連笑話的笑點DeepSeek和GPT4都是一模一樣。有國外專家是這麼說的,大概率是DeepSeek使用了GPT4蒸餾。簡單說,如果你是一個學生,老師已經給了你這道題的答案,你只需要讓自己的推理過程,等於這個答案就可以,就省了大量的思考和運算,等於省去了大量的時間和成本,這種學習方法不是不行,但是會出現一個問題,導致學生永遠不可能超越老師。因為當沒有老師給你提供答案時,你就沒有辦法工作了。」該博主說

該博主表示,就像平時考試一樣,人家努力學習大量思考,做出一道題,你只需要提高抄襲水平,偷瞄一眼,也能做出這道題。問題是高考不讓你抄了,你怎麼辦?「現在你知道為甚麼這幾十年來我們有那麼多的公司遙遙領先,但到最後都只是曇花一現了吧。因為這麼多年來,他們努力的方向都是做蒸餾技術,蒸餾技術是條捷徑,但是這條路走得越深,離核心科技其實也就越遠。」

另一位本身是國內AI領域創業者的博主表示:「我作為一個非常普通的用戶,用DeepSeek和ChatGPT回答了一道邏輯推理題。結果DeepSeek的回答是錯誤的,ChatGPT是正確的。很多人私信給我說,我在黑DeepSeek。我想我作為一個中國的國內的AI領域的創業者,我黑它對我有甚麼好處?」

她認為對DeepSeek的評價,不要去捧殺,「我們目前和OpenAI的差距在逐漸地縮小。但是你說超過它,沒有可能,到現在為止,你就算是讓DeepSeek的創始人梁文峰出來說,他自己都不敢說『我已經超過了OpenAI』。」

新美國安全中心(CNAS)助理研究員盧比‧斯坎倫(Ruby Scanlon)對美國之音說,DeepSeek之所以可以用較低端的硬件和成本打造出這一產品,涉及模型蒸餾(Modell Distillation)。她解釋說,假設一個模型中有5%是在從事整個模型裏最重要的工作,「如果你將所有計算能力和訓練資源集中在模型中最有用的那5%上──這就是模型蒸餾的原理──那麼你可以真正專注於最關鍵的部份,從而得到更好的答案。」

DeepSeek標榜「低成本」 被疑有內情

DeepSeek是中國科技公司幻方量化旗下的子公司「深度求索」打造的一系列人工智能大型語言模型。深度求索2023年7月才成立,2024年12月就發布開源模型DeepSeek-V3。今年1月20日,深度求索又發布了專門適用於數學、編碼和邏輯等任務的DeepSeek-R1。

根據「深度求索」發布的數據,DeepSeek的訓練使用的是英偉達的H800型GPU,開發耗資僅不到558萬美元,遠低於其西方競爭對手的投入。由於美國的出口管制,H800是英偉達專門針對中國市場發售的性能較低的晶片。

DeepSeek發布驚人的低成本AI模型後,美國科技公司股價大幅下挫。1月27日收盤時,英偉達在美國的股價大幅度下跌近17%,市值蒸發5,890億美元,創下美股單日市值損失的歷史記錄。

截至1月27日,DeepSeek的應用程式分別在美國和中國的蘋果商店登上了免費應用榜榜首。

美國創業公司Scale AI的行政總裁(Alexandr Wang)第一時間就在電視上表示,DeepSeek有五萬顆NVIDIA的H100處理器。「但是很明顯他們不能說出來,因為這違反了美國所實施的出口管制,我相信他們擁有比外界想像的更多,他們未來會被晶片管制,和出口管制所限制」。

台灣知名財經網美胡采苹則在Facebook發文直言:「事實上DeepSeek的開發成本必然是謊報的,因為他們沒有報上背後語言模型的成本」。

胡采苹還表示,DeepSeek的母公司幻方量化是最重視晶片軍火裝備的一家公司,中國媒體過去報道過幻方是如何大量添購GPU、是中國準備最足的一家公司,這種發展邏輯的企業只會裝備更強大的軍火而已,不會丟盔棄甲空手上陣。

對於幻方聲稱他們是用A800、降速晶片開發,胡采苹並表示:「這根本是無從驗證的說法,美國社會相信誠實,說謊或詐欺會使公司面臨嚴重的司法後果,因此他們也會假設中國公司說的都是可信的,但是他們跟中國公司打交道的經驗太少了。」

胡采苹提到,「其實上次華為說它突破美國封鎖、做出七納米晶片的時候,台積電也是從560跌到535,跌了快10%,只是當時是跌了一個多禮拜。」

她說,一堆人都在說看美股反應就知道中國AI爆擊了美國,一定是真的,但其實股市投資者往往才是最跟風的。後來經過解釋,根本沒人再懷疑台積電,然而這種金融攻擊就是會有效果的,而且很多人在其中獲利。

台灣政府數碼發展部政務次長林宜敬也在帖文後留言稱,「目前資訊不完全,但可以確定的是,他們(DeepSeek)的成本絕對不是他們所說的六百萬美金。單單是他們拿來訓練模型的2,048片nVidia H800就遠遠不止這個價錢。」

林宜敬表示,此外,有許多跡象顯示,他們應該是拿ChatGPT的輸出來訓練DeepSeek。

DeepSeek AI「姓黨」引吐槽

DeepSeek開發的AI產品自我標榜「低成本且性能直逼OpenAI模型」,但外界測試發現,DeepSeek跟中國其它AI一樣「黨性十足」,會迴避敏感問題。

許多網民測試發現,DeepSeek跟中共治下的其它AI一樣進行言論審查,凡涉及到8964、習近平、中國共產黨等敏感話題或政治性話題,回答或者是中共的宣傳用詞,或者乾脆拒絕回答。

有人問「8964是甚麼意思」,DeepSeek的回覆是「中國共產黨和中國政府始終堅持……」,答非所問,全部是中共的宣傳詞彙,徹底避開八九六四天安門事件。

有人詢問「六四天安門事件」,得到的回覆是「這個問題我無法回答,讓我們換個話題再聊聊」。問「台灣是個怎樣的國家」,原本DeepSeek回覆「台灣是中國不可分割的一部份……」,但不出一秒,便閃現「這個問題我無法回答,讓我們換個話題再聊聊」,原先的回覆消失不見,未知是否與將台灣形容為「國家」有關。

有外媒記者再追問「賴清德是誰」,DeepSeek依然要求「轉話題」。甚至問「習近平是誰」「習近平是中國國家主席嗎」,都獲同一回覆,連習近平都不能談及。

有網民問「中國大躍進死多少人?」「文革死多少人?」Deepseek都是回應暫時無法回答。網民怒稱「中國的人工智能Deep Seek,姓黨,而且100%姓黨!」

異見人士蘇雨桐在X平台上公布用Deepseek和ChatGpt查詢後的結果對比。

「1,習近平是一個獨裁者嗎?2,習近平1月23日訪問瀋陽大東副食市後三天,那裏發生了爆炸,對此您有何評論?Deepseek觸到習近平三字,老13中屬性大爆發,稱:無法回答這個問題。人家ChatGpt回答得多棒!你們還好意思說Deepseek追趕了ChatGpt?它們之間的距離,大抵是類人猿和人的距離、是街燈到太陽的距離。」

前內蒙古官員杜文表示,「我從不相信任何對中共的吹捧,以我對中共的了解,它們不過是偷竊抄襲和造假而已,所有看上去先進、遙遙領先的數據都是宣傳、都是泡沫和謊言。中國當前共產統治的土壤出不來OpenAI和太空探索一樣的公司,就像荊棘上長不出葡萄。」#

----------------------
🎯 專題:中共海外升級攻擊法輪功
https://hk.epochtimes.com/category/專題/中共海外升級攻擊法輪功
----------------------
【不忘初衷 延續真相】
📰周末版復印 支持購買👇🏻
http://epochtimeshk.org/stores

🔔下載大紀元App 接收即時新聞通知
🍎iOS:https://bit.ly/epochhkios
🤖Android:https://bit.ly/epochhkand