前幾天,DeepSeek的消息引發了美國金融市場的風波。大陸媒體和小粉紅更是興奮地將DeepSeek吹捧為所謂的「中國AI崛起的象徵」。

然而,在一片喧囂之中,DeepSeek也身陷諸多質疑和批評——其技術突破是否真正具有創新性?團隊的透明度是否足夠?市場營銷是否存在誇大成份?

技術突破來自對美國技術的「盜用」?

中方高調宣稱DeepSeek的技術突破來自於中國的自主創新,但據海外媒體報道,ChatGPT的所有者微軟和OpenAI認為,DeepSeek不當獲取了自己的核心數據和模型。

OpenAI 1月29日表示,它們已掌握證據,顯示DeepSeek盜用其模型進行開發。

白宮人工智慧與加密特使David Sacks也表示,有大量證據表明DeepSeek利用OpenAI的模型輸出數據,建立了自己的訓練集,而這種方法在業界被稱為「蒸餾」或「模型複現」。

從當前公開資料來看,DeepSeek的核心技術框架,如大規模預訓練、Transformer架構和優化算法,確實與OpenAI、Google DeepMind等公司的研究成果有相似之處。

據新唐人報道,一名AI專業人員透露:DeepSeek確實有一些原創技術,包括減少了對GPU的使用,但在數據上主要是用了60萬長鏈條數據集,其中大部份是蒸餾獲得的,然後結合了多輪投票增強學習,變成了自己的東西。甚麼意思呢?就是說,這是一個比較聰明的小偷或抄作業的,但還是做了。

實際上,DeepSeek自己也招了。很多人在問它是誰的時候,它有時回答自己是ChatGPT,有時說是GPT-4,還老老實實地交代自己使用了OpenAI的哪些工具。

據悉,目前微軟和OpenAI正在進行深入調查,同時已經封禁了與DeepSeek相關的可疑帳戶。如果證據確鑿,這可能是近年來AI領域最大的數據盜竊案之一。

DeepSeek的真實實力究竟如何?

DeepSeek號稱是國內少數能夠「對標GPT-4」 的模型之一,但實際體驗後,許多用戶發現其表現仍然存在較大的差距。儘管官方在多個平台展示了測試結果,但這些結果往往是經過精挑細選的最佳案例,而非隨機樣本的真實評測。一些用戶反饋,DeepSeek在長文本理解、邏輯推理以及代碼生成等核心能力上仍有明顯短板,甚至在某些任務上表現不如早期版本的 ChatGPT 3.5。

此外,DeepSeek的論文與技術文檔相對較少,缺乏詳實的技術細節披露。與OpenAI、Anthropic等國際領先團隊相比,DeepSeek在學術透明度方面仍存在很大欠缺。

DeepSeek「高調宣傳+低調研究」的模式,也是讓人懷疑其是否真正具備自主創新能力,抑或只是藉助現有開源技術,進行包裝和二次開發的一個重要原因。

DeepSeek的成本真的挑戰美國最強AI?

DeepSeek聲稱其大模型是在「低算力條件」下訓練完成的,V3模型訓練成本僅為560萬美元,這比OpenAI、Meta等用於預訓練大型語言模型動輒數億美元的成本要低得多。這一說法雖然吸引眼球,但從技術角度來看,仍然存在諸多疑點。許多專家,包括馬斯克和Scale AI的行政總裁Alexandr Wang,都不相信。

首先,大模型訓練的核心成本來自於算力。現階段,主流大模型(如GPT-4級別)通常需要數萬個高性能GPU(如 A100、H100)連續訓練數月。而根據市場價格,單張H100的售價高達2萬美元,即使是雲租賃,長期大規模使用的成本也十分昂貴。在如此高昂的算力消耗下,DeepSeek如何以560萬美元的預算完成訓練,值得深究。

其次,訓練成本不僅包括算力消耗,還涉及數據採購、存儲、工程優化、人力成本等多個方面。高質量的訓練數據需要清洗、標註,並經過多輪優化,而這本身就是一筆巨大開銷。此外,大模型的訓練往往需要反覆疊代調整,以提升最終性能,而非一次性完成。DeepSeek是否通過某種特殊技術或極端優化手段大幅降低成本?如果是,其方法為何未在業界廣泛應用?

此外,DeepSeek作為一家中國公司,其GPU採購渠道是否受限也是一個需要考慮的問題。由於全球晶片供應鏈的限制,中國市場上的高端GPU價格通常高於海外,且獲取難度較大。在這種情況下,其低成本訓練的實現路徑更顯得撲朔迷離。

DeepSeek是真開源還是「半開源」?

DeepSeek宣布開源模型,初看似乎是一項重大利好,但仔細審視後,人們發現所謂的「開源」並不徹底。真正的訓練細節、優化策略、數據來源等核心訊息仍然沒有完全公開,導致業界難以對其技術路線進行嚴肅的學術分析。真正的開源應該像Meta旗下的 Llama或Mistral那樣,將關鍵代碼和方法論徹底公開,而不是「半遮半掩」。相較於Llama系列、Mistral AI等更開放的做法,DeepSeek的開源行為更像是一種「半開源」,目的可能更多是為了博取關注和市場認可,而非推動整個AI生態的發展。

更值得注意的是,DeepSeek也可能受到中共官方政策與監管壓力的影響,導致其開源策略受到掣肘。如果一個模型在技術上宣稱要與國際一流對標,卻在透明度上選擇性「封閉」,那麼這種開源行為是否只是營銷手段,而非真正的技術貢獻?

面對眾多質疑的DeepSeek ,可以說現在正站在一個關鍵的十字路口:如果真的要「深度求索」,那麼必須拿出紮實的技術和真正的突破,而不是靠一輪又一輪的營銷造勢來維持熱度。否則,它最終可能淪為又一個AI泡沫,被市場無情淘汰。#

本文僅代表作者本人觀點,並不一定反映《大紀元時報》立場。

----------------------
🎯 專題:中共海外升級攻擊法輪功
https://hk.epochtimes.com/category/專題/中共海外升級攻擊法輪功
----------------------
【不忘初衷 延續真相】
📰周末版復印 支持購買👇🏻
http://epochtimeshk.org/stores

🔔下載大紀元App 接收即時新聞通知
🍎iOS:https://bit.ly/epochhkios
🤖Android:https://bit.ly/epochhkand