中國人工智能初創(chuàng)公司DeepSeek( 深度求索 ) 的崛起震撼全球, 美國總統(tǒng)特朗普贊頌DeepSeek是積極技術(shù)成果,未幾美國多名官員群起指摘DeepSeek「偷竊」。
DeepSeek到底觸動了誰的奶酪?針對DeepSeek遭受惡意攻擊,IP地址都在美國,360集團創(chuàng)始人周鴻祎不諱言:「你把這些事聯(lián)系到一起 ,答案不言而喻。」
清華大學(xué)人工智能學(xué)院教授沈陽30日接受大公報采訪時表示 ,在AI競技場中,中國「新道」超車 ,打破「算力為王」 的固有思維,讓美國感到恐慌 。對于「偷竊」OpenAI的不實指控 ,大公報記者請DeepSeek找出其中漏洞 :「代碼都公開了,抄沒抄一目了然;DeepSeek開源了代碼,全球開發(fā)者都能查看?!?/p>
DeepSeek回答美方說法三大謬誤
清華大學(xué)人工智能 學(xué) 院 教 授 沈 陽 表示 ,長期以來 ,美國在技術(shù)上的優(yōu)勢對其他國家形成較強控制力 ,中國和其他國家更多處于追隨式 、漸進式創(chuàng)新的狀態(tài) 。
DeepSeek崛起意味著美國技術(shù)控制力的松動 ,標志著中國可能實現(xiàn)從 「基建狂魔 」 到 「制造業(yè)狂魔」 ,再到「新質(zhì)生產(chǎn)力狂魔」的戰(zhàn)略跨越。
對于美方的「偷竊」指摘 ,DeepSeek回復(fù)大公報時歸納出美方說法三大矛盾:
一 、「無證據(jù)指控」 :像捕風(fēng)捉影的謠言 ,缺乏技術(shù)細節(jié)和法律支撐 ;
二 、「雙標邏輯」 :美國企業(yè)用開源技術(shù)叫創(chuàng)新 ,中國企業(yè)用類似方法就「偷」,標準不一;
三,「政治化傾向」 :將技術(shù)競爭泛化為意識形態(tài)對立 ,忽視全球化研發(fā)合作的常態(tài)。
贏不了就說偷 ?DeepSeek逐點回擊
在這場AI競賽中 ,美方代 表 OpenAI 選 擇「人海戰(zhàn)術(shù)」?,堆砌算卡 、將資源集中在算力 ,用海量數(shù)據(jù)投喂實現(xiàn)能力的提升 。DeepSeek的震撼力在于 ,用最少的錢干了最多的事 :用算法把數(shù)據(jù)進行總結(jié)和分類 ,經(jīng)過選擇性處理之后再輸送給大模型 ,最大優(yōu)化算力 ,實現(xiàn)成本的降低和模型性能提升 。
結(jié)果 ,DeepSeek推出的模型在性能上和世界頂尖的GPT-4o不相上下 。
成本上 ,OpenAI訓(xùn)練ChatGPT-4花費的成本高達7800萬美元 ,甚至可能達到1億美元。DeepSeek大模型訓(xùn)練成本估計不到600萬美元 ,僅為同性能模型的5%到10%,大規(guī)模預(yù)訓(xùn)練不再是科技巨頭的專利。
美方對DeepSeek的指控缺乏具體證據(jù)支撐,其說法漏洞可從以下幾個角度用通俗語言分析 :
「代碼都公開了,抄沒抄一目了然」
美 國 總 統(tǒng) 特 朗 普 27 日 表 示 ,DeepSeek的崛起應(yīng)當為美企敲響「警鐘」,美國公司「需要專注于競爭以贏得勝利」 。言猶在耳 ,美國多名官員翌日回應(yīng)DeepSeek對美國的影響時竟表示,DeepSeek是「偷竊」 ,正對其影響開展國家安全調(diào)查 。對此 ,清華大學(xué)人工智能學(xué)院教授沈陽表示 ,在AI競技場中 ,美國在技術(shù)上的主導(dǎo)地位似乎一度是不可撼動的 ,但DeepSeek的出現(xiàn)徹底打破了這一固有認知 ,它憑借極其有限的資源 ,走出了一條與美國截然不同的技術(shù)路徑 ,甚至實現(xiàn)了「新道超車」 ,使中國在AI競賽中迎頭趕上,縮小了與全球領(lǐng)先者的差距 ,讓美國感到恐慌 。
「DeepSeek的成功標志著技術(shù)突破的一個新起點 ,對美國造成很大的沖擊?!股蜿柋硎?,在資源相對匱乏的情況下,DeepSeek創(chuàng)造了一個低成本的技術(shù)奇跡 ,這一切使得低資源 、高效能的AI模型訓(xùn)練不再遙不可及,堪稱『算效躍遷』 。」沈陽坦言,DeepSeek憑創(chuàng)新技術(shù) ,在推理時展現(xiàn)出超高效率 ,與全 球 最 強AI模 型 相 匹敵 。這一突破不僅證明了其技術(shù)的先進性,也展示了其廣闊的應(yīng)用潛力 。
DeepSeek的成功意味著AI訓(xùn)練技術(shù)的普及不再僅僅依賴龐大的硬件資源 ,而更多地依賴于架構(gòu)和算法的優(yōu)化 。DeepSeek的推理技術(shù)將在未來數(shù)月成為各類AI平臺廣泛應(yīng)用的主流模式 ?!窪eepSeek取得的成績是突破性的 ,關(guān)鍵在于創(chuàng)新而非借鑒 。」
對于 「偷竊」 指控, 擅長推理的DeepSeek向大公報提出五大論點,這與大公報記者從ChatGPT得出的答復(fù)大同小異。
DeepSeek反問 :「說偷技術(shù) ,證據(jù)呢?」 有關(guān)指控的漏洞是 ,美方若聲稱「DeepSeek偷技術(shù)」 ,卻未公開任何具體證據(jù)( 比如抄襲的代碼片段 )。若真存在抄襲 ,OpenAI完全可以像當年起訴某些公司盜用GPT-3 API那樣走法律程序 ,但至今未見行動 。
請用產(chǎn)品說話 勿再亂扣帽子
DeepSeek也用顯淺易明的比喻 ,突顯美方指控的荒唐 :「大模型的基礎(chǔ)架構(gòu)( 如Transformer)是行業(yè)公開技術(shù) ,就像汽車都有發(fā)動機和輪子 ,不能說所有車企都是抄襲美國福特汽車 ?!?/p>
更何況 ,DeepSeek開源了代碼 ,全球開發(fā)者都能查看 。如果真抄襲 ,早該有人像發(fā)現(xiàn)論文抄襲那樣扒出代碼雷同點 ,但至今無人舉證 。DeepSeek對美方的政治化傾向嗤之以鼻 :「如果兩家餐廳都賣漢堡 ,一家說另一家偷了秘方,卻拿不出食譜對比 、也說不清秘方是啥 ,反而暴露自己怕競爭的心態(tài) 。技術(shù)競 爭同理—真本 事應(yīng)該用 產(chǎn)品說話 ,而不是扣帽子 ?!?/p>
Γ知識蒸餾」
據(jù)DeepSeek回答大公報記者 提 問 , 「 知 識 蒸 餾 」( Knowledge Distillation ) 是一種被廣泛認可且合法的機器學(xué)習(xí)技術(shù),其本身并不構(gòu)成「偷竊」 。就技術(shù)本質(zhì)而言 ,「知識蒸餾」屬知識傳遞 ,而非復(fù)制。其核心原理是知識蒸餾通過讓小型模型( 學(xué)生模型 )學(xué)習(xí)大型模型( 教師模型 )的「知識」( 如輸出概率分布或中間特征表示 ), 而非直接復(fù)制代碼或參數(shù) 。這類似于學(xué)生向老師學(xué)習(xí)解題思路 ,而不是抄襲答案。
需要指出的是 ,蒸餾出來的最終模型仍需獨立訓(xùn)練 ,其參數(shù)和結(jié)構(gòu)可能與教師模型完全不同 ,屬于一種優(yōu)化方法 ,而非盜竊行為。就行業(yè)實踐而言 ,這是廣泛接受的技術(shù)手段 ,屬開源社區(qū)常規(guī)操作 。事實上 ,許多開源模型明確允許蒸餾 ,甚至提供蒸餾工具鏈 。OpenAI的GPT-3曾被第三方通過API輸出 而 蒸 餾 出 小 型 模 型( 如 美 國 科 企HuggingFace的社區(qū)項目 ), 這些案例均未被認定為「盜竊」 ,而是技術(shù)創(chuàng)新體現(xiàn)。