知名 YouTuber 老高昨日發布影片,暢談對中國 AI 新創公司 DeepSeek 的看法,他指 DeepSeek 被指抄襲 ChatGPT 的說法明顯不成立,且 DeepSeek 能成功,在於能繞過輝達的 CUDA 運算平台,不過專家對此說法表示質疑。
(前情提要:美國AI抗中新法案:使用DeepSeek是重罪,最高20年徒刑併罰款100萬鎂)
(背景補充:淺析》DeepSeek為何能影響加密貨幣市場?)
中國 AI 新創公司 DeepSeek 近期先後發布「DeepSeek-V3」和「DeepSeek-R1」兩款大模型,由於標榜成本低廉、性能與 OpenAI 相當,震動矽谷,被認為可能改寫 AI 大模型領域的遊戲規則。
老高談 DeepSeek 衝擊
對此, YouTuber 老高昨日發布影片《引發全球大衝擊的 DeepSeek,已經點燃中美之間一場沒有硝煙的戰爭》,暢談他對 DeepSeek 的看法。
老高指出, DeepSeek 的成功不僅在於其 AI 模型的性能與 ChatGPT 相當,更在於其極低的開發成本, DeepSeek 開發其頂級模型僅花費 560 萬美元(實際成本目前外界其實眾說紛紜,很可能沒這麼低),約為 OpenAI 的百分之一,這使 DeepSeek 在 AI 領域的競爭力大幅提升,並引發了市場對 AI 開發成本與效率的重新評估。
老高認為,DeepSeek 的最大突破在於其開源策略,與 OpenAI 的閉源模式不同,DeepSeek 將其 AI 模型公開,允許任何人下載並在本地運行,甚至可以用於商業用途。這一舉措不僅大幅降低了企業和個人使用 AI 的門檻,還對 OpenAI 等依賴閉源模式盈利的公司造成巨大衝擊。
DeepSeek 抄襲 ChatGPT?
此外,老高表示,DeepSeek 被指抄襲 ChatGPT 的說法明顯不成立,因為 ChatGPT 採用閉源模式,其內部運作無法被外部抄襲,而 DeepSeek 作為開源項目,所有代碼與數據都公開透明,若有抄襲行為 OpenAI 早已能夠察覺。這就像某些知名作業系統因閉源而不易被模仿一樣。
老高形容,DeepSeek 的成果與 ChatGPT 僅可能存在靈感上的相似,而非直接抄襲,因為沒有人能看到對方的「烹飪秘訣」。
老高還宣稱,DeepSeek 能成功,在於能繞過輝達的 CUDA 運算平台,一直以來,CUDA 就像一座核電廠,將強大的運算晶片能力轉化為穩定高效的運算資源,形成了其難以逾越的技術壁壘。
根據老高的說法,DeepSeek 可以繞過硬體對訓練速度的限制,從而不再依賴 CUDA ,這意味著不論使用哪家公司的晶片,只要能接入這項技術,就有機會獲取最大化的運算效能,無需使用 CUDA,進一步動搖輝達在運算市場中的壟斷地位。
DeepSeek 真繞過輝達 CUDA 框架?
不過針對老高的說法,有專家向動區表示,老高影片中的論點有誤,當前 Deepseek 絕對是使用輝達顯卡進行運算,並且還是使用 CUDA 平台,絕非老高所稱「繞過 CUDA 」。
專家指出,老高可能錯誤理解了近期的新聞,Deepseek 近期被傳出有為未來可能面臨的封殺做準備,即使無法使用輝達顯卡,也有打算使用中國國產 GPU 作為運算來源(也有說法指中國仍然透過灰色手段獲得大量輝達晶片),但這不代表該公司現在的模型正「繞過 CUDA 」在運行。
此前,Tom’s Hardware 曾報導稱,DeepSeek 在使用輝達 H800 晶片進行訓練時,部分功能使用輝達底層硬體指令 PTX語言,而不是高級編程語言 CUDA,北京航空航太大學副教授黃雷分析,繞過 CUDA 意味著 DeepSeek 可以直接根據 GPU 的驅動函數做一些新的開發,從而實現更加細微性的操作。
📍相關報導📍
OpenAI 縮了!Altman:暫無計畫控告 DeepSeek,專心打造更優質產品