中國DeepSeek大受歡迎 美國晶片管制成效引發業界討論
(中央社北京27日綜合外電報導)中國新創公司深度求索(DeepSeek)開發的AI助理今天成為App Store上評分最高的免費應用程式。DeepSeek訓練成本低廉,表現不亞於美國最優秀的大語言模型,對於美國晶片管制是否有效限制中國AI發展,科技業界議論紛紛。
路透社等媒體報導,自DeepSeek-V3推出以來,這款人工智慧(AI)應用程式在美國用戶中人氣激增。開發者表示,它的性能在全球不僅超越其他開源模型,還可與最先進的閉源模型相媲美。隨後,DeepSeek於本月20日推出了專為解決複雜問題而設計的R1模型。
法新社報導,DeepSeek可以在手機或是桌上型電腦上使用,且具備許多西方競品的功能,例如撰寫歌詞、協助制訂個人發展計畫,甚至能根據冰箱裡的食材生成晚餐食譜。
與百度的「文心一言」(Ernie Bot)等許多中國聊天機器人一樣,DeepSeek存在某些限制,當被問及中國國家主席習近平或北京當局的新疆政策時,它請求法新社「談些別的話題」。
然而,從編寫複雜的程式到解決困難的計算,DeepSeek的能力不遜於競爭對手,令業內人士感到驚訝。
美國AI新創公司Scale AI執行長亞歷山大.王(Alexandr Wang)告訴財經媒體CNBC:「我們發現…DeepSeek表現得最出色,可能與美國最優秀的模型表現不相上下。」
分析師長期以來認為,美國在生產高功率晶片方面的關鍵優勢,以及限制中國取得相關技術的能力,將確保美國在AI競賽中占據優勢地位。
然而,DeepSeek表示,訓練其中最新一款模型的成本為560萬美元,相比之下,AI開發商Anthropic執行長阿莫戴(Dario Amodei)去年曾表示,打造一個AI模型需要花費1億至10億美元。
DeepSeek在一份技術報告中表示,他們僅用2000多顆輝達公司(NVIDIA)晶片來訓練其V3模型。相比之下,訓練類似規模的模型通常需要數萬顆晶片。
美國政府試圖阻止最先進輝達產品進入中國,儘管DeepSeek上述花費遭到質疑,但據悉其使用的晶片性能不及最先進輝達產品,加上相對低廉的訓練成本,已引發美國科技業高層對科技出口管制有效性的質疑。
美國總統川普的親密顧問、創投家安德立森(Marc Andreessen)形容這是「AI的史普尼克時刻」。史普尼克時刻意指蘇聯搶先美國發射「史普尼克1號」(Sputnik 1)人造衛星的事件,象徵冷戰時期太空競賽的起點。
「華爾街日報」(The Wall Street Journal)指出,截至1月25日,DeepSeek的R1和V3語言模型雙雙擠進Chatbot Arena排行的前十名,甚至優於Anthropic公司的Claude與馬斯克(Elon Musk)旗下公司xAI的Grok。
Chatbot Arena是加州大學柏克萊分校的一個平台,供研究人員為AI聊天機器人表現排名。華爾街日報認為,中企研發的AI模型能擠進全球前十,顯示華府縱然祭出嚴格的晶片出口限制,仍擋不住中國在AI領域的快速進步。
前OpenAI主管卡斯(Zack Kass)表示,DeepSeek在美國重重設限依然有如此表現,「凸顯一個普遍的道理:資源受限往往更能激發創造力」。(譯者:王嘉語、陳亦偉/核稿:陳正健)1140127
- 2025/01/29 02:09
- 2025/01/27 22:11
- 2025/01/27 20:13
- 中國DeepSeek大受歡迎 美國晶片管制成效引發業界討論2025/01/27 20:04
- 2025/01/27 17:34
- 2025/01/26 22:56
本網站之文字、圖片及影音,非經授權,不得轉載、公開播送或公開傳輸及利用。