本網站使用相關技術提供更好的閱讀體驗,同時尊重使用者隱私,點這裡瞭解中央社隱私聲明當您關閉此視窗,代表您同意上述規範。
Your browser does not appear to support Traditional Chinese. Would you like to go to CNA’s English website, “Focus Taiwan”?
こちらのページは繁体字版です。日本語版「フォーカス台湾」に移動しますか。
中央社一手新聞APP Icon中央社一手新聞APP
下載

研究機構:DeepSeek硬體GPU支出逾160億台幣

2025/2/1 11:35
請同意我們的隱私權規範,才能啟用聽新聞的功能。
請同意我們的隱私權規範,才能啟用聽新聞的功能。

(中央社記者張欣瑜舊金山31日專電)中國新創公司DeepSeek的模型成本引發熱議,並且造成股市震盪。研究機構SemiAnalysis今天發布報告指出,該公司至今在硬體繪圖處理器(GPU)上的支出遠超過5億美元(約新台幣160億元)。

SemiAnalysis指出,中國對沖基金幻方量化(High-Flyer)在2023年5月成立「深度求索」(DeepSeek)以推動AI技術研發,在此之前,幻方量化於2021年,也就是任何出口管制生效前,投資購買了1萬顆輝達(Nvidia)A100 GPU。

報告指出,該公司在GPU的投資上花費超過5億美元。

報告稱,輝達根據法規要求,生產了多款H100的變化版,如H800、H20。目前僅有H20可銷售給中國。輝達在過去9個月已生產超過100萬顆專供中國市場的H20 GPU。

報告分析顯示,DeepSeek的伺服器總資本支出(CapEx)約為16億美元。

報告提到,DeepSeek從中國本土招募人才,目前約有150名員工,正急速擴張。

DeepSeek的價格和效能這一週因出現模型訓練成本低於600萬美元的說法引起討論。報告強調預訓練成本僅是總成本一小部分,不代表完整支出。

DeepSeek論文中提到的600萬美元成本指的是預訓練運行(pre-training run)時的GPU成本,是模型總成本的一部分,未計入的重要支出還包括研發(R&D)、硬體總擁有成本(Total Cost of Ownership)等關鍵因素。

報告也提到DeepSeek能獲得大量算力資源與出口管制存在時間滯後(lag)有關。

訂閱《早安世界》電子報 每天3分鐘掌握10件天下事
請輸入正確的電子信箱格式
訂閱
感謝您的訂閱!

美國智庫蘭德公司(RAND)研究員海姆(Lennart Heim)近期分析,硬體的出口管制存在時間滯後,目前尚未完全發揮影響力。真正的考驗將出現在數據中心需要升級或擴展時,這對美國企業較為容易,但對受到出口管制的中國企業而言將是挑戰。

SemiAnalysis也評價指出,DeepSeek在開放權重模型上表現出色,超越Meta的Llama 、法國人工智慧新創公司Mistral AI、以及其他競爭者。(編輯:陳慧萍)1140201

中央社「一手新聞」 app
iOS App下載Android App下載

本網站之文字、圖片及影音,非經授權,不得轉載、公開播送或公開傳輸及利用。

請繼續下滑閱讀
DeepSeek掀資安疑慮 美國務院:將限制使用有風險工具
106