DeepSeek37/104

DeepSeek傳為改用中國國產GPU做準備跳出輝達限制

2025/2/3 16:47（2/5 07:23 更新）

請同意我們的隱私權規範，才能啟用聽新聞的功能。

請同意我們的隱私權規範，才能啟用聽新聞的功能。

（中央社台北3日電）中國AI新創公司「深度求索」（DeepSeek）開發的大語言模型繞過美國人工智慧巨頭輝達（NVIDIA）的CUDA框架，據報導，DeepSeek正為未來適配中國國產GPU晶片做準備。

香港星島日報網今天引述陸媒報導，輝達的「統一運算架構」（Compute Unified Device Architecture，CUDA）能大幅降低研發大模型的難度，獲全球開發商使用，讓輝達在人工智慧（AI）發展上擁有壟斷地位。

報導並引述美國科技網站指出，DeepSeek使用輝達的H800晶片進行訓練時，使用了輝達的底層硬體指令PTX（Parallel Thread Execution）語言，而不是高級編程語言CUDA。

透過 Google News追蹤中央社

北京航空航太大學副教授黃雷表示，繞過CUDA意味著DeepSeek可以直接根據GPU的驅動函數做一些新的開發，進而實現更加細微性的操作。

報導說，DeepSeek擁有一些擅長寫PTX語言的內部開發者，若之後使用中國國產GPU，DeepSeek在硬體適配方面將更得心應手，DeepSeek只要了解這些硬體驅動提供的一些基本函數介面，即可仿照輝達GPU硬體的程式設計介面寫相關代碼，進而讓自家大模型更加容易適配中國國產硬體。（編輯：周慧盈/張淑伶）1140203

延伸閱讀