DeepSeek傳為改用中國國產GPU做準備 跳出輝達限制
2025/2/3 16:47(2/3 17:04 更新)
(中央社台北3日電)中國AI新創公司「深度求索」(DeepSeek)開發的大語言模型繞過美國人工智慧巨頭輝達(NVIDIA)的CUDA框架,據報導,DeepSeek正為未來適配中國國產GPU晶片做準備。
香港星島日報網今天引述陸媒報導,輝達的「統一運算架構」(Compute Unified Device Architecture,CUDA)能大幅降低研發大模型的難度,獲全球開發商使用,讓輝達在人工智慧(AI)發展上擁有壟斷地位。
報導並引述美國科技網站指出,DeepSeek使用輝達的H800晶片進行訓練時,使用了輝達的底層硬體指令PTX(Parallel Thread Execution)語言,而不是高級編程語言CUDA。
透過 Google News追蹤中央社
北京航空航太大學副教授黃雷表示,繞過CUDA意味著DeepSeek可以直接根據GPU的驅動函數做一些新的開發,進而實現更加細微性的操作。
報導說,DeepSeek擁有一些擅長寫PTX語言的內部開發者,若之後使用中國國產GPU,DeepSeek在硬體適配方面將更得心應手,DeepSeek只要了解這些硬體驅動提供的一些基本函數介面,即可仿照輝達GPU硬體的程式設計介面寫相關代碼,進而讓自家大模型更加容易適配中國國產硬體。(編輯:周慧盈/張淑伶)1140203
延伸閱讀
DeepSeek為何震撼美股、與OpenAI技術差多少?QA一次看卓榮泰:公務機關全面禁用Deepseek AI服務德州開美50州第一槍 禁政府機構用DeepSeek及小紅書研究機構:DeepSeek硬體GPU支出逾160億台幣DeepSeek標榜低成本 美準商務部長:偷來的當然便宜OpenAI執行長:DeepSeek令人驚豔 但關鍵在運算DeepSeek爆紅後掀疑慮 世界主要國家應對措施一覽- DeepSeek傳為改用中國國產GPU做準備 跳出輝達限制2025/02/03 16:47
- 2025/02/03 16:42
- 2025/02/02 08:22
本網站之文字、圖片及影音,非經授權,不得轉載、公開播送或公開傳輸及利用。
請繼續下滑閱讀
卓榮泰:公務機關全面禁用DeepSeek AI服務