繁中AI語言模型出包 中研院將建風險研究小組
2023/10/11 12:56(10/11 13:20 更新)
(中央社記者吳欣紜台北11日電)由中研院研究員所開發的繁體中文語言模型AI日前被發現自稱中國籍,中研院最新聲明指出,將釐清是否違反相關規定,也將成立「生成式AI風險研究小組」,避免類似情況再發生。
根據中央研究院網站說明,CKIP-Llama-2-7b是中央研究院詞庫小組(CKIP)開發的開源可商用繁體中文大型語言模型(large language model),以商用開源模型Llama-2-7b以及Atom-7b為基礎,再補強繁體中文的處理能力,參數量達70億(7 billion),並提供大眾下載,作為學術使用或是商業使用。
不過,該語言模型日前經網友實測提問,卻自動回覆「我的國籍是中國」等,中研院後續也將測試版先下架。
中研院最新聲明指出,相當重視此事件對社會的影響,將釐清事件是否違反相關規定,後續也將規劃成立「生成式AI風險研究小組」,深入了解AI對社會的衝擊,提供研究人員相關指引,避免類似事件再度發生。
中研院也提到,繁體中文語料庫是發展台灣大型語言模型的重要基礎,後續將整合繁體中文詞知識庫,投入資源並規劃管理機制。
中研院也說,院內已召開數次生成式AI相關會議,將擴大召集AI相關的跨領域研究人員,以團隊方式連結資訊科技、人文及社會科學人才進行跨領域研究,與全國各界共同促進台灣繁體語境生成式AI的發展。(編輯:陳政偉)1121011
本網站之文字、圖片及影音,非經授權,不得轉載、公開播送或公開傳輸及利用。