國科會發展台灣可信任AI對話引擎 盼守住繁中語料
(中央社記者張璦台北14日電)政府單位、金融業等資料具機敏性,不能萬事問ChatGPT,國科會主委吳政忠今天表示,發展「可信任人工智慧對話引擎」(TAIDE)是「打地基」,未來提供公私部門加值應用、向上「蓋樓房」,也是守住台灣擁有的豐富、珍貴繁體中文語料。
隨英文、簡體中文版聊天機器人相繼問世,相關爭議叢生。國科會拍板,公私協力發展融合台灣元素、以正體中文為主的「可信任人工智慧對話引擎」(Trustworthy AI Dialog Engine,TAIDE),計畫經費約新台幣2億元至3億元。
國科會今天召開記者會,公布第一階段完成了「7B」中模型(參數量為70億),此模型是在LLaMA(Meta推出的語言模型)原型基礎上,由國內學界專家進一步發展及訓練調校。
在計畫起步階段、時間與資料有限下,實測自動摘要、翻譯文本、寫信及寫文章等4方面,TAIDE「7B模型」均有不錯表現,尤其對於繁體中文的處理能量及回答,更為穩定準確。
行政院政委兼國科會主委吳政忠坦言,台灣投入TAIDE預算經費「小小小」,這筆錢拿去買房確實可以買到「大房」,但拿去跟在開發引擎的歐美科技大廠相比,一定是少的;台灣不是要做泛用型,而是從基礎引擎做起「打地基」,未來「上面要蓋什麼樣的樓房」,將攜手公部門、業者做各種應用,達成綜效(synergy)。
吳政忠指出,後續各單位可依照需求選擇適用的模型大小,並衡量所需算力及成本,自行運用加值,加速台灣各領域掌握自主性的能力。
台灣之所以必須自己來,是因為「有些東西不能隨便問別人」。吳政忠舉例,台灣公家單位、金融業、科技大廠等資料具機敏性,當然不能問ChatGPT,畢竟AI不斷在學習,資料數據一輸入,無形中就被收走了;再者,台灣擁有豐富繁體中文語料,是「寶貝」,這部分也要守住。
國科會科技政策諮詢專家室資通訊群組召集人李育杰指出,TAIDE計畫考慮兼容、包容性,未來不管是台語、客語都會概括。
針對繁體中文語料的使用,國科會官員及TAIDE團隊表示,目前洽談合作中,後續將取得更大範圍的資料。
國科會打造TAIDE,聚集國內相關領域最頂尖的教授團隊,負責指導核心模型及對話學習技術開發;國科會轄下法人機構,例如國研院國網中心負責建置新一代超級電腦,以提升算力資源,並提供應用服務平台;科政中心則負責徵集處理訓練資料。
此外,數位發展部負責驗測環境架構的發展,並針對計畫所產出的模型進行評測,以提供可信任的證據基礎。(編輯:張良知)1120614
本網站之文字、圖片及影音,非經授權,不得轉載、公開播送或公開傳輸及利用。