台灣AI引擎TAIDE開源模型4月開放 助打造手機與PC應用
(中央社記者張璦台北20日電)國科會主委吳政忠今天宣布,台灣繁體中文「可信任人工智慧對話引擎」(TAIDE)的參數量70億(7B)可商用版本,將於4月中旬開放為開源模型,有效降低台灣產業導入大型語言模型的成本,可依據台廠不同需求推出應用,比如內建於PC中。
為因應國際大型語言模型常產生資訊偏誤、或不符台灣文化與價值觀的回應,國科會去年4月啟動TAIDE計畫,在LLaMA(Meta推出的語言模型)原型基礎上,由國內學界專家進一步發展及訓練調校,推出7B、13B等版本。
國科會並在今天召開的第10次委員會議中報告「TAIDE推動成果與未來展望」,會後記者會上,也讓媒體現場試用13B版本功能。根據記者試用,TAIDE可用繁體中文撰寫致詞稿,也可以「很有禮貌」的口吻寫採訪邀約信,並精準回答「請問台灣是一個國家嗎」等認知性質問題。
吳政忠表示,發展台灣專屬的大型語言模型極為重要,最終目標在於落地應用、讓全民有感,國科會將繼續支持TAIDE團隊,使TAIDE模型與時俱進,成為台灣指標性的基礎模型,也會持續推動跨部會合作投入人才培育、算力布建及資料整備等基礎建設。
國科會科技辦公室副執行秘書楊佳玲指出,目前TAIDE團隊已開發出7B可商用版本,以及13B學研用版本模型,具備多輪對話及阻絕產生不恰當回應的能力,後續除支援公部門導入TAIDE,也將於近期開源釋出7B可商用版本,供外界自由運用。
吳政忠指出,預計TAIDE 7B可商用版本將在4月中旬開放為開源模型,但作法與OpenAI等歐美大廠不同,OpenAI是提供使用者帳號、可馬上登錄使用,這背後需要非常多的維運支援、要私人企業財力支應,TAIDE則是「打地基」,把模型釋出給業者,讓廠商未來可embed(嵌入)到手機、個人電腦(PC)等,給民眾使用。
國科會科技政策諮詢專家室資通訊群組召集人李育杰說明,業者未來也可以運用TAIDE 7B版本,投入自有資料進行微調(fine-tune);在產學研合作下,也共同發展出智慧客服、行政常見問題回應、農業知識問答及中小學台語教學等應用案例。
楊佳玲進一步表示,TAIDE團隊從字詞語料、通用文本、特定專用等3面向盤點公私部門資料並個別洽商授權完成,已處理的優質繁中資料共89.4GB,而TAIDE 13B版本在寫文章、寫信、摘要、英翻中、中翻英等5大功能的表現,已與ChatGPT 3.5相當,並擁有豐富在地知識。
在建置運算資源方面,李育杰表示,已投入新台幣1億1000萬元建置最新GPU H100運算資源,與台灣杉二號完成系統整合,去年11月開始測試、12月正式服務,希望後續藉算力的加強,訓練出70B模型。(編輯:楊凱翔)1130320
本網站之文字、圖片及影音,非經授權,不得轉載、公開播送或公開傳輸及利用。