台版AI對話引擎年底釋大模型奠定商業版發展基礎

2023/6/14 18:57（6/14 21:56 更新）

請同意我們的隱私權規範，才能啟用聽新聞的功能。

（中央社記者張璦台北14日電）今天亮相的台版AI對話引擎初代模型，能將「Taiwan’s own Jay Chou」譯成「臺灣歌手周杰倫」，也可自動摘要、寫信推薦台灣旅遊必去景點。國科會表示，希望年底釋出更大的模型，後續團隊擬規劃商業授權版。

人工智慧（AI）浪潮席捲，隨英文、簡體中文版聊天機器人相繼問世，相關爭議叢生，國科會拍板，公私協力發展融合台灣元素、以正體中文為主的「可信任人工智慧對話引擎」（Trustworthy AI Dialog Engine，TAIDE），TAIDE計畫經費約新台幣2億元至3億元。

國科會今天召開記者會，公布第一階段完成「7B」中模型（參數量為70億），此模型是在LLaMA（Meta推出的語言模型）原型基礎上，由國內學界專家進一步發展及訓練調校。

何謂「7B」，國科會科技政策諮詢專家室資通訊群組召集人李育杰解釋，參數量越多，代表這模型的複雜度越高，訓練的成本就越大，對應的資料量也得更大；目前ChatGPT採「GPT-3.5」模型則是175B。

談及TAIDE規劃，李育杰表示，目前展示的7B模型可做到自動摘要、翻譯文本、寫信、寫文章等4個面向；在記者會播放的示範影片中，7B模型可翻譯簡短英文段落，把其中的「K-Pop sensation BTS」譯為「韓國男子音樂團體BTS」、「Taiwan’s own Jay Chou」翻成「臺灣歌手周杰倫」。

同時，7B模型可用寫信的方式，推薦台灣旅遊的5個必去景點。

下一步要陸續往大模型推進，李育杰指出，第2階段在任務處理上，包含認識台灣、事實查核與詐騙防範，檢視模型能否成為「好幫手」。

針對第3階段的可信任模型，李育杰說明，是做到信任的提升、阻絕涉及犯罪等不該產生的回應，同時考量倫理因素。

李育杰表示，最後則是整合前面3階段，展示「昇華」系統，讓任務的達成更具水準。

李育杰指出，TAIDE模型訓練由小到大，團隊在過程中累積經驗，是「最科學、最節儉」的方式；下半年國網中心會增設一些新設備，盼10月順利取得全球搶單的H100新GPU，讓H100投入大模型的訓練，過了10月也希望取得較大的算力。

此外，李育杰說，LLaMA是授權學術使用，「不拿去賺錢、大概就沒什麼問題」；不過，呼應業界商用及訓練需求，後續團隊擬規劃商業授權版模型，但這就不會是在LLaMA基礎上。

透過 Google News追蹤中央社

他指出，業界也很想知道，訓練13B模型要投入多少成本、基礎模型要怎麼樣Fine-Tune（微調）、後續如何加強能力，達到真正的合用，因此團隊希望把SOP、經驗與業界交流。

李育杰表示，未來除做源碼檢測確保資安要求，TAIDE模型能否抵抗「越獄測試」（比如不能問涉及犯罪問題，但換個方法問套出答案），也是關鍵，之後會進行「紅隊演練」（Red Teaming），由白帽駭客尋找系統可被利用的潛在高度風險弱點。（編輯：林興盟）1120614

#周杰倫

#李育杰

台版AI對話引擎年底釋大模型奠定商業版發展基礎

淡江大橋工程難度高　3D曲面橋塔展現台灣技術已達世界水準

謝淑薇攜手10搭檔奪WTA巡迴賽冠軍　再擦亮「百搭天后」招牌

金唱片紅毯CORTIS打頭陣　Jennie紅禮服壓軸亮相【圖輯】

高市早苗研議解散眾議院　日媒解析近幾任日相決策考量

義大利美食成世界文化遺產　廚師揭秘：說好在地故事

台版AI對話引擎年底釋大模型 奠定商業版發展基礎

淡江大橋工程難度高 3D曲面橋塔展現台灣技術已達世界水準

謝淑薇攜手10搭檔奪WTA巡迴賽冠軍 再擦亮「百搭天后」招牌

金唱片紅毯CORTIS打頭陣 Jennie紅禮服壓軸亮相【圖輯】

高市早苗研議解散眾議院 日媒解析近幾任日相決策考量

義大利美食成世界文化遺產 廚師揭秘：說好在地故事

台版AI對話引擎年底釋大模型奠定商業版發展基礎

淡江大橋工程難度高　3D曲面橋塔展現台灣技術已達世界水準

謝淑薇攜手10搭檔奪WTA巡迴賽冠軍　再擦亮「百搭天后」招牌

金唱片紅毯CORTIS打頭陣　Jennie紅禮服壓軸亮相【圖輯】

高市早苗研議解散眾議院　日媒解析近幾任日相決策考量

義大利美食成世界文化遺產　廚師揭秘：說好在地故事