台語語料庫檢索系統上線 可輔助教學、支援AI開發
2024/8/26 12:13
(中央社記者許秩維台北26日電)教育部委託國家教育研究院建置「台灣台語語料庫應用檢索系統」,提供語料、教科書詞彙、語法點等檢索,除了提供教學使用,也可作為語音處理或輔助教學的AI開發基礎。
教育部今天發布新聞稿指出,為全力支持本土語言研究,教育部於112年委託國家教育研究院建置及維護台灣台語語音語料庫相關計畫,將語料庫的成果加以保存、維護,並增錄教育部辭典及盧廣誠先生編纂的「華台對照詞典」例句,延伸建立「台灣台語語料庫應用檢索系統」(https://tggl.naer.edu.tw/)。
台灣台語語料庫應用檢索系統包含語料檢索系統、教科書詞彙檢索系統、語法點檢索系統,可查詢逾5.6萬筆台灣台語語料內容,並取得檢索詞彙的搭配詞、關聯詞及部分語音檔;系統還收錄約1400條教科書詞彙,可供查詢各版本台灣台語教科書中出現的詞彙及相關資訊;使用者也可查詢台灣台語語法點及其說明與例句,有助於深入學習。
另外,教育部也開放各界申請下載108年教育部辦理的台灣台語語音語料庫計畫成果,包括語料庫、音檔及語音處理的AI工具模型等,內容包含2.6萬餘句的文字,每句有4至6名發音人共6種聲音來源的音檔總計208小時。
教育部提到,為大規模保存台灣台語語料,自民國111年11月起委請陽明交通大學辦理新一階段的台灣台語語料庫建置計畫,預計至115年10月完成,將擴大建置文字語料2000萬字及口語語料3000小時的語料庫,並持續提高語音處理AI工具的實用效能,期望為本土語言研究、教學資源建置以及語言AI系統的開發貢獻更多力量。(編輯:陳清芳)1130826
本網站之文字、圖片及影音,非經授權,不得轉載、公開播送或公開傳輸及利用。