本網站使用相關技術提供更好的閱讀體驗,同時尊重使用者隱私,點這裡瞭解中央社隱私聲明當您關閉此視窗,代表您同意上述規範。
Your browser does not appear to support Traditional Chinese. Would you like to go to CNA’s English website, “Focus Taiwan”?
こちらのページは繁体字版です。日本語版「フォーカス台湾」に移動しますか。
中央社一手新聞APP Icon中央社一手新聞APP
下載

數發部攜手中研院釋出研究語料 助攻多元AI應用

2026/4/10 16:23
請同意我們的隱私權規範,才能啟用聽新聞的功能。

(中央社記者趙敏雅台北10日電)台灣主權AI訓練語料庫上線逾3個月,數發部今天表示,近期攜手中央研究院,上架多筆具代表性的研究及科普文本資源,涵蓋學術研究、政策分析、歷史文化及科普等多元面向,超過620萬詞元(tokens),支援AI模型在專業領域多元應用。

數發部推動台灣主權AI訓練語料庫,廣納高品質、具在地化的正體中文語料,去年底語料庫上線後,數發部持續攜手各單位擴充內容。AI模型訓練者可至語料庫申請使用及取得最新資料集,拓展更多AI應用可能。

數發部今天透過新聞稿表示,這次中研院上架多筆具代表性的研究及科普文本資源,包括學術研究、政策分析、歷史文化及科普等,超過620萬詞元,內容兼具專業深度及知識價值。

數發部介紹,中研院上架語料有「政策建議書」,涵蓋農業、科技及金融改革等多項政策建議,提供重要議題的深入分析與前瞻性觀點;「研究成果選輯」匯集台灣研究亮點,橫跨人文社會、數理及生命科學等領域,讓AI模型能更精準掌握不同領域的知識背景與脈絡。

此外,數發部指出,「研之有物」與「科普專欄」以生動、淺顯易懂方式傳遞科學知識,將艱深內容轉化為易於理解的知識表述,成為AI學習多元語氣與知識轉譯的重要素材;「台灣史研究所之館藏選粹」蘊含豐富在地歷史與文化記憶,補足模型對台灣歷史視角的理解;「中研誠信電子報」則補充科研倫理與制度面向,提升模型在倫理議題上的判斷與回應能力。

數發部說明,專業領域知識語料能提升模型在特定情境及領域的應用及理解能力,也有助強化模型推理能力與回應精準度,如建置檢索增強生成(RAG)知識庫、發展專業問答系統、進行模型微調,以及應用在摘要、分類與知識萃取等任務,促進具深度與專業性的AI應用發展。

數發部表示,台灣主權AI訓練語料庫去年底上線以來,已累計上架逾3000筆資料集、超過12億詞元,未來也將持續攜手各機關及學研單位,擴大釋出具台灣特色及專業價值的文本資料,共同厚植台灣主權AI發展基礎。(編輯:楊蘭軒)1150410

支持中央社

選擇與事實站在一起,您的每一份贊助,都是守護新聞自由的力量

小額贊助

下載中央社「一手新聞」APP,即時掌握最新消息

iOS App下載Android App下載

本網站之文字、圖片及影音,非經授權,不得轉載、公開播送或公開傳輸及利用。

24