數發部攜手中央研究院釋出高品質研究語料 助攻多元AI應用

此活動已結束,原始頁面可能已失效

日期時間

2026年4月10日 星期五

地點

台北市

數位發展部

數位發展部

主辦單位

數位發展部

活動介紹

數發部攜手中央研究院釋出高品質研究語料 助攻多元AI應用

活動簡介

數位發展部「臺灣主權AI訓練語料庫」攜手中央研究院,上架多筆具代表性的研究及科普文本資源,涵蓋學術研究、政策分析、歷史文化及科普等多元面向,超過620萬詞元(tokens),內容兼具專業深度及知識價值。

活動內容

本次中研院上架語料包含:「政策建議書」涵蓋農業、科技及金融改革等多項政策建議,提供重要議題的深入分析與前瞻性觀點;「研究成果選輯」匯集我國研究亮點,橫跨人文社會、數理及生命科學等領域,讓AI模型能更精準掌握不同領域的知識背景與脈絡;「研之有物」與「科普專欄」以生動、淺顯易懂方式傳遞科學知識,將艱深內容轉化為易於理解的知識表述,成為AI學習多元語氣與知識轉譯的重要素材;「臺灣史研究所之館藏選粹」蘊含豐富在地歷史與文化記憶,補足模型對臺灣歷史視角的理解;「中研誠信電子報」則補充科研倫理與制度面向,提升模型在倫理議題上的判斷與回應能力。

注意事項

數發部表示,「臺灣主權AI訓練語料庫」自去(114)年底上線以來,已累計上架逾3,000筆資料集、超過12億詞元(tokens)。為持續豐富語料內容,未來也將持續攜手各機關及學研單位,擴大釋出具臺灣特色及專業價值之文本資料,共同厚植我國主權AI發展基礎。歡迎AI模型訓練者至語料庫(https://taic.moda.gov.tw)申請使用及取得最新資料集,一同拓展更多AI應用可能。

你可能也喜歡