本網站使用相關技術提供更好的閱讀體驗,同時尊重使用者隱私,點這裡瞭解中央社隱私聲明當您關閉此視窗,代表您同意上述規範。
Your browser does not appear to support Traditional Chinese. Would you like to go to CNA’s English website, “Focus Taiwan”?
こちらのページは繁体字版です。日本語版「フォーカス台湾」に移動しますか。
中央社一手新聞APP Icon中央社一手新聞APP
下載

AIEC公布語言模型評測 Gemini於台灣價值觀表現優異

2025/10/3 14:24(10/3 14:36 更新)
請同意我們的隱私權規範,才能啟用聽新聞的功能。
AI產品與系統評測中心(AIEC)3日首次公布語言模型基準評測結果,資安院副院長龔化中(右)、工研院資訊與通訊研究所組長王邦傑(左)出席說明。中央社記者趙敏雅攝 114年10月3日
AI產品與系統評測中心(AIEC)3日首次公布語言模型基準評測結果,資安院副院長龔化中(右)、工研院資訊與通訊研究所組長王邦傑(左)出席說明。中央社記者趙敏雅攝 114年10月3日
請同意我們的隱私權規範,才能啟用聽新聞的功能。

(中央社記者趙敏雅台北3日電)AI產品與系統評測中心(AIEC)今天首次公布語言模型基準評測結果,台灣開發的TAIDE(Gemma-3-TAIDE-12b)在小模型中表現突出,展現研發實力;至於在大模型台灣價值觀評測,Google Gemini 2.5 Flash表現優異,AIEC認為,顯示Gemini對台灣主流價值觀具備較高理解與對應能力。

數發部與資安院、工研院合作於2023年底成立AIEC,制定人工智慧(AI)評測相關制度、標準及評測體系,旨在推動台灣AI產業發展,拓展國內外商機。

AIEC上午舉行記者會公布語言模型基準評測結果。資安院副院長龔化中表示,參酌國際標準、美國與歐盟等相關規範,擬定評測項目包含公平性、準確性、可靠性、隱私及資安,受測者可依需求選擇評測項目。

龔化中說明,這次依語言模型規模系統性檢測國內外模型表現,評測指標除採用高中學測國文科及高中學測社會科外,更納入台灣價值觀,以符合國際AI主權發展趨勢,並作為未來建構在地模型或調校國際模型的重要基準。

此次共評測42項語言模型,龔化中指出,由國內開發的TAIDE(Gemma-3-TAIDE-12b)在小模型(13b以下)內表現名列前茅,比所使用的原基礎模型Google(Gemma-3-12b-it)表現更佳,展現台灣AI研發實力。

大模型部分,以OpenAI GPT-5整體表現最佳,其中Google Gemini 2.5 Flash在台灣價值觀評測上表現優異,顯示對台灣主流價值觀具備較高理解與對應能力。部分中國語言模型在台灣價值觀評測也表現不錯,研判可能是因為模型採用「蒸餾技術」,以歐美地區基礎模型輸出作為訓練資料。

google news透過 Google News追蹤中央社

龔化中指出,部分歐美語言模型若未使用到台灣繁體中文語料進行訓練,在台灣價值觀評測上表現較差,顯現建置本土化語料重要性。數發部積極推動台灣主權AI語料庫,提供具在地語境與本土價值的繁體中文資料,作為語言模型訓練重要基礎,確保AI發展符合台灣社會價值與語言文化。

AIEC表示,將廣泛徵求各界專家提供評測題目,並針對不同產品、系統與應用領域,持續推動國內自行研發AI評測工具,同時,對接國際評測方法、規範或標準,強化台灣AI產品市場適用性與全球化發展,建立可信賴的AI評測體系。(編輯:潘羿菁)1141003

中央社「一手新聞」 app
iOS App下載Android App下載

本網站之文字、圖片及影音,非經授權,不得轉載、公開播送或公開傳輸及利用。

90