本網站使用相關技術提供更好的閱讀體驗,同時尊重使用者隱私,點這裡瞭解中央社隱私聲明當您關閉此視窗,代表您同意上述規範。
Your browser does not appear to support Traditional Chinese. Would you like to go to CNA’s English website, “Focus Taiwan”?
こちらのページは繁体字版です。日本語版「フォーカス台湾」に移動しますか。
中央社一手新聞APP Icon中央社一手新聞APP
下載

輝達助攻 鴻海研究院推首版繁體中文AI大語言模型

請同意我們的隱私權規範,才能啟用聽新聞的功能。
FoxBrain模型(對比Meta Llama 3.1 70B與Llama-3-Taiwan-70B)在TMMLU+上面幾個重要領域的得分。(圖取自鴻海網頁honhai.com)
FoxBrain模型(對比Meta Llama 3.1 70B與Llama-3-Taiwan-70B)在TMMLU+上面幾個重要領域的得分。(圖取自鴻海網頁honhai.com)

(中央社記者鍾榮峰台北10日電)鴻海今天上午宣布,鴻海研究院推出第1版具有推理能力的人工智慧(AI)繁體中文大型語言模型,未來將透過導入AI大型語言模型,強化智慧製造、智慧電動車、智慧城市等3大平台的數據分析效率。

在模型訓練過程中,鴻海說明,輝達提供Taipei-1超級電腦以及技術諮詢,讓鴻海研究院透過使用輝達NeMo人工智慧模型服務,順利完成模型訓練。

鴻海上午透過新聞稿宣布,鴻海研究院推出首款繁體中文AI大型語言模型(LLM),內部開發代碼FoxBrain,FoxBrain模型原來為內部應用設計,涵蓋數據分析、決策輔助、文書協作、數學、推理解題與代碼生成等功能,後續將對外開源分享。

「開源」(open sourced)意指支撐AI的運算代碼公開給其他企業和研究人員,讓所有人都能使用這些技術來建構、推廣自己的產品。

鴻海指出,FoxBrain作為鴻海研究院AI推理LLM模型訓練成果,展現理解與推理能力,在數學與邏輯推理測試中表現出色,還能強化台灣使用者的語言風格。

鴻海研究院說明,人工智慧研究所在FoxBrain訓練過程中,使用120張輝達(NVIDIA)H100繪圖處理器(GPU),並透過NVIDIA Quantum-2 InfiniBand網路擴展,僅花費約4週時間完成,模型訓練方式低成本且更具效率。

在相關規格與訓練策略上,鴻海研究院指出,FoxBrain透過自主技術,建立24類主題的資料增強方式與品質評估方法,生成98B詞元(tokens)高品質中文預訓練資料,上下文處理長度128K token,總計算力花費2688 GPU days,採用多節點平行訓練架構,確保高效能與穩定性。

在測試結果,鴻海研究院表示,FoxBrain在數學領域較基礎模型Meta Llama 3.1全面提升,相較於目前最好的繁體中文大模型Taiwan Llama,在數學測試中取得顯著進步,並在數學推理能力上超越Meta目前已推出的同等級模型,與DeepSeek蒸餾模型仍有些微差距,但表現已相當接近世界領先水準。

google news透過 Google News追蹤中央社

鴻海指出,未來將透過導入AI大型語言模型,強化智慧製造、智慧電動車、智慧城市等3大平台的數據分析效率,讓FoxBrain成為驅動智慧應用升級的重要引擎,未來將對外開源分享,擴大模型運用範圍,與技術夥伴共同推動AI在製造業、供應鏈管理與智慧決策領域應用。

鴻海表示,FoxBrain成果將於美國時間3月17日起登場的輝達年度GTC大會專題演講中,以From Open Source to Frontier AI: Build, Customize, and Extend Foundation Models為主題,首次對外發表。(編輯:林家嫻)1140310

鴻海10日上午宣布,鴻海研究院推出第1版具有推理能力的人工智慧(AI)繁體中文大型語言模型。(中央社檔案照片)
鴻海10日上午宣布,鴻海研究院推出第1版具有推理能力的人工智慧(AI)繁體中文大型語言模型。(中央社檔案照片)
支持中央社

選擇與事實站在一起,您的每一份贊助,都是守護新聞自由的力量

小額贊助

下載中央社「一手新聞」APP,即時掌握最新消息

iOS App下載Android App下載

本網站之文字、圖片及影音,非經授權,不得轉載、公開播送或公開傳輸及利用。

請繼續下滑閱讀
82