DeepSeek對上Stargate 全球AI產業大爆發

AI開源模型的優勢在於透明性、成本效益、生態系統的潛力,以及兼顧安全與創新的平衡。DeepSeek R1與Meta Llama系列模型只不過是這場革命的開端。
文/吳家豪 (中央社記者)
中國新創公司「深度求索」(DeepSeek)1月底推出R1模型,主打低成本也能具備媲美OpenAI模型的高效推理能力,震撼人工智慧(AI)業界。
2月底DeepSeek舉辦程式碼「開源週」活動,宣布開源五個程式庫(repos),以公開透明的方式分享AI新進展,有助降低AI模型開發門檻,並透過優化算力資源來提升效率。
Linux開源成功在先 DeepSeek出場引震撼
DeepSeek掀起波瀾的關鍵在於開放原始碼(open source),簡稱開源。通常開源軟體會公開在網路上,免費提供所有人使用與修改,因此更容易受到企業和開發者青睞。
不過,AI近年快速興起,難以完全適用以往針對軟體的開源定義。
開放原始碼倡議組織(Open Source Initiative, OSI)過去數年邀各界合作,共同撰寫開源人工智慧(Open Source Artificial Intelligence, Open Source AI)的定義,2024年10月28日發布第一個版本:開源AI應允許任何人自由使用、研究、修改及分享,並確保用戶可以存取完整的系統資料,以進行修改和再發布。
OSI第一版的定義較嚴格,不少科技公司只是開源模型權重,並未開源資料和訓練流程,無法稱作真正的開源AI。就連參與制定開源AI定義的Meta也曾被OSI質疑,其推出的Llama模型不符合開源定義。
Meta去年7月發表旗下最大開源AI模型Llama 3.1,具備高達4,050億個參數,使用超過1.6萬顆輝達H100繪圖處理器(GPU)訓練。Meta執行長祖克柏(Mark Zuckerberg)當時發文指出,雖然有幾家業者開發了領先的封閉模型,但開源模型正迅速縮小差距。
祖克柏認為,AI應以開源作業系統Linux的發展為借鏡。當初Unix作業系統的封閉性促使Linux興起,原本是因為開發者可自行修改程式碼且成本更低;但隨著時間推移,Meta Linux變得更進步、更安全,擁有更廣泛的生態圈,現在已成為雲端運算和大多數行動裝置作業系統的基礎。
低成本不必犧牲效能 開源AI孕育強大生態圈
開源模型有什麼優勢?對企業有何好處?
OSI的定義點出開源AI的核心優勢之一:透明與自主性,不僅促進知識共享,也讓中小型企業或獨立開發者得以在有限資源下,打造出符合特定場景的AI解決方案,不必從零開始耗費巨資訓練模型。
相較之下,像OpenAI這樣的封閉模型供應商,始終將技術細節藏在「黑盒子」裡,用戶只能被動接受,無法真正掌握技術的主導權。
另一個不容忽視的優勢在於成本效益。AI模型的訓練動輒需要數千顆高階GPU,成本之高,已非一般企業能負擔。開源模型大幅降低進入門檻,當模型權重或訓練程式碼公開後,開發者只需利用現有資源微調或部署,就能打造高效應用。DeepSeek的R1模型體現了這個理念,主打低成本卻不必犧牲效能,為資金有限的團隊提供了生存空間。
更重要的是,開源AI能孕育出強大的生態圈。單一公司打造的封閉模型,往往受限於商業目標和技術路線,難以滿足多元需求。開源模式則匯聚全球開發者的智慧,透過集體協作不斷迭代優化。就像Linux當初不過是個小眾項目,卻因開源性質吸引無數貢獻者。AI的發展如果走上類似道路,開發者不僅能共享模型,還能構建工具、應用甚至全新產業鏈。
舉例來說,DeepSeek開源的程式庫一旦發布後,可能激發從資料處理到推理加速的各種創新,這種協作模式絕非封閉系統可以比擬。
當然,開源AI並非毫無爭議,就像Llama模型被質疑不算真正開源。即使如此,部分開源仍比完全封閉有吸引力,目前的AI開源模型或許未臻完美,但其開放性已足以推動產業向前邁進。
坦言領先幅度將縮小 OpenAI有意逐步降價
開源AI還帶來安全與創新的雙贏。有人擔心,公開原始碼會遭惡意人士濫用,但也意味著有更多人可以檢視程式碼,發現漏洞並修補。Linux之所以變得安全,正是因為背後有龐大的社群支持。AI如果能複製這個模式,未來的模型或許不僅變得更穩健,還能因為多元視角而催生更多突破性應用。
AI開源模型的優勢在於透明性、成本效益、生態系統的潛力,以及兼顧安全與創新的平衡。DeepSeek R1與Meta Llama系列模型只不過是這場革命的開端,隨著越來越多玩家加入開源陣營,AI產業的競爭格局勢必迎來巨大改變。
開源模型的威力,也讓AI產業領先者不得不反思。OpenAI執行長阿特曼(Sam Altman)親自登上社群平台Reddit回答網友提問,除了坦承後悔沒選擇開源路線,也指出自家模型的領先幅度將縮小。
OpenAI的模型提供有限使用的免費版,以及最低每月20美元(約新台幣658元)的付費版,距離「人人都能用AI」的願景還有一段差距。DeepSeek的低成本帶來一定的競爭壓力,阿特曼已打算逐步降低ChatGPT Plus訂閱方案價格,對全球AI用戶是一大福音。
Stargate計畫砸16兆元 美加速打造AI基礎設施
為了確保在AI產業的領導地位,美國總統川普(Donald Trump)上任隔天就宣布,OpenAI、甲骨文(Oracle)與日本軟銀集團將合資5,000億美元(約新台幣16兆3,250億元)打造「星際之門」(Stargate)計畫,在全美建造20座超級資料中心,並推動通用人工智慧(AGI)的突破,堪稱史上規模最大的基礎建設計畫之一。
儘管億萬富豪馬斯克(Elon Musk)在社群平台X上對Stargate計畫潑了冷水,質疑軟銀是否真能掏出承諾的資金,不過,Stargate計畫的野心已點燃全球AI產業的熱情。
Stargate計畫掀起波瀾的關鍵,在於不僅僅砸錢興建資料中心,更試圖透過整合算力與技術資源,打造前所未有的AI生態圈。
DeepSeek與Stargate競爭 經濟與地緣政治的博弈
川普在宣布Stargate計畫時強調,這是「美國製造」的再出發,要確保AI的領導權不旁落他國,尤其是中國。言下之意,這不只是硬體供應鏈的催化劑、軟體創新的加速器,更是一場經濟與地緣政治的博弈。
從硬體層面來看,Stargate將大舉推升對AI伺服器與高效能晶片的需求,輝達、超微(AMD)等晶片大廠自然成為直接受益者;而台積電、鴻海等台廠供應鏈也可能分食這塊大餅,提升在全球AI產業鏈的地位,更凸顯出「美國優先」政策正在重塑供應鏈版圖。
就軟體與技術層面,Stargate計畫參與者OpenAI已在生成式AI領域站穩腳步,如今有了5,000億美元資源挹注,勢必加速AGI的研發步伐。
軟銀執行長孫正義表示,Stargate是改變AI發展速度的關鍵,將讓AI算力每年暴增1,000倍,幾年內達到10億倍成長。但高達5,000億美元的資金如何有效分配與執行,是個大哉問,同時需要面對能源供應、環境影響等挑戰。
不可諱言,Stargate的影響並非全然正面。這項計畫高調亮相,讓競爭對手感受到空前壓力,DeepSeek宣布開源五個程式庫,試圖拉低AI開發門檻,與Stargate的封閉式大型基礎建設形成鮮明對比。兩者競爭的結果,很可能決定未來AI產業將走向集中化或多元化。
本網站之文字、圖片及影音,非經授權,不得轉載、公開播送或公開傳輸及利用。