Google發表Gemini 3.5模型 為AI代理量身強化
(中央社記者張欣瑜舊金山19日專電)Google I/O年度開發者大會今天登場,發表新一代AI模型Gemini 3.5系列,在一般用戶與企業應用兩大市場迎戰OpenAI與Anthropic。Google強調,這一系列專為執行「代理任務」而優化。第一款模型3.5 Flash今天起開放給全球用戶使用。
這意味著一般用戶使用Gemini App及Google搜尋的AI模式時,3.5 Flash作為背後預設模型。
Google也發表可被視為影片版Nano Banana的多模態影片生成與編輯模型Gemini Omni。
● 3.5 Flash今起開放 3.5 Pro預計6月推出
針對今年I/O核心方向,Google執行長皮查伊(Sundar Pichai)強調,人工智慧(AI)發展進入一個快速推進的階段,比起技術展示,使用者現在更加重視AI在產品當中的實際價值。
新一代3.5 Flash模型結合了「前沿智慧」與「行動能力」。後者是「AI代理」的關鍵核心。
一般用戶外,開發者可透過Google開發平台Antigravity,以及Google AI Studio、Android Studio的Gemini API使用。另外,3.5 Pro已在Google內部使用,預計6月對外推出。
3.5 Flash具備速度和成本優勢;Google表示,以每秒輸出的詞元(Token)數量計算,它的速度比其他前沿模型快約4倍;成本不到前沿模型一半,在某些情況下甚至可以降到約1/3。
另外,在幾乎各類型評測中,3.5 Flash的表現都超越上一代旗艦模型Gemini 3.1 Pro。
● Omni多模態生成模型 想法可變電影感影片
除了主力模型,Google在今年I/O大會上還發表了Gemini Omni多模態生成模型,並指出可以把Omni想成圖像模型Nano Banana,只是它主要是用來製作影片。
現階段,Google先聚焦在影片生成編輯,最終,希望將Omni打造成一個世界模型,能夠接收圖片、聲音、影片與文字,並運用理解與推理能力,產生包含影片在內的多種輸出格式。
Gemini Omni系列首款模型Omni Flash即日起透過Gemini App與Google Flow,開放給全球 Google AI Plus、Pro和Ultra訂閱用戶使用;同時也將從本週起,免費提供給YouTube Shorts與YouTube Create App使用者。至於下一款進階版本Omni Pro,預計在不久之後推出。
Google並強調,透過Omni生成或編輯的內容,都會自動加入SynthID數位浮水印,讓使用者能清楚辨識哪些是AI生成或經過AI工具編輯的內容,強化整體內容的透明度與安全性。(編輯:韋樞)1150520






















