2025 年 4 月 9 日,在全球科技界引頸期盼的 Google Cloud NEXT 2025 發表會上,一場為期三天的創新盛宴正式拉開帷幕。Google 在本次大會上隆重宣布了一系列針對企業導入 AI 的關鍵升級,涵蓋了底層基礎設施、創新的生成式媒體平台、強大的多模態模型 Gemini,以及更智慧的資料分析工具。這些重大發布不僅精準回應了 AI 工具應用日益普及的趨勢,更以前瞻性的視野,重新定義了「企業該如何與 AI 共存」的新格局。在這一系列令人矚目的創新中,最新的 Gemini 2.5 系列模型,以及強大的開發工具生態系統,正賦予企業前所未有的能力,將 AI 的潛力轉化為實際的商業價值。本文將重點介紹 Gemini 2.5 Pro 和 Flash 的卓越性能及其在企業應用中的潛力,深入探討 Gemini Code Assist 在提升開發效率方面的作用,並介紹 Firebase Studio 和 Vertex AI 的其他開發工具,展現 Google 如何加速 AI 應用程式的建構和部署。

Google 近期正式推出全新旗艦 AI 模型 —— Gemini 2.5,不僅是目前最強大的版本,更為企業級應用帶來嶄新突破。這一代模型最大的亮點在於其推理能力的飛躍,能夠在回應前進行縝密的邏輯思考,使回答更準確、更具洞察力。這種透明且可追蹤的思考過程,對於企業在信任、合規性及決策品質上,都是一大助力。

Gemini 2.5 Pro:企業級推理模型的巔峰之作

Gemini 2.5 系列的首款產品是 Gemini 2.5 Pro,目前已在 Google Cloud 的 Vertex AI 平台上開放預覽。此版本在編碼與高階推理任務中表現尤為優異,並於全球多項基準測試中拔得頭籌,被認為是目前最適合企業環境的先進模型之一。在知名的 LM Arena 榜單上,Gemini 2.5 Pro 也以壓倒性優勢名列前茅。

為應對更多元的應用需求,Google 亦同步推出 Gemini 2.5 Flash,主打低延遲與高性價比,適合在需要快速回應的場景中使用,例如客服、即時摘要等,是建構高效 AI 應用的理想選擇。

Gemini 2.5 Pro 處理複雜任務的利器:深度推理與大規模上下文支援

在當今企業面臨的種種挑戰中,從資訊密集的法律文件,到需綜合多源資料的決策流程,單純的資訊檢索已無法滿足需求。Gemini 2.5 Pro 以高達 100 萬個 tokens 的上下文窗口,可支援超長內容分析與推理,能深入理解整份醫療紀錄、法律合約,甚至完整的代碼庫。

例如,Box 的 AI 副總裁 Yashodha Bhavnani 分享,他們利用 Gemini 建構 AI agents來即時提取非結構化資料中的關鍵見解,並進一步觸發後續操作流程。Moody’s 則透過 Gemini 2.5 Pro 的試點測試,希望進一步擴大對複雜文件的理解與結構化處理能力。

Google 也預告,即將開放企業透過 Vertex AI 進行模型的監督式微調與上下文快取,協助企業打造更具專業化的模型,同時有效控制成本。

Gemini 2.5 Flash:為速度與規模而生的主力模型

對於重視效率與擴展性的企業,Gemini 2.5 Flash 是另一項利器。它專為快速處理大量請求所設計,不僅具備良好的推理能力,更可動態調整「思考預算」——根據問題的複雜度分配計算資源,以提供最快速且足夠準確的答案。

這項功能讓企業可依需求在速度、準確與成本間取得最佳平衡。例如 Palo Alto Networks 就看好 2.5 Flash 的推理能力與高反應速度在資安應用中的潛力,已著手評估導入。

打造智慧應用的新工具:Vertex AI Model Optimizer 與 Global Endpoint

為簡化使用者在不同模型間的選擇,Google 推出了實驗性工具 Vertex AI Model Optimizer,可根據使用者對品質與成本的期望,動態選擇最適合的模型響應。

同時,新的 Vertex AI Global Endpoint 則提供跨區域的容量路由能力,確保即使在服務尖峰時段,也能維持應用的穩定與快速。

開啟Agents時代:Live API 與多模態能力驅動未來應用

Gemini 2.5 Pro 的多模態推理能力可處理包括視覺、語音、文字等多種輸入形式,是打造「現實世界Agents」的理想基礎。Google 推出的 Live API 支援流式音訊、視訊與文字資料的即時處理,讓Agents能進行類人般的對話、開會或即時監控。

API 功能包括超過 30 分鐘的長會話、時間戳文字轉錄、動態指令更新等,並整合搜尋、代碼執行與函數呼叫等工具,大幅擴展 AI 應用的實用性與互動性。

開發者福音:彈性可控的推理資源配置

在 Google AI Studio 與 Vertex AI 中,Gemini 2.5 Flash 已進入預覽階段,並首次引入可調整的推理預算機制。開發者可設定模型可用的「思考 token 數」,控制其推理深度,彈性調整效能與成本,實現真正的「按需智慧」。

即使完全關閉推理功能,2.5 Flash 依然可保有與前代 2.0 Flash 相當的高速表現。而在 LM Arena 的高難度測試中,2.5 Flash 也僅次於 2.5 Pro,證明其在效能與成本間達成絕佳平衡。

無論你想了解最新雲端知識,或是想了解最新活動、產業應用,歡迎聯繫宏庭科技。我們將帶來更多 AI 雲端新知,請密切關注我們的活動訊息,期待在活動中與您相見!

延伸閱讀