2025 年 4 月 9 日，在全球科技界引頸期盼的 Google Cloud NEXT 2025 發表會上，一場為期三天的創新盛宴正式拉開帷幕。Google 在本次大會上隆重宣布了一系列針對企業導入 AI 的關鍵升級，涵蓋了底層基礎設施、創新的生成式媒體平台、強大的多模態模型 Gemini，以及更智慧的資料分析工具。這些重大發布不僅精準回應了 AI 工具應用日益普及的趨勢，更以前瞻性的視野，重新定義了「企業該如何與 AI 共存」的新格局。在這一系列令人矚目的創新中，最新的 Gemini 2.5 系列模型，以及強大的開發工具生態系統，正賦予企業前所未有的能力，將 AI 的潛力轉化為實際的商業價值。本文將重點介紹 Gemini 2.5 Pro 和 Flash 的卓越性能及其在企業應用中的潛力，深入探討 Gemini Code Assist 在提升開發效率方面的作用，並介紹 Firebase Studio 和 Vertex AI 的其他開發工具，展現 Google 如何加速 AI 應用程式的建構和部署。

Google 近期正式推出全新旗艦 AI 模型 —— Gemini 2.5，不僅是目前最強大的版本，更為企業級應用帶來嶄新突破。這一代模型最大的亮點在於其推理能力的飛躍，能夠在回應前進行縝密的邏輯思考，使回答更準確、更具洞察力。這種透明且可追蹤的思考過程，對於企業在信任、合規性及決策品質上，都是一大助力。

Gemini 2.5 Pro：企業級推理模型的巔峰之作
Gemini 2.5 Pro 處理複雜任務的利器：深度推理與大規模上下文支援
Gemini 2.5 Flash：為速度與規模而生的主力模型
打造智慧應用的新工具：Vertex AI Model Optimizer 與 Global Endpoint
開啟Agents時代：Live API 與多模態能力驅動未來應用
開發者福音：彈性可控的推理資源配置

Gemini 2.5 Pro：企業級推理模型的巔峰之作
Gemini 2.5 Pro 處理複雜任務的利器：深度推理與大規模上下文支援
Gemini 2.5 Flash：為速度與規模而生的主力模型
打造智慧應用的新工具：Vertex AI Model Optimizer 與 Global Endpoint
開啟Agents時代：Live API 與多模態能力驅動未來應用
開發者福音：彈性可控的推理資源配置

Gemini 2.5 Pro：企業級推理模型的巔峰之作

Gemini 2.5 系列的首款產品是 Gemini 2.5 Pro，目前已在 Google Cloud 的 Vertex AI 平台上開放預覽。此版本在編碼與高階推理任務中表現尤為優異，並於全球多項基準測試中拔得頭籌，被認為是目前最適合企業環境的先進模型之一。在知名的 LM Arena 榜單上，Gemini 2.5 Pro 也以壓倒性優勢名列前茅。

為應對更多元的應用需求，Google 亦同步推出 Gemini 2.5 Flash，主打低延遲與高性價比，適合在需要快速回應的場景中使用，例如客服、即時摘要等，是建構高效 AI 應用的理想選擇。

Gemini 2.5 Pro 處理複雜任務的利器：深度推理與大規模上下文支援

在當今企業面臨的種種挑戰中，從資訊密集的法律文件，到需綜合多源資料的決策流程，單純的資訊檢索已無法滿足需求。Gemini 2.5 Pro 以高達 100 萬個 tokens 的上下文窗口，可支援超長內容分析與推理，能深入理解整份醫療紀錄、法律合約，甚至完整的代碼庫。

例如，Box 的 AI 副總裁 Yashodha Bhavnani 分享，他們利用 Gemini 建構 AI agents來即時提取非結構化資料中的關鍵見解，並進一步觸發後續操作流程。Moody’s 則透過 Gemini 2.5 Pro 的試點測試，希望進一步擴大對複雜文件的理解與結構化處理能力。

Google 也預告，即將開放企業透過 Vertex AI 進行模型的監督式微調與上下文快取，協助企業打造更具專業化的模型，同時有效控制成本。

Gemini 2.5 Flash：為速度與規模而生的主力模型

對於重視效率與擴展性的企業，Gemini 2.5 Flash 是另一項利器。它專為快速處理大量請求所設計，不僅具備良好的推理能力，更可動態調整「思考預算」——根據問題的複雜度分配計算資源，以提供最快速且足夠準確的答案。

這項功能讓企業可依需求在速度、準確與成本間取得最佳平衡。例如 Palo Alto Networks 就看好 2.5 Flash 的推理能力與高反應速度在資安應用中的潛力，已著手評估導入。

打造智慧應用的新工具：Vertex AI Model Optimizer 與 Global Endpoint

為簡化使用者在不同模型間的選擇，Google 推出了實驗性工具 Vertex AI Model Optimizer，可根據使用者對品質與成本的期望，動態選擇最適合的模型響應。

同時，新的 Vertex AI Global Endpoint 則提供跨區域的容量路由能力，確保即使在服務尖峰時段，也能維持應用的穩定與快速。

開啟Agents時代：Live API 與多模態能力驅動未來應用

Gemini 2.5 Pro 的多模態推理能力可處理包括視覺、語音、文字等多種輸入形式，是打造「現實世界Agents」的理想基礎。Google 推出的 Live API 支援流式音訊、視訊與文字資料的即時處理，讓Agents能進行類人般的對話、開會或即時監控。

API 功能包括超過 30 分鐘的長會話、時間戳文字轉錄、動態指令更新等，並整合搜尋、代碼執行與函數呼叫等工具，大幅擴展 AI 應用的實用性與互動性。

開發者福音：彈性可控的推理資源配置

在 Google AI Studio 與 Vertex AI 中，Gemini 2.5 Flash 已進入預覽階段，並首次引入可調整的推理預算機制。開發者可設定模型可用的「思考 token 數」，控制其推理深度，彈性調整效能與成本，實現真正的「按需智慧」。

即使完全關閉推理功能，2.5 Flash 依然可保有與前代 2.0 Flash 相當的高速表現。而在 LM Arena 的高難度測試中，2.5 Flash 也僅次於 2.5 Pro，證明其在效能與成本間達成絕佳平衡。

無論你想了解最新雲端知識，或是想了解最新活動、產業應用，歡迎聯繫宏庭科技。我們將帶來更多 AI 雲端新知，請密切關注我們的活動訊息，期待在活動中與您相見！

Google Gemini 2.5 模型重大升級：推理能力再突破，全面賦能企業應用

Gemini 2.5 Pro：企業級推理模型的巔峰之作

Gemini 2.5 Pro 處理複雜任務的利器：深度推理與大規模上下文支援

Gemini 2.5 Flash：為速度與規模而生的主力模型

打造智慧應用的新工具：Vertex AI Model Optimizer 與 Global Endpoint

開啟Agents時代：Live API 與多模態能力驅動未來應用

開發者福音：彈性可控的推理資源配置

分類

相關文章

如何用 Gemini Enterprise 打造專屬 AI Agent？ —工作台 Workbench 篇

Gemini Enterprise 如何用 Notebook 提煉企業數據、終結 AI 幻覺—The Taskforce 篇

2026 FusionNext 雲端聚融現場直擊！揭密企業打通資料孤島、成功數據變現的 AI 實戰學

馬上聯絡專屬顧問
為您搞定雲端大小事

台灣總部

香港據點

馬來西亞據點

Google Gemini 2.5 模型重大升級：推理能力再突破，全面賦能企業應用

Gemini 2.5 Pro：企業級推理模型的巔峰之作

Gemini 2.5 Pro 處理複雜任務的利器：深度推理與大規模上下文支援

Gemini 2.5 Flash：為速度與規模而生的主力模型

打造智慧應用的新工具：Vertex AI Model Optimizer 與 Global Endpoint

開啟Agents時代：Live API 與多模態能力驅動未來應用

開發者福音：彈性可控的推理資源配置

分類

相關文章

如何用 Gemini Enterprise 打造專屬 AI Agent？ —工作台 Workbench 篇

Gemini Enterprise 如何用 Notebook 提煉企業數據、終結 AI 幻覺—The Taskforce 篇

2026 FusionNext 雲端聚融現場直擊！揭密企業打通資料孤島、成功數據變現的 AI 實戰學

馬上聯絡專屬顧問 為您搞定雲端大小事

馬上聯絡專屬顧問
為您搞定雲端大小事