2025 年 4 月,Google Next 上公布 Vertex AI 現已支援全媒體生成:影音、圖像、語音、音樂一次到位,而在不到一個月的時間,Google 又更新了 Vertex AI 新一代的生成式 AI 媒體模型:Imagen 4、Veo 3 和 Lyria 2。
我們已經看到客戶利用 Google 的圖像生成模型 Imagen 3 創作出令人驚嘆、媲美真實的照片。客戶們更進一步,將這些圖像透過 Veo 2 轉化為高品質的影片和素材。甚至,我們也見證了客戶使用 Google 先進的 AI 音樂生成模型 Lyria,為這些出色的影片配上專業級的音訊,讓它們栩栩如生。
隨著生成式 AI 媒體在行銷、媒體等領域的蓬勃發展,故事敘述從未如此簡單。用戶能更快地創造行銷素材,並打造突破性的創意內容。現在,讓我們深入了解每個模型,以及您可以如何立即開始使用。
Imagen 4:更高品質的圖像生成
Google 在 Vertex AI 上公開預覽 Imagen 4 文字轉圖像生成模型。作為 Google 最高品質的圖像生成模型,Imagen 4 具備以下優勢:
- 出色的文字渲染和提示依從性:模型能更精準地理解您的提示,並將文字內容完美地融入圖像。
- 各類風格下的整體圖像品質更高:無論是何種藝術風格,Imagen 4 都能生成更高品質的圖像。
- 多語言提示支援:協助全球創作者更輕鬆地進行創作。
Prompt範例:
- Prompt:Capture an intimate close-up bathed in warm, soft, late-afternoon sunlight filtering into a quintessential 1960s kitchen. The focal point is a charmingly designed vintage package of all-purpose flour, resting invitingly on a speckled Formica countertop. The packaging itself evokes pure nostalgia: perhaps thick, slightly textured paper in a warm cream tone, adorned with simple, bold typography (a friendly serif or script) in classic red and blue “ALL-PURPOSE FLOUR”, featuring a delightful illustration like a stylized sheaf of wheat or a cheerful baker character. In smaller bold print at the bottom of the package: “NET WT 5 LBS (80 OZ) 2.27kg”. Focus sharply on the package details – the slightly soft edges of the paper bag, the texture of the vintage printing, the inviting “All-Purpose Flour” text. Subtle hints of the 1960s kitchen frame the shot – the chrome edge of the counter gleaming softly, a blurred glimpse of a pastel yellow ceramic tile backsplash, or the corner of a vintage metal canister set just out of focus. The shallow depth of field keeps attention locked on the beautifully designed package, creating an aesthetic rich in warmth, authenticity, and nostalgic appeal.
- Prompt:Filmed cinematically from the driver’s seat, offering a clear profile view of the young passenger on the front seat with striking red hair. Her gaze is fixed ahead, concentrated on navigating the dusty, lonely highway visible through her side window, which shows a blurred expanse of dry earth and perhaps distant, hazy mountains. Her arm rests on the window ledge or steering wheel. The shot includes part of the aged truck interior beside her – the door panel, maybe a glimpse of the worn seat fabric. The lighting could be late afternoon sun, casting long shadows and warm highlights across her face and the truck’s interior. This angle emphasizes her individual presence and contemplative state within the vast, empty landscape.
若要開始在 Vertex AI 上公開預覽 Imagen 4,您可以使用 Media Studio 或運行以下程式碼範例,該範例使用了 Google Gen AI SDK for Python。
from google import genai
# TODO(developer): Update and un-comment below lines # project_id = “PROJECT_ID” client = genai.Client(vertexai=True, project=project_id, location=”us-central1″) prompt = “”” A white wall with two Art Deco travel posters mounted. First poster has the text: “NEPTUNE”, tagline: “The jewel of the solar system!’ Second poster has the text: “JUPITER”, tagline: “Travel with the giants! “”” image = client.models.generate_images( model=”imagen-4.0-generate-preview-05-20″, prompt=prompt, ) # OPTIONAL: View the generated image in a notebook # image.generated_images[0].image.show() |
Veo 3:更高品質的影片生成,支援音訊和語音
Veo 3 是 Google DeepMind 最新推出的最先進影片生成模型。透過 Veo 3,您可以生成包含以下元素的影片:
- 從文字和圖像提示生成影片時,品質有所提升
- 語音,例如對話和旁白
- 音訊,例如音樂和音效
以下是幾位客戶對 Veo 帶來的生產力和創意提升的看法:
Jellyfish,Brandtech Group 旗下知名的數位行銷公司,已將 Veo 整合到他們表現最佳的 AI 行銷平台 Pencil 中,並與日本航空公司合作提供 AI 生成的機上娛樂。
「將 Veo 2 加入 Pencil 強化了我們致力於為行銷人員提供精密的 AI,使他們能夠製作不僅更智能、更快速,而且更大膽、更具藝術靈感的行銷活動。我們的試驗取得了令人難以置信的成果,平均成本和上市時間效率降低了 50%。這種控制和品質的質變使以前不可能的想法在幾分鐘內變成真實的行銷內容。日本航空公司正在引領 AI 在旅遊業的應用,我們很高興看到其他品牌效仿。」— Brandtech 創辦人兼執行長 David Jones
看看它是如何運作的: Veo 3 能夠處理複雜的提示細節,如以下範例所示。
- Prompt: A medium shot, historical adventure setting: Warm lamplight illuminates a cartographer in a cluttered study, poring over an ancient, sprawling map spread across a large table. Cartographer: “According to this old sea chart, the lost island isn’t myth! We must prepare an expedition immediately!”
- Prompt: A low-angle shot shows an open, light purple door leading from a room with light purple walls and a gray floor to a vibrant outdoor scene. Lush green grass and wildflowers spill from the doorway onto the indoor floor, creating a whimsical transition between spaces. Beyond the door, rolling green hills dotted with more wildflowers stretch towards a bright, clear sky. A single tree stands prominently in the foreground of the outdoor scene, its leaves adding depth to the view. The sunlight and natural elements contrast with the simplicity of the indoor space, inviting a sense of wonder and escape.
Lyria 2:音樂生成帶來更大的創意控制
在 Google Cloud Next 2025 大會上,我們宣布在 Vertex AI 中推出 Google 的文字轉音樂模型 Lyria。今天,我們宣布 Lyria 2 已在 Vertex AI 中普遍可用。作為 Google 最新的音樂生成模型,Lyria 2 具有一系列風格的高傳真音樂。作為您下一個創意協作者,Lyria 2 提供:
- 從文字提示生成高品質音訊內容
- 對樂器、BPM 和其他特徵的更大創意控制
若要開始使用 Lyria 2 創作內容,請前往 Vertex AI 上的 Media Studio。在那裡,您可以開始從文字提示生成音樂,或透過 Vertex AI 存取模型 API。為獲取靈感,請查看以下一些音樂剪輯和提示。
- Prompt: Upbeat, Rhythmic Peruvian Cumbia with a psychedelic edge, LA, Live performance at a Latin music Festival, incorporating electric guitars, bass, and often utilizing a prominent timbales percussion section, creating a powerful and danceable vibe. Vibrant and energetic.
- Prompt: Sweeping Orchestral Film Score, Pristine Studio recording, London, 100-piece Orchestra, Majestic and profound. A blend of soaring melodies, dramatic harmonic shifts, and powerful percussive elements, with instruments such as french horns, strings, and timpani, and a thematic approach, featuring intricate orchestrations, dynamic range, and emotional depth, evoking a cinematic and awe-inspiring atmosphere.
本文改寫至 Google Blog,深入介紹了 Google 在 Vertex AI 平台上推出的新一代生成式 AI 媒體模型:Imagen 4、Veo 3 和 Lyria 2。這些創新模型不僅在圖像、影片和音樂生成方面實現了顯著的品質提升,更強化了創作者的控制能力,從而大幅簡化了內容創作流程。
透過這些先進的 AI 技術,企業和個人都能以前所未有的速度和效率,將創意理念轉化為高品質的媒體內容。無論是提升行銷素材的產製效率,還是為故事敘述帶來更豐富的感官體驗,Google 的新模型都為生成式 AI 媒體的未來開闢了廣闊的可能性。作為 Google Cloud Premier Partner 宏庭科技可以成為您探索這些尖端 AI 工具的最佳夥伴。我們能協助客戶將這些強大的生成式 AI 媒體模型導入您的工作流程,從初期諮詢、技術導入到實際應用,提供全方位的專業輔助,確保您能最大化這些技術的潛力,實現您的創意願景。
若您也渴望利用最前沿的 AI 技術,將您的創意付諸實現,歡迎聯繫宏庭科技,一同探索生成式 AI 媒體的無限潛力!若您對 Google Cloud 的多元應用有興趣,請密切關注宏庭科技的活動訊息,期待在活動中與您相見!