近日,谷歌正式發布了其最新研發的圖像生成模型——Imagen3,目前該模型已經在Gemini API上正式對開發者開放使用。從視覺表現效果來看,Imagen3模型可謂是相當出色。它擁有強大的圖像生成能力,能夠生成多種不同風格的優質圖像。

初期,Imagen3將只對付費用戶開放,預計不久后將向免費用戶逐步推出。根據官方介紹,用戶只需支付每幅圖像0.03美元,就可以享受 Imagen3的強大功能。同時,用戶在生成圖像時,可以自由控制圖像的寬高比以及生成的選項數量,滿足不同的需求。
為了打擊虛假信息和不當歸屬,Imagen3生成的所有圖像都帶有不可見的數字水印 SynthID,這個水印可識別圖像為人工智能生成的作品。此外,開發者還可以通過 Python 代碼輕松實現圖像生成,具體的代碼示例也已在官方文檔中提供。用戶只需簡單地設置 API 密鑰、輸入提示詞,就能生成想要的圖像,體驗這一新技術的便利。
為了讓用戶更好地了解 Imagen3的能力,官方還展示了一系列生成的圖像樣本,涵蓋了多種風格與主題。隨著技術的不斷進步,谷歌計劃在不久的將來將更多的生成媒體模型整合到 Gemini API 中,進一步推動生成媒體與語言模型的結合,助力開發者創造更多有趣的應用。