近日,谷歌正式發(fā)布了其最新研發(fā)的圖像生成模型——Imagen3,目前該模型已經(jīng)在Gemini API上正式對開發(fā)者開放使用。從視覺表現(xiàn)效果來看,Imagen3模型可謂是相當(dāng)出色。它擁有強(qiáng)大的圖像生成能力,能夠生成多種不同風(fēng)格的優(yōu)質(zhì)圖像。
初期,Imagen3將只對付費(fèi)用戶開放,預(yù)計不久后將向免費(fèi)用戶逐步推出。根據(jù)官方介紹,用戶只需支付每幅圖像0.03美元,就可以享受 Imagen3的強(qiáng)大功能。同時,用戶在生成圖像時,可以自由控制圖像的寬高比以及生成的選項數(shù)量,滿足不同的需求。
為了打擊虛假信息和不當(dāng)歸屬,Imagen3生成的所有圖像都帶有不可見的數(shù)字水印 SynthID,這個水印可識別圖像為人工智能生成的作品。此外,開發(fā)者還可以通過 Python 代碼輕松實現(xiàn)圖像生成,具體的代碼示例也已在官方文檔中提供。用戶只需簡單地設(shè)置 API 密鑰、輸入提示詞,就能生成想要的圖像,體驗這一新技術(shù)的便利。
為了讓用戶更好地了解 Imagen3的能力,官方還展示了一系列生成的圖像樣本,涵蓋了多種風(fēng)格與主題。隨著技術(shù)的不斷進(jìn)步,谷歌計劃在不久的將來將更多的生成媒體模型整合到 Gemini API 中,進(jìn)一步推動生成媒體與語言模型的結(jié)合,助力開發(fā)者創(chuàng)造更多有趣的應(yīng)用。
Copyright 2025 //m.ahlmtdl.com/ 版權(quán)所有 豫ICP備2021037741號-1 網(wǎng)站地圖