就在不久之前 OpenAI 推出了自己的全新 AI 視頻生成模型 Sora,谷歌也不甘落后就在中國時(shí)間今天凌晨的時(shí)候谷歌推出了全新的 Veo 2 視頻生成模型以及改進(jìn)的 Image 3 圖像生成模型。
我們先來了解一下 Veo 2 視頻生成模型,就相比 OpenAI 官方公布的視頻內(nèi)容來看,Veo 2 模型生成的視頻看著更加的真實(shí)一些,Sora 模型僅能生成最高 1080p 分辨率的視頻同時(shí)時(shí)長比較短,而 Veo 2 可以生成 4K 分辨率時(shí)間長幾分鐘的視頻。
上面給大家附帶了一個(gè)谷歌官方發(fā)布的 AI 視頻,可以看見視頻非常的逼真就像是直接拍攝的現(xiàn)實(shí)世界一樣。還有一個(gè)動(dòng)畫的視頻,里面的人物看著也非常的靈動(dòng)。(視頻經(jīng)過壓縮可能不是很清除,感興趣的可以前往谷歌 Veo 2 官網(wǎng)中查看:https://deepmind.google/technologies/veo/veo-2/)
谷歌表示 Veo 2 能更好地理解現(xiàn)實(shí)世界的物理現(xiàn)象以及人類動(dòng)作和表情的細(xì)微差別,有助于整體改善細(xì)節(jié)和真實(shí)感。同時(shí) Veo 2 將引入 Google Labs 視頻生成工具 VideoFX,并擴(kuò)大可以訪問該工具的用戶數(shù)量,可以訪問 Google Labs 注冊候補(bǔ)名單。谷歌還計(jì)劃明年將 Veo 2 擴(kuò)展到 YouTube Shorts 和其他產(chǎn)品。對(duì)了該模型生成的視頻同樣會(huì)有一個(gè)看不見的水印來辨別是不是 AI 生成的視頻。
再來看看 Image 3,這個(gè)圖像生成模型是之前就推出過的,谷歌將其改進(jìn)之后跟著 Veo 2 重新推出,該模型可以生成更明亮、構(gòu)圖更好的圖像。
最新的 Imagen 3 模型將在全球 100 多個(gè)國家/地區(qū)推出圖像生成工具 ImageFX。
除了 Veo 2 和 Image 3 之外,谷歌還將推出一款有趣的新工具 Whisk,它允許你輸入或創(chuàng)建能夠表達(dá)你心中主題、場景和風(fēng)格的圖像。然后可以將它們組合在一起并重新混合,以創(chuàng)建屬于自己的獨(dú)特圖像。
在底層,Whisk 將最新的 Imagen 3 模型與 Gemini 的視覺理解和描述功能相結(jié)合。Gemini 模型會(huì)自動(dòng)為你創(chuàng)建的圖像編寫詳細(xì)的說明,然后將這些說明輸入到 Imagen 3 中。
雖然從目前來看谷歌的 Veo 2 生成的視頻比 OpenAI Sora 生成的視頻要更真實(shí)一點(diǎn),但是還是需要看后續(xù)的優(yōu)化。
本文編輯:@ 小小輝
?本文著作權(quán)歸電手所有,未經(jīng)電手許可,不得轉(zhuǎn)載使用。