英偉達(dá)腦洞突破天際實(shí)現(xiàn)“言出法隨”:一句話實(shí)時(shí)P圖自動(dòng)填補(bǔ)涂鴉
在“一句話生成照片”這件事上,英偉達(dá)又一次突破了大伙的想象力。
他們最新的AI模型GauGAN2,不僅能根據(jù)字詞生成逼真風(fēng)景照,還能實(shí)時(shí)用文字P圖!
輸入一句“海浪擊打岸邊石”,立刻輸出一張逼真照片:

從單詞到短語(yǔ),這只AI全都能get!

那感覺(jué),簡(jiǎn)直是要山得山,要水得水:

要是覺(jué)得哪部分你不喜歡,直接打字就能“P圖”:

上面這些效果,都是英偉達(dá)這個(gè)叫做“GauGAN2”的模型做出來(lái)的,而它的“完整版”功能,還遠(yuǎn)不止這些。
從草圖到文字,都能生成風(fēng)景照
GauGAN2的繪制模式,一共分為三種。
第一種,打字生成圖片。
我們先試了一下單個(gè)詞組,“陽(yáng)光(sunshine)”,生成如下圖片:

加上限定詞in the forest后,AI立刻就將場(chǎng)景換到了樹(shù)林里,變成光灑在樹(shù)林中的場(chǎng)景:

再多來(lái)點(diǎn)限定詞也沒(méi)問(wèn)題。
像“冬日樹(shù)林中的陽(yáng)光”,輸入in winter后,眼前本來(lái)郁郁蔥蔥的樹(shù)林立刻“全禿了”,換成了雪景下的一幕:

這效果,u1s1(有一說(shuō)一)確實(shí)不錯(cuò)。
還能輸出不同style的風(fēng)景圖,例如輸入“大山(mountain)”一詞,立刻要山有山,還能給你換不同風(fēng)格:

當(dāng)然,這些不同的風(fēng)景照也都能繼續(xù)生成新細(xì)節(jié),在mountain后加上“beside a river”就能生成山水:

第二種,“打字P圖”,直接用文字編輯部分圖像。
只需要把想替換掉的部分圈出來(lái),輸入你想要的東西,就能立刻造出各種新穎的風(fēng)景圖:

嗯……英偉達(dá)給出的這個(gè)demo,思路也是非常清奇了,“浮在空中的城堡”:

第三種,用涂鴉生成風(fēng)景照。
這是上一代GauGAN2(2019年英偉達(dá)推出的GauGAN)的看家本領(lǐng)。
例如,要是想實(shí)現(xiàn)下面這樣的“一片天空兩個(gè)太陽(yáng)”,就完全可以在通過(guò)文本生成的圖像上,自己手動(dòng)再加一個(gè)。

這幾種玩法疊加在一起,簡(jiǎn)直讓網(wǎng)友們腦洞大開(kāi)。
像外媒ZDNet就惡搞出來(lái)了一種神奇的玩法,在已有的風(fēng)景上畫(huà)個(gè)人頭:

然后讓GauGAN2根據(jù)已有的畫(huà)面,再重新生成圖畫(huà),就會(huì)得到如下“人頭海島”的神奇景觀:

不過(guò)這可能也對(duì)個(gè)人畫(huà)技有所要求,在我們的靈魂畫(huà)風(fēng)下,效果看上去就有些……不太聰明的亞子。

那么,生成這一系列風(fēng)景照的GauGAN2,背后究竟用了什么原理?
它與OpenAI今年發(fā)布的DALL·E和CLIP,又究竟有什么區(qū)別?
與DALL·E有什么不同?
2019年,英偉達(dá)GauGAN2的“前身”GauGAN正式開(kāi)源。
當(dāng)時(shí)的它,還只擁有其中一個(gè)能力,就是將涂鴉直接變成風(fēng)景畫(huà),就像「神筆馬良」一樣,還推出了對(duì)應(yīng)的軟件Canvas:

當(dāng)然,這時(shí)GauGAN已經(jīng)能隨意改變畫(huà)面風(fēng)格了,從白天黑夜到春夏秋冬的氣質(zhì)都能穩(wěn)穩(wěn)“拿捏”:

據(jù)英偉達(dá)介紹,GauGAN采用了一種基于空間適應(yīng)標(biāo)準(zhǔn)化(SPADE)算法。
SPADE算法不僅使用隨機(jī)的輸入圖像,還采用了一種被稱(chēng)作“分割圖”的圖像。在分割圖中,每一個(gè)像素都會(huì)被歸類(lèi),來(lái)生成更接近于真實(shí)的圖像,這種模式被稱(chēng)作“圖對(duì)圖翻譯”。

△GauGAN的技能點(diǎn)(狗頭)
現(xiàn)在,英偉達(dá)將GauGAN升級(jí)成了GauGAN2,后者一共采用了1000萬(wàn)張高質(zhì)量的圖片、在英偉達(dá)Selene超算上進(jìn)行訓(xùn)練,這臺(tái)超算在Green500排行榜上排到世界第二。
生成這些風(fēng)景畫(huà)的效果和“手法”,是不是感覺(jué)有點(diǎn)熟悉?
沒(méi)錯(cuò),大多數(shù)人看到GauGAN2的第一眼,可能都會(huì)覺(jué)得它和OpenAI的DALL·E+CLIP有點(diǎn)像。
今年年初,OpenAI用DALL·E和CLIP兩個(gè)模型,做了個(gè)“圖像版”GPT-3,同樣能用一句話生成圖片。

不過(guò),這兩個(gè)模型生成的內(nèi)容其實(shí)不太一樣。
GauGAN2專(zhuān)注于生成風(fēng)景照,DALL·E+CLIP則更多地生成具體的物體,例如一把椅子或者一個(gè)鬧鐘等。

這與它們的原理差異也有關(guān)系,GauGAN2更加注重“單詞與視覺(jué)效果”之間的關(guān)系,例如“冬天”這種模糊的狀態(tài)詞給照片帶來(lái)的效果;DALL·E+CLIP則更注重“文字-圖像”這種有明確對(duì)應(yīng)關(guān)系的物體效果。
據(jù)英偉達(dá)介紹,GauGAN2不同于“文本-圖像”和“分割圖像-圖像”一類(lèi)的模型,它所能產(chǎn)生的照片種類(lèi)更多,質(zhì)量也會(huì)更高。
不過(guò),偶爾也會(huì)出現(xiàn)點(diǎn)bug…
比如給出“沙灘(beach)”一詞后,有些生成的畫(huà)面中出現(xiàn)了語(yǔ)言無(wú)法描述的事物。

對(duì)此,英偉達(dá)表示,他們?cè)谟?xùn)練中“完全沒(méi)有用到任何人像照片”。(所以可能是偶然?)
但這樣一來(lái),網(wǎng)友想要的“瑞克搖(Rick roll)”和“鬼畜視頻生成”,GauGAN2大概也是沒(méi)辦法實(shí)現(xiàn)了。

但是能生成仿佛夢(mèng)境中才能見(jiàn)到的畫(huà)面,也吸引了不少人來(lái)試玩。
這不,有人就曬出了自己生成的抽象畫(huà)大作,并表示自己非常喜歡這個(gè)模型:

還有人表示,GauGAN2給出了一些建筑設(shè)計(jì)的新idea啊。

也有網(wǎng)友覺(jué)得這種能夠自動(dòng)生成景觀的功能,未來(lái)Adobe可能也會(huì)用上。
或許就是下一個(gè)畫(huà)手利器?

最后,GauGAN2在瀏覽器上就能試玩,歡迎大家留言討論自己的體驗(yàn)感受~
標(biāo)簽: 英偉達(dá) 想象力 實(shí)時(shí)P圖 在線試玩 逼真風(fēng)景照
2022-01-12 16:50:28
2022-01-12 14:16:53
2022-01-12 09:59:21
2022-01-12 08:30:09
2022-01-12 08:28:09
2022-01-12 08:26:11
2022-01-12 08:24:25
2022-01-12 08:22:56
2022-01-12 08:21:28
2022-01-12 08:19:22
2022-01-12 08:15:03
2022-01-12 08:13:37
2022-01-12 08:12:23 熱門(mén)文章
- 1消息稱(chēng)Win11調(diào)整硬件安裝需求之后可運(yùn)行5.25寸軟盤(pán)
- 2蘋(píng)果iPad mini 6屏幕刷新率只有60Hz屏幕或不能滿足游戲需求
- 3三星永久關(guān)閉Tizen應(yīng)用商店:目前相關(guān)手機(jī)用戶(hù)已經(jīng)無(wú)法訪問(wèn)
- 4三星Galaxy S22 Ultra手寫(xiě)筆延遲突破2.8毫秒!成品預(yù)計(jì)今年2月推出
- 5Win11照片應(yīng)用迎來(lái)更新:重新優(yōu)化調(diào)整圖片編輯功能
- 6Chrome 97正式版預(yù)計(jì)年內(nèi)2月1日轉(zhuǎn)正 修復(fù)數(shù)十個(gè)安全BUG
- 7消息稱(chēng)iPhone 14 Pro前置攝像頭將采用藥丸屏設(shè)計(jì) FaceID轉(zhuǎn)移到顯示屏下
- 8對(duì)不起,我恐怕不能這么做?用戶(hù)發(fā)現(xiàn)蘋(píng)果Siri無(wú)法為Apple Music歌曲評(píng)分
- 9微信視頻號(hào)直播推出扶持不少于10萬(wàn)個(gè)優(yōu)質(zhì)商家激勵(lì)計(jì)劃 引導(dǎo)私域用戶(hù)直播
- 10微信支持?jǐn)?shù)字人民幣支付:將新增“使用數(shù)字人民幣付款”選項(xiàng)
熱點(diǎn)專(zhuān)題
-
絕版旗艦堅(jiān)果R2獲更新:TNT連...1月7日消息,堅(jiān)果R2用戶(hù)在百度貼吧反映,堅(jiān)果R2手機(jī)獲得了SmartisanOS更新,版本號(hào)為8 5 1,新版系統(tǒng)... -
iPhone 13 Pro需求產(chǎn)能供不...富士康鄭州工廠又在招工了,iPhone的產(chǎn)能缺口看來(lái)很大。據(jù)悉,iPhone 13 Pro需求旺盛,最大組裝廠富士... -
百度投資生物醫(yī)藥公司瑞順生...企查查APP顯示,1月4日,廣東瑞順生物技術(shù)有限公司發(fā)生工商變更,新增百度關(guān)聯(lián)公司三亞百川致新私募股權(quán)... -
盜版軟件Popcorn Time宣布關(guān)...1月5日 消息:盜版軟件Popcorn Time宣布關(guān)閉了。這個(gè)通過(guò)盜版BitTorrent資源向用戶(hù)傳遞電影內(nèi)容,并承... -
快手12月份打擊私單交易等詐...1月5日消息,日前,快手發(fā)布了最新一期關(guān)于嚴(yán)厲打擊詐騙類(lèi)帳號(hào)的公告,該平臺(tái) 12 月份共處罰詐騙類(lèi)帳... -
再也不怕磁盤(pán)占用高了!微軟W...微軟的Office辦公軟件是每個(gè)打工人幾乎都離不開(kāi)的,它實(shí)際上是包括Word、Excel、PPT等多種軟件在內(nèi)的全... -
黑莓BlackBerry OS停止運(yùn)行...1月4日,黑莓打造的BlackBerry OS停服。官方稱(chēng),黑莓不再提供適用于BlackBerry7 1OS及更早版本、Black... -
Intel預(yù)熱12代雞血版i9-12900...今天晚上,Intel將會(huì)發(fā)布12代酷睿桌面版非K系列、移動(dòng)版,應(yīng)該會(huì)有博銳商務(wù)版,以及一個(gè)特殊型號(hào):i9-12... -
曝5G版iPhone SE將于上半年...除了挖孔屏iPhone 14、M2處理器MacBook Air、40核CPU+128核GPU的Mac Pro等產(chǎn)品,蘋(píng)果名記Mark Gurma... -
曝iPhone 14有望取消劉海設(shè)...對(duì)于iPhone 14來(lái)說(shuō),按照蘋(píng)果一貫的更新節(jié)奏看,這一代新機(jī)的外形要發(fā)生變化了,而去掉劉海,改用打孔...
Copy 2006-2020 財(cái)訊中國(guó) 版權(quán)所有<豫ICP備17019456號(hào)-9
聯(lián)系網(wǎng)站:52 78 229 @qq.com
營(yíng)業(yè)執(zhí)照公示信息
聲明:本站所有文章、數(shù)據(jù)僅供參考,使用前務(wù)請(qǐng)仔細(xì)閱讀法律聲明,風(fēng)險(xiǎn)自負(fù)。

相關(guān)新聞