英偉達閑著沒事,做了一個超級逼真的人臉生成AI系統!
其實這套系統除了可生成人臉之外,還可以生成貓、狗、汽車、臥室場景等。不過,這些AI計算出來圖像有些很相似,但有些卻顯的很奇怪。
Nvidia 英偉達的人臉面部表情方法真的是GAN-風格。
一種新的生成性對抗網絡方法讓技術觀察者摸不著頭腦:圖像如何虛假而又看起來如此真實?
研究人員在一段視頻中說:“我們想出了一種新的發生器,可以自動學習分離圖像的不同方面而無需任何人為監督。” 他們在他們的論文中指出,“新架構導致了自動學習,無監督的高級屬性分離。”
基于樣式的生成器(config F)使用FFHQ數據集生成的未經計算的圖像集。
讓假照片看起來真實是一種藝術上的努力,這并不是什么新鮮事,但這三位研究人員將努力提升到了一個新的水平。
他們在他們的論文“用于生成對抗網絡的基于樣式的生成器架構”中闡述了他們的技術。 這篇論文是關于arXiv的,它引起了很多關注。
Big Think的斯蒂芬約翰遜說結果“非常令人吃驚”。 麻省理工學院技術評論中的Will Knight說我們所看到的是“驚人的,幾乎令人毛骨悚然的現實主義”。
研究人員Tero Karras,Samuli Laine和Timo Aila來自Nvidia。 他們的方法側重于構建一個生成的對抗網絡,即GAN,在那里學習可以生成模仿真實照片外觀的全新圖像。
作者說,這個視頻中的所有圖像都是由他們的發生器產生的。 “他們不是真人的照片。”
他們的論文“騎士說,”展示了如何使用這種方法,并重新混合種族,性別,甚至雀斑等元素。
魔術醬是他們的基于風格的發電機。 Big Think將此解釋為用于自動生成圖像的傳統技術的修改版本。
他們的技術正在弄亂你的頭,笑到最后(或者說,無論你怎么看)。
你作為一個人類認為“圖像”。 然而,發電機認為“風格集合”。
每種風格都以特定的比例控制效果。款式粗獷,款式中等,款式精美。 (粗略的樣式指的是姿勢,頭發,臉型;中間的樣式指的是面部特征;眼睛。精細的樣式指的是配色方案。)
與此同時,Will Knight對GAN進行了一些觀察:“GAN使用兩個決斗神經網絡來訓練計算機,以便足夠好地學習數據集的性質以產生令人信服的假貨。當應用于圖像時,這提供了一種經常高度生成的方法逼真的偽造。“
通過使一個潛在代碼(源)生成的樣式覆蓋另一個(目標)的樣式的子集,可視化生成器中樣式的效果。
約翰遜提供了GAN概念的背景:
“2014年,一位名叫Ian Goodfellow的研究人員和他的同事寫了一篇論文,概述了一種新的機器學習概念,稱為生成對抗性網絡。簡單來說,這個想法涉及將兩個神經網絡相互對立。一個充當發現者的視角比方說,狗的圖片,然后盡力創建一個它認為狗的樣子的圖像。另一個網絡充當鑒別器,試圖從真實的圖像中辨別假圖像。
說到計算機視覺功能的發展用例,谷歌曾經在2017年發布了一款AI硬件紙盒套件(也是旗下AI開源項目(AIY Projects)的作品)。其中,AIY Vision Kit 就是一套簡單的計算機視覺系統,它可以檢測幾千種常見物體,也可以對人類的臉部表情進行檢測,并顯示出情緒,比如微笑、皺眉、憤怒、開心等等。它還可以識別人、貓、狗。這些都得益于神經網絡技術。
“起初,發生器可能會產生一些看起來不像狗的圖像,因此鑒別器會將它們擊落。但是發生器現在知道它出錯的地方,所以它創建的下一個圖像稍微好一些。 從理論上講,發電機一直持續到造成狗的良好形象。“
Nvidia的團隊將風格轉移原則添加到GAN組合中。
TechCrunch中的Devin Coldewey:“汽車,貓,風景 - 所有這些東西或多或少都符合可以單獨隔離和再現的小型,中型和大型功能的相同范例。”
從技術角度來看,他們的作品在看起來真實的人的圖像中得到了令人印象深刻的結果。 從流行的觀點來看,通過談論虛假新聞加劇,這種進步被認為是危險的。 約翰遜說:“生成逼真的人工圖像的能力,通常被稱為深度偽造,當圖像看起來像可識別的人時,近年來引起了人們的關注。”
技術觀察網站頁面上充斥著關于“令人毛骨悚然”的評論,有些評論只是問題:“我們為什么要這樣做?” “誰來支付它?” “如果我們不建立監管界限,我認為人類歷史的下一場重大戰役將與我們創造的人工智慧進行斗爭(并可能失敗),”一位回應說。
盡管如此,并非所有評論都反映出不安。 這是一項技術進步,一些評論指出,應用程序可能對某些部門有所幫助。 設計師,廣告代理商創建者,甚至視頻游戲創作者都可以使用這項技術。
“這些人工智慧生成的面孔有望在視頻游戲和電影中引入新一代逼真的人,而不需要人類演員或演員,”HotHardware說。
Nvidia 英偉達的人臉面部表情方法真的是GAN-風格。
一種新的生成性對抗網絡方法讓技術觀察者摸不著頭腦:圖像如何虛假而又看起來如此真實?
研究人員在一段視頻中說:“我們想出了一種新的發生器,可以自動學習分離圖像的不同方面而無需任何人為監督。” 他們在他們的論文中指出,“新架構導致了自動學習,無監督的高級屬性分離。”
基于樣式的生成器(config F)使用FFHQ數據集生成的未經計算的圖像集。
讓假照片看起來真實是一種藝術上的努力,這并不是什么新鮮事,但這三位研究人員將努力提升到了一個新的水平。
他們在他們的論文“用于生成對抗網絡的基于樣式的生成器架構”中闡述了他們的技術。 這篇論文是關于arXiv的,它引起了很多關注。
Big Think的斯蒂芬約翰遜說結果“非常令人吃驚”。 麻省理工學院技術評論中的Will Knight說我們所看到的是“驚人的,幾乎令人毛骨悚然的現實主義”。
研究人員Tero Karras,Samuli Laine和Timo Aila來自Nvidia。 他們的方法側重于構建一個生成的對抗網絡,即GAN,在那里學習可以生成模仿真實照片外觀的全新圖像。
作者說,這個視頻中的所有圖像都是由他們的發生器產生的。 “他們不是真人的照片。”
他們的論文“騎士說,”展示了如何使用這種方法,并重新混合種族,性別,甚至雀斑等元素。
魔術醬是他們的基于風格的發電機。 Big Think將此解釋為用于自動生成圖像的傳統技術的修改版本。
他們的技術正在弄亂你的頭,笑到最后(或者說,無論你怎么看)。
你作為一個人類認為“圖像”。 然而,發電機認為“風格集合”。
每種風格都以特定的比例控制效果。款式粗獷,款式中等,款式精美。 (粗略的樣式指的是姿勢,頭發,臉型;中間的樣式指的是面部特征;眼睛。精細的樣式指的是配色方案。)
與此同時,Will Knight對GAN進行了一些觀察:“GAN使用兩個決斗神經網絡來訓練計算機,以便足夠好地學習數據集的性質以產生令人信服的假貨。當應用于圖像時,這提供了一種經常高度生成的方法逼真的偽造。“
通過使一個潛在代碼(源)生成的樣式覆蓋另一個(目標)的樣式的子集,可視化生成器中樣式的效果。
約翰遜提供了GAN概念的背景:
“2014年,一位名叫Ian Goodfellow的研究人員和他的同事寫了一篇論文,概述了一種新的機器學習概念,稱為生成對抗性網絡。簡單來說,這個想法涉及將兩個神經網絡相互對立。一個充當發現者的視角比方說,狗的圖片,然后盡力創建一個它認為狗的樣子的圖像。另一個網絡充當鑒別器,試圖從真實的圖像中辨別假圖像。
說到計算機視覺功能的發展用例,谷歌曾經在2017年發布了一款AI硬件紙盒套件(也是旗下AI開源項目(AIY Projects)的作品)。其中,AIY Vision Kit 就是一套簡單的計算機視覺系統,它可以檢測幾千種常見物體,也可以對人類的臉部表情進行檢測,并顯示出情緒,比如微笑、皺眉、憤怒、開心等等。它還可以識別人、貓、狗。這些都得益于神經網絡技術。
“起初,發生器可能會產生一些看起來不像狗的圖像,因此鑒別器會將它們擊落。但是發生器現在知道它出錯的地方,所以它創建的下一個圖像稍微好一些。 從理論上講,發電機一直持續到造成狗的良好形象。“
Nvidia的團隊將風格轉移原則添加到GAN組合中。
TechCrunch中的Devin Coldewey:“汽車,貓,風景 - 所有這些東西或多或少都符合可以單獨隔離和再現的小型,中型和大型功能的相同范例。”
從技術角度來看,他們的作品在看起來真實的人的圖像中得到了令人印象深刻的結果。 從流行的觀點來看,通過談論虛假新聞加劇,這種進步被認為是危險的。 約翰遜說:“生成逼真的人工圖像的能力,通常被稱為深度偽造,當圖像看起來像可識別的人時,近年來引起了人們的關注。”
技術觀察網站頁面上充斥著關于“令人毛骨悚然”的評論,有些評論只是問題:“我們為什么要這樣做?” “誰來支付它?” “如果我們不建立監管界限,我認為人類歷史的下一場重大戰役將與我們創造的人工智慧進行斗爭(并可能失敗),”一位回應說。
盡管如此,并非所有評論都反映出不安。 這是一項技術進步,一些評論指出,應用程序可能對某些部門有所幫助。 設計師,廣告代理商創建者,甚至視頻游戲創作者都可以使用這項技術。
“這些人工智慧生成的面孔有望在視頻游戲和電影中引入新一代逼真的人,而不需要人類演員或演員,”HotHardware說。