HyperStyle,用於圖像編輯的 StyleGAN 的改編版

一隊 特拉維夫大學的研究人員最近推出了 HyperStyle,這是 一個顛倒的版本 機器學習系統 英偉達 StyleGAN2 它已經過重新設計,可在編輯真實世界圖像時重新創建缺失的部分。

StyleGAN 的特點是允許合成具有逼真外觀的新面孔, 設置年齡、性別、頭髮長度、微笑特徵、鼻子形狀、膚色、眼鏡和攝影角度等參數。

此外, HyperStyle 可以更改現有參數中的類似參數, 換句話說,它允許您在不修改照片特徵並保留原始面部可識別性的情況下創建照片。

HyperStyle 引入了超網絡來學習如何優化先前訓練的 StyleGAN 生成器相對於給定輸入圖像的權重。 這樣做可以通過類似編碼器的推理時間和高可編輯性實現優化級別重建。

例如,當使用 HyperStyle,可以模擬照片中人物年齡的變化,改變髮型,添加眼鏡,鬍鬚或小鬍子,使圖片看起來像卡通人物或手繪圖片,製作悲傷或快樂的表情。

在這種情況下, 該系統不僅可以訓練改變人臉,還可以改變任何物體,對於 例如,編輯汽車圖像。

大多數研究反演的作品都在尋找可以更準確地重建給定圖像的潛在代碼。 最近的一些工作提出了對生成器權重的圖像微調,以實現給定目標圖像的高質量重建。 借助 HyperStyle,我們旨在通過將這些生成器調整方法適應基於編碼器的方法,將它們引入交互式應用程序領域。

我們訓練了一個超網絡來學習如何相對於所需的目標圖像優化生成器權重。 通過學習這種映射,HyperStyle 在每張圖像不到 2 秒的時間內有效地預測生成器目標權重,使其適用於廣泛的應用程序。

所提出的方法 旨在解決在編輯過程中重建圖像缺失部分的問題. 上面提出的技術通過微調成像器來替換目標圖像的部分,同時重新創建最初丟失的可編輯區域,從而解決了重建和編輯之間的平衡。 這種方法的缺點是需要對每個圖像的神經網絡進行長期有針對性的訓練。

基於 StyleGAN 算法的方法允許使用典型模型, 對常見的圖像集合進行預訓練,以生成原始圖像的特徵元素,其置信度與需要對每個圖像的模型進行單獨訓練的算法相當。

新方法的優點之一是能夠以接近實時的性能修改圖像,此外 該模型已準備好根據集合為那些人、汽車和動物準備訓練 來自 Flickr-the Faces-HQ(FFHQ,70,000 張高質量的人臉 PNG 圖像)、The Stanford Cars(16 張汽車圖像)和 AFHQ(動物照片)。

另外, 提供了一組工具來訓練您的模型以及適用於它們的典型編碼器和生成器的現成訓練模型。 例如,有一些生成器可用於創建 Toonify 風格的圖像、皮克斯角色、創建草圖,甚至像迪斯尼公主一樣造型。

終於 對於那些有興趣了解更多的人 關於這個工具,您可以查看詳細信息 在下面的鏈接中。

值得一提的是,代碼是使用 PyTorch 框架用 Python 編寫的,並且獲得了 MIT 許可。 您可以在以下位置檢查代碼 以下鏈接。


發表您的評論

您的電子郵件地址將不會被發表。 必填字段標有 *

*

*

  1. 負責資料:AB Internet Networks 2008 SL
  2. 數據用途:控制垃圾郵件,註釋管理。
  3. 合法性:您的同意
  4. 數據通訊:除非有法律義務,否則不會將數據傳達給第三方。
  5. 數據存儲:Occentus Networks(EU)託管的數據庫
  6. 權利:您可以隨時限制,恢復和刪除您的信息。