浮世繪面孔數據集

譯者:AI研習社(星期五

雙語原文鏈接:Ukiyo-e faces dataset


下載數據集:V2

ukiyoe-dataset.jpg

作為論文域之間可控圖像合成的分辨率相關GAN插值[1]的一部分,我使用浮世繪的人臉圖像數據集來訓練StyleGAN模型,本文包含該數據集的鏈接和該數據集的詳細信息。

更新

  • V2-刪除了28張質量不好的圖像(對準不良或沒有正面)。

  • V1-最初的發行版,使用在與分辨率相關的GAN插值的論文中,用於域之間的可控圖像合成。

數據集

浮世繪人臉數據集包含來自浮世繪照片的5209張臉部圖像。 圖像格式為1024×1024的jpeg,並已根據FFHQ數據集所使用的過程進行了對齊。 上面是數據集中(幾乎)所有圖像的地圖,越相似的圖像彼此越靠近[2]。 為便於顯示,圖像像素已降至 256×256。

更多細節

圖片是從數個博物館網站上刮下來的,然後我試着用Amazon Rekognition從每個圖片中檢測面部和面部標誌。 Rekognition相對合理地完成了任務,但是顯然並不完美,很多面部都被遺漏了,並且許多圖像中都存在對齊錯誤。 許多圖像的分辨率不是很高,因此要生成可用的1024×1024分辨率的數據集,我使用在Manga109數據集上訓練的預訓練ESRGAN [3]模型來按需放大圖像,這些圖像偶爾會出現一些瑕疵,但大體上結果不錯。

其他數據集

KaoKore是浮世繪人臉的另一個數據集[4],它具有更多的變化和標籤,但是圖像分辨率較低且人臉未對齊。

kaokore_example.jpg

許可和使用

此數據集是根據知識共享署名-相同方式共享4.0國際許可提供的。

如果使用數據集,請引用為「Aligned ukiyo-e faces dataset, Justin Pinkney 2020」或一個bibtex條目:

@misc{pinkney2020ukiyoe,
      author = {Justin N. M. Pinkney},
      title = {Aligned Ukiyo-e faces dataset},
      year={2020},
      howpublished= {\url{//www.justinpinkney.com/ukiyoe-dataset}}
  1. Pinkney, Justin N. M., and Doron Adler. 『Resolution Dependent GAN Interpolation for Controllable Image Synthesis Between Domains』. ArXiv:2010.05334 [Cs, Eess], 20 October 2020. //arxiv.org/abs/2010.05334.

  2. 為了生成此圖像,我首先使用在Imagenet上預訓練的ResNet50從每個圖像中提取CNN特徵。 然後使用UMAP將這些高維特徵向量投影到二維,然後使用lapjv算法完成網格劃分。

  3. Wang, Xintao, Ke Yu, Shixiang Wu, Jinjin Gu, Yihao Liu, Chao Dong, Chen Change Loy, Yu Qiao, and Xiaoou Tang. 『ESRGAN: Enhanced Super-Resolution Generative Adversarial Networks』. ArXiv:1809.00219 [Cs], 1 September 2018. //arxiv.org/abs/1809.00219.

  4. Tian, Yingtao, Chikahiko Suzuki, Tarin Clanuwat, Mikel Bober-Irizar, Alex Lamb, and Asanobu Kitamoto. 『KaoKore: A Pre-Modern Japanese Art Facial Expression Dataset』. ArXiv:2002.08595 [Cs, Stat], 20 February 2020. //arxiv.org/abs/2002.08595.


AI研習社是AI學術青年和AI開發者技術交流的在線社區。我們與高校、學術機構和產業界合作,通過提供學習、實戰和求職服務,為AI學術青年和開發者的交流互助和職業發展打造一站式平台,致力成為中國最大的科技創新人才聚集地。

如果,你也是位熱愛分享的AI愛好者。歡迎與譯站一起,學習新知,分享成長。