Název: Evaluation of Image Synthesis for Automotive Purposes
Další názvy: Evaluace syntézy obrázků pro účely automobilového průmyslu
Autoři: Diviš, Václav
Hrúz, Marek
Citace zdrojového dokumentu: DIVIŠ, V., HRÚZ, M. Evaluation of Image Synthesis for Automotive Purposes. In: 5th International Conference, ICR 2020, St Petersburg, Russia, October 7-9, 2020, Proceedings. Cham: Springer, 2020. s. 67-77. ISBN 978-3-030-60336-6, ISSN 0302-9743.
Datum vydání: 2020
Nakladatel: Springer
Typ dokumentu: konferenční příspěvek
preprint
conferenceObject
preprint
URI: 2-s2.0-85092929201
http://hdl.handle.net/11025/42723
ISBN: 978-3-030-60336-6
ISSN: 0302-9743
Klíčová slova: Generative Adversarial sítě;rozšíření databáze obrázků;BigGAN;SAGAN;WGAN;databáze dopravního značení
Klíčová slova v dalším jazyce: Generative Adversarial Networks;Image dataset extension;BigGAN;SAGAN;WGAN;Traffic signs dataset
Abstrakt: Cílem tohoto článku je vyhodnotit syntézu obrázků realizovanou pomocí Generative Adversarial sítí (podmíněný Wasserstein GAN a GAN se sebe pozorností) na databázy obrázků dopravního značení. V experimentech se zaměřujeme na generování obrázků s rozlišením 64x64 pixelů a na schopnost GANů zachytit strukturální a geometrické vzory. Trénujeme čtyři různé architektury GANů, abychom zdůraznili problémy trénování, jako jsou mód kolapsu, mizející gradienty a výslednou všrnost obrázků. Pro porovnání s ostatními pracemi používáme vzdálenost Frechet Inception. V závěru adresujeme význam vyhodnocování na databázy pro automobilový průmysl, jako rovněž návrh dalších vylepšění.
Abstrakt v dalším jazyce: The aim of this article is to evaluate a state of the art image synthesis carried out via Generative Adversarial Networks (conditional Wasserstein GAN and Self Attention GAN) on a traffic signs dataset. For the experiment, we focused on generating images with a 64×64-pixel resolution as well as on the GAN’s ability to capture structural and geometric patterns. Four different GAN architectures were trained in order to highlight the difficulties of the training, such as collapse mode, vanishing gradient and resulting image fidelity. The Frechent Inception Distance is compared with other state of the art results. The importance of evaluating on automotive datasets as well as additional wishes for further improvements are addressed at the end of this article.
Práva: Plný text není přístupný.
© Springer
Vyskytuje se v kolekcích:Preprinty / Preprints (NTIS)
Preprinty / Preprints (KKY)
Konferenční příspěvky / Conference papers (NTIS)
Konferenční příspěvky / Conference Papers (KKY)
OBD



Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/42723

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.

hledání
navigace
  1. DSpace at University of West Bohemia
  2. Publikační činnost / Publications
  3. OBD