Title: Deep Generalized Max Pooling
Other Titles: Hluboký zobecněný max pooling
Authors: Christlein, Vincent
Spranger, Lukas
Seuret, Mathias
Nicolaou, Anguelos
Král, Pavel
Maier, Andreas
Citation: CHRISTLEIN, V., SPRANGER, L., SEURET, M., NICOLAOU, A., KRÁL, P., MAIER, A.. Deep Generalized Max Pooling. In: The 15th IAPR International Conference on Document Analysis and Recognition. Piscataway: IEEE, 2019. s. 1090-1096. ISBN 978-1-72813-014-9 , ISSN 1520-5363.
Issue Date: 2019
Publisher: IEEE
Document type: konferenční příspěvek
conferenceObject
URI: 2-s2.0-85079832418
http://hdl.handle.net/11025/36757
ISBN: 978-1-72813-014-9
ISSN: 1520-5363
Keywords: pooling;hluboké učení;analýza dokumentů;klasifikace obrazů dokumentů;identifikace pisatele
Keywords in different language: pooling;deep learning;document analysis;document image classification;writer identification
Abstract: Global pooling layers are an essential part of Convolutional Neural Networks (CNN). Global average pooling or global max pooling are commonly used for converting convolutional features of variable size images to a fix-sized embedding. However, both pooling layer types are computed spatially independent. In contrast, we propose Deep Generalized Max Pooling that balances the contribution of all activations of a spatially coherent region by re-weighting all descriptors so that the impact of frequent and rare ones is equalized. We show that this layer is superior to both average and max pooling on the classification of Latin medieval manuscripts (CLAMM’16, CLAMM’17), as well as writer identification (Historical-WI’17).
Globální poolingové vrstvy jsou nezbytnou součástí konvolučních neuronových sítí (CNN). Globální průměrný pooling nebo globální maximální pooling se běžně používají k převodu konvolučních příznaků obrazů s proměnnou velikostí na vektor s pevnou velikostí. Oba typy poolingových vrstev jsou však počítány prostorově nezávisle. Na rozdíl od toho navrhujeme „hluboký zobecněný max pooling“, který upravuje přínos všech aktivací prostorově koherentní oblasti převážením všech deskriptorů tak, aby byl vyrovnáván dopad častých a vzácných. Ukazujeme, že tato vrstva překonává výsledky průměrného i maximálního poolingu v úloze klasifikace latinských středověkých rukopisů (CLAMM’16, CLAMM’17), stejně jako v identifikaci pisatele (Historical-WI’17).
Rights: Plný text je přístupný v rámci univerzity přihlášeným uživatelům.
© IEEE
Appears in Collections:Konferenční příspěvky / Conference Papers (KIV)
OBD

Files in This Item:
File SizeFormat 
Král 2Q8M1Auyriy0CX2DzHmTOJ.pdf828,54 kBAdobe PDFView/Open    Request a copy


Please use this identifier to cite or link to this item: http://hdl.handle.net/11025/36757

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

search
navigation
  1. DSpace at University of West Bohemia
  2. Publikační činnost / Publications
  3. OBD