Title: Sledování pohybu objektu ve 3D pomocí hloubkového snímače
Other Titles: Movement tracking of an object in 3D using depth sensor
Authors: Berka, Filip
Advisor: Hrúz Marek, Ing. Ph.D.
Referee: Bureš Lukáš, Ing.
Issue Date: 2016
Publisher: Západočeská univerzita v Plzni
Document type: diplomová práce
URI: http://hdl.handle.net/11025/23639
Keywords: kinect;opencv;sledování ruky;počítačové vidění;klasifikace;náhodhný rozhodovací les
Keywords in different language: kinect;opencv;hand tracking;computer vision;classification;random decision forest
Abstract: Tato práce se zabývá sledováním ruky v hloubkových obrazech. V teoretické části je nejprve popsán použitý senzor Kinect v2. Dále práce popisuje algoritmy počítačového vidění a strojového učení, které byly použity v části praktické. Praktická část popisuje postup při řešení úlohy a shrnuje dosažené výsledky. Úloha byla řešena metodou klasifikace pixelů hloubkových obrazů do tříd ruky a pozadí náhodným rozhodovacím lesem. Postup při řešení spočíval ve vytvoření trénovací množiny hloubkových obrazů a označení pixelů, které byly součástí ruky. Toto označení pak sloužilo jako informace učitele. Analýzou změny hloubky v okolí takto označených pixelů byly vytvořeny příznakové vektory. Ty byly dále použity k trénování klasifikátorů. Pro nejsložitější uvažované nastavení klasifikátoru bylo na testovací množině dosaženo téměř 90 % F1-score. Klasifikátory byly též aplikovány na hloubkové obrazy plynoucí z Kinectu v reálném čase.
Abstract in different language: This thesis concerns with hand tracking in depth images. In the theoretical part at first there is a description of Kinect v2 sensor which was used to acquire the depth images. Then it describes algorithms of computer vision and machine learning which were used in the practical part. The practical part of the thesis describes solution of the problem and summarizes achieved results. The problem was solved by classification of depth image pixels into the hand class and the background class using Random Decision Forest. The solution is based on creation of a dataset of depth images and labeling of pixels which were part of the hand. This labeling was used as the teacher information. Analysing the change in depth in the neighbourhoods of labeled pixels the feature vectors were created. They were then used to train the classifiers. For the most complicated considered settings of the classifier nearly 90 % F1-score was reached on the test set. The classifiers were also used on the depth images streaming from Kinect in real-time.
Rights: Plný text práce je přístupný bez omezení.
Appears in Collections:Diplomové práce / Theses (KKY)

Files in This Item:
File Description SizeFormat 
Diplomka_Berka.pdfPlný text práce9,99 MBAdobe PDFView/Open
berka-v.pdfPosudek vedoucího práce578,75 kBAdobe PDFView/Open
berka-o.pdfPosudek oponenta práce1,06 MBAdobe PDFView/Open
berka-p.pdfPrůběh obhajoby práce403,75 kBAdobe PDFView/Open

Please use this identifier to cite or link to this item: http://hdl.handle.net/11025/23639

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.