Automatické shlukování skenovaných dokumentů

Navržený typ práce: Diplomová práce     Celkový stav inzerátu: Volné


Cílem této práce je vytvoření automatického shlukování textových dokumentů (tištěné či ručně psané), které jsou dostupné pouze ve skenovaném (obrazovém) formátu. Výsledkem by měla být funkční metoda, která bude rozdělovat dokumenty do různých skupin. Každá skupina by měla ideálně obsahovat dokumenty, které spolu souvisejí: vypadají podobně a reprezentují stejnou třídu: např. ručně psané poznámky, faktury, emaily, formuláře, atd..

Diplomantův úkol bude v první řadě prozkoumat dostupné metody využitelné pro shlukování obrazových dokumentů (případně obrázků obecně) a další metody s učením bez učitele (tzv. unsupervised). Následně dle dohody s vedoucím práce implementuje některé metody s cílem maximalizovat úspěšnost na zvolené datové sadě. Očekává se rovněž i kritická analýza použitelnosti.




Pro akad. rok: 2023/2024

Vložil: Ing. Jiří Martínek, Ph.D.

Email: jimar@ntis.zcu.cz

Vloženo: 27.4.2023 000 01:20:03

Zdroj: externí systém

Katedry

Zkratka katedryNázev katedryStavSchválilVedoucí práce
FAV/KIVKatedra informatiky a výpočetní technikySchválenoIng. Jiří Martínek, Ph.D.
jimar@ntis.zcu.cz
Ing. Jiří Martínek, Ph.D.
jimar@ntis.zcu.cz