Automatické shlukování skenovaných dokumentů
Navržený typ práce: Diplomová práce
Celkový stav inzerátu: Volné
Cílem této práce je vytvoření automatického shlukování textových dokumentů (tištěné či ručně psané), které jsou dostupné pouze ve skenovaném (obrazovém) formátu. Výsledkem by měla být funkční metoda, která bude rozdělovat dokumenty do různých skupin. Každá skupina by měla ideálně obsahovat dokumenty, které spolu souvisejí: vypadají podobně a reprezentují stejnou třídu: např. ručně psané poznámky, faktury, emaily, formuláře, atd..
Diplomantův úkol bude v první řadě prozkoumat dostupné metody využitelné pro shlukování obrazových dokumentů (případně obrázků obecně) a další metody s učením bez učitele (tzv. unsupervised). Následně dle dohody s vedoucím práce implementuje některé metody s cílem maximalizovat úspěšnost na zvolené datové sadě. Očekává se rovněž i kritická analýza použitelnosti.
Pro akad. rok: 2023/2024
Vložil: Ing. Jiří Martínek, Ph.D.
Email: jimar@ntis.zcu.cz
Vloženo: 27.4.2023 000 01:20:03
Zdroj: externí systém
Katedry
Zkratka katedry | Název katedry | Stav | Schválil | Vedoucí práce |
---|
FAV/KIV | Katedra informatiky a výpočetní techniky | Schváleno | Ing. Jiří Martínek, Ph.D. jimar@ntis.zcu.cz | Ing. Jiří Martínek, Ph.D. jimar@ntis.zcu.cz |