Task #3889
closed
Vybrat triedy dokumentov pre ucely klasifikacie
Added by Hrúz Marek almost 9 years ago.
Updated over 5 years ago.
Description
Pre ucely projektu bude vhodne klasifikovat dokumenty, aby sme vedeli ako ich dalej spracovavat.
Triedy, do ktorych sa bude klasifikovat nie su zatial urcene a vramci tejto ulohy budu dane triedy identifikovane. Dokumenty sa musia prezriet manualne.
Files
udělat supervised shlukování
- potřeba supervised množina dokumentů (zkusit natrénovat v prvním nástřelu unsupervised třídy a zkouknout je ručně) aby poté bylo možné dokumnty zpracovávat OCR s nějakou přidanou znalostí o dokumentu
Vybrana mnozina tried pre klasifikaciu (viz. document_types.txt)
V buducnosti sa mozno rozsiri.
- Subject changed from Vybrat triedy dokumentov pre ucely klasifikacie to Vybrat triedy dokumentov pre ucely klasifikacie - natrénovat supervised klasifikátor
- % Done changed from 90 to 50
Ze schůzky [[
https://wikky.zcu.cz/redmine/projects/naki-ii-ustr/wiki/Schuzka16-10-03]]:
- LBu unsupervised klasifikace do 3 tříd (předpoklad: hand/printed/photo) - Kmeans z příznaků z poslední vrstvy CNN (Alex net) - nefunguje
- co funguje - hledání nejbližšího dokumentu ke zvolenému
- MH určit ručně analýzou dokumentů 11 tříd
- Dodělat -> najít reprezentativní obrázky k daným 11 třídám a jimi natrénovat supervised klasifikátor
- Subject changed from Vybrat triedy dokumentov pre ucely klasifikacie - natrénovat supervised klasifikátor to Vybrat triedy dokumentov pre ucely klasifikacie
- Priority changed from Normal to Urgent
Připravit návod na anotaci
- Status changed from Assigned to Closed
Also available in: Atom
PDF