Task #3889
closed
  
    
    
  
Vybrat triedy dokumentov pre ucely klasifikacie
 
        
        Added by Hrúz Marek over 9 years ago.
        Updated almost 6 years ago.
        
  
  
  
  Description
  
  Pre ucely projektu bude vhodne klasifikovat dokumenty, aby sme vedeli ako ich dalej spracovavat.
	Triedy, do ktorych sa bude klasifikovat nie su zatial urcene a vramci tejto ulohy budu dane triedy identifikovane. Dokumenty sa musia prezriet manualne.
   
 
  
  Files
  
 
  
  
    
    
    
    udělat supervised shlukování 
- potřeba supervised množina dokumentů (zkusit natrénovat v prvním nástřelu unsupervised třídy a zkouknout je ručně) aby poté bylo možné dokumnty zpracovávat OCR s nějakou přidanou znalostí o dokumentu
 
   
  
  
    
    
    
    
    Vybrana mnozina tried pre klasifikaciu (viz. document_types.txt)
V buducnosti sa mozno rozsiri.
 
   
  
  
    
    
    
    
       - Subject changed from Vybrat triedy dokumentov pre ucely klasifikacie to Vybrat triedy dokumentov pre ucely klasifikacie - natrénovat supervised klasifikátor
- % Done changed from 90 to 50
Ze schůzky [[
https://wikky.zcu.cz/redmine/projects/naki-ii-ustr/wiki/Schuzka16-10-03]]: 
	
	- LBu unsupervised klasifikace do 3 tříd (předpoklad: hand/printed/photo) - Kmeans z příznaků z poslední vrstvy CNN (Alex net) - nefunguje
- co funguje - hledání nejbližšího dokumentu ke zvolenému
- MH určit ručně analýzou dokumentů 11 tříd
- Dodělat -> najít reprezentativní obrázky k daným 11 třídám a jimi natrénovat supervised klasifikátor
 
   
  
  
    
    
    
    
       - Subject changed from Vybrat triedy dokumentov pre ucely klasifikacie - natrénovat supervised klasifikátor to Vybrat triedy dokumentov pre ucely klasifikacie
- Priority changed from Normal to Urgent
 
   
  
  
    
    
    
    Připravit návod na anotaci
 
   
  
  
    
    
    
    
       - Status changed from Assigned to Closed
 
   
  
 
  
  
 
Also available in:  Atom
  PDF