Začínáme
Systém LISp-Miner a proces DZD
Analytické procedury
Pokročilé funkce
Výzkum a vývoj
Začínáme
Systém LISp-Miner a proces DZD
Analytické procedury
Pokročilé funkce
Výzkum a vývoj
Záložka obsahuje detailní popis vytvořeného stromu. Vyvoláme ji stiskem tlačítka Detail
nebo dvojitým kliknutím myší na řádek v seznamu variant shlukování na záložce s výsledky úlohy pro ETree-Miner.
V záhlaví záložky je zjednodušený popis atributů vyskytujících se ve stromu (ne vždy se vejde celý) a případně i aktuální tvar podmínky.
Dále je možné přepínat mezi třemi dílčími záložkami:
TEXT
… textový popis stromu, včetně charakteristik rozsahu stromu a jeho kvality;DATA
… náhled na datovou matici s atributy vystupujícími v tomto stromu); TREE
… grafické znázornění stromu – tato dílčí záložka se zobrazí standardně po otevření detailu stromu.Dílčí záložka obsahuje textový popis stromu, jeho kvantitativní charakteristiky (počet různých atributů nebo maximální hloubka) a také informace o kvalitě stromu. Následuje textová reprezentace celého stromu s podrobnými údaji o každém z uzlů i větví.
Před zobrazením dílčí záložky je nutné interně převést strom na rozhodovací pravidla (pokud tak již nebylo učiněno dříve). Proto může přepnutí na dílčí záložku chvíli trvat.
Dílčí záložka DATA
zobrazuje analyzovanou datovou matici se sloupci odpovídajícími atributům aktuálně použitých ve stromu – ukázka je na obrázku.
Pro každý řádek matice je zobrazen i cílový atribut a třída, do které byl řádek přiřazen na základě klasifikace tímto stromem (sloupec Classified as
). Ve sloupci Ok
je pak hodnota 1 vždy, když se klasifikace shoduje s hodnotou v datech. Chybné klasifikace jsou naopak zvýrazněny červeně.
Na záložce TREE
je strom zobrazen v grafické podobě – viz obrázek na začátku této stránky. Způsob zobrazení i ovládání je totožný jako na záložce interaktivního vytváření rozhodovacího stromu.
Každý uzel je označen svým typem – Root (kořenový uzel), S (split – větvící atribut) nebo B (branch – větev pro danou kategorii větvícího atributu). U větvících atributů a větví je pomocí kombinace písmen S/B a čísel uvedena jednoznačná identifikace uzlu v rámci stromu. Pro uzly reprezentující větvící atributy je pod identifikací uveden název větvícího atributu. Pro uzly reprezentující větev je pod identifikací uveden název kategorie. Pro tyto uzly je zároveň uvedena i nejčetnější cílová třída (klasifikace).
Aktuálně vybraný uzel má zvýrazněný rámeček. Žlutě jsou zvýrazněny 100\% čisté uzly a červeně uzly s nulovým pokrytím.
Tlačítka pod grafickým zobrazením stromu slouží pro procházení uzlů stromu. Tlačítkem Focus node
přiblížíme zobrazení stromu pouze na aktuálně vybraný uzel. Tlačítko Zoom to fit
naopak zmenší zobrazení stromu tak, aby se vešel celý na obrazovku. Tlačítkem Node detail
vyvoláme dialogové okno s detailními informacemi o právě vybraném uzlu (platí pouze pro uzly větve kategorie). V tomto okně je zejména pozice uzlu v hierarchii stromu, jeho pokrytí a čistota.
Tlačítkem Show decision rules
otevřeme záložku s rozhodovacími pravidly, na která je možné strom převést.
Rozvést
Tlačítkem Consultation
vyvoláme hromadnou klasifikaci pomocí tohoto stromu nad zvolenou datovou maticí. Zvolená matice musí obsahovat všechny vysvětlující atributy použité ve stromu pro větvení. Potom je pomocí stromu provedena klasifikace každého řádku zvolené matice a určena cílová třída – viz obrázek.
Je-li zároveň ve zvolené matici atribut shodný s cílovým atributem stromu, je ve výsledném přehledu informace, zda je jeho hodnota shodná s vydanou klasifikací. V tomto případě je i na závěr klasifikace spočtena matice záměn.
Související témata: