Začínáme
Systém LISp-Miner a proces DZD
Analytické procedury
Pokročilé funkce
Výzkum a vývoj
Začínáme
Systém LISp-Miner a proces DZD
Analytické procedury
Pokročilé funkce
Výzkum a vývoj
Záložka obsahuje detailní popis nalezené varianty shlukování. Vyvoláme ji stiskem tlačítka Detail
nebo dvojitým kliknutím myší na řádek v seznamu variant shlukování na záložce s výsledky úlohy pro MCluster-Miner.
V záhlaví záložky je zjednodušený popis atributů vyskytujících se ve stromu (ne vždy se vejde celý) a případně i aktuální tvar podmínky. Dále je možné přepínat mezi pěti dílčími záložkami:
TEXT
… textový popis varianty shlukování, včetně různých charakteristikCENTROIDS
… interaktivní seznam vytvořených shluků a jejich grafické reprezentace, otevře se standardně po otevření záložky s detailem varianty shlukováníDATA
… náhled na datovou matici s atributy vystupujícími v této variantě shlukováníXY PLOT
… grafická vizualizace dat pomocí analýzy hlavních komponentFREQUENCIES
… grafické znázornění četností shluků.Dílčí záložka obsahuje seznam atributů použitých v této variantě shlukování a použitý typ algoritmu a míry podobnosti. Následuje tabulka s popisem nalezených shluků, ve které je kromě počtu objektů patřících do daného shluku uveden i vypočtený střed shluku. U každého shluku je dále průměrná, minimální a maximální vnitroshluková vzdálenost. Následují různé další charakteristiky této varianty shlukování.
Ukázku dílčí záložky CENTROIDS
vidíme na obrázku výše. Na dílčí záložce nalezneme seznam nalezených shluků, četnosti objektů v nich a popis shluku pomocí jeho středu – pro každý z použitých atributů pro shlukování je uvedena průměrná hodnota ve shluku (pro atributy s numerickými hodnotami) nebo hodnota nejtypičtější (pro atributy s nominálními hodnotami).
Je-li povolen výpočet středu jako desetinné číslo, může být hodnota středu uváděna ve tvaru První kategorie – Druhá kategorie a s uvedením procentní podílu obou kategorií. Například hodnota ‹0;5› {25 % : 75 %} (5;10› znamená, že střed je někde mezi 2,5 (střed intervalu první kategorie) a 7,5 (střed intervalu druhé kategorie) a že je ze 75 % vychýlen směrem k druhé kategorii. To znamená, že přesná hodnota středu je 6,125. V případě 50 % – 50 % by střed byl 5,00.
V grafu pod seznamem jsou pak jednotlivé shluky zobrazeny graficky jako spojnice centrů pro každý z použitých atributů. Spojnice pro shluk aktuálně nastavený v seznamu výše je zvýrazněna.
Dílčí záložka DATA
zobrazuje analyzovanou datovou matici se sloupci odpovídajícími atributům aktuálně použitým v této variantě shlukování. Pro každý řádek matice je uveden shluk, do kterého byl daný objekt přiřazen a vzdálenost tohoto objektu od středu shluku. Je-li součástí zadání úlohy i atribut s expertním přiřazením objektů do tříd, je na této dílčí záložce i porovnání hodnoty tohoto atributu pro daný objekt s nejčetnější hodnotou ve shluku, do které byl objekt přiřazen. Červeně jsou pak zvýrazněny řádky, pro které se hodnota ze zadaného sloupci liší od hodnoty vyplývající z přiřazení do shluku.
Na dílčí záložce XY PLOT
je bodový graf, jehož jednotlivé body reprezentují objekty v analyzovaných datech. Pomocí analýzy hlavních komponent byl redukován více-rozměrný vektor na dvourozměrný. Po přepnutí na dílčí záložku jsou jednotlivé body obarveny podle příslušnosti objektu do shluku. Najetím myší na bod se ukáže textová informace s hodnotami hlavních komponent a zejména s číslem shluku, do kterého objekt patří.
V případě, že součástí zadání je atribut s expertním přiřazením objektů do tříd, můžeme barevné označení bodů volbou Colorize by
pod grafem změnit na jednu ze dvou dalších možností – body mohou být obarveny buď podle expertního přiřazení objektů do tříd (volba Target class
), nebo podle „chyby“ přiřazení ve shluku – červeně jsou zvýrazněné objekty, jejichž přiřazení se liší mezi nalezeným řešením a expertním přiřazením do tříd (volba Assignment error
).
Poslední dílčí záložka FREQUENCIES
zobrazuje četnosti objektů v jednotlivých shlucích. Vidíme jak histogram, tak i barevnou tabulku s odstínem červené od tmavého po světlý směrem k rostoucí četnosti objektů ve shluku. Pomocí volby Values
můžeme způsob zobrazení četností změnit na relativní – buď k součtu četností (volba Rel sum
), nebo ke s maximální četností (volba Rel max
).
Související témata: