Začínáme
Systém LISp-Miner a proces DZD
Analytické procedury
Pokročilé funkce
Výzkum a vývoj
Začínáme
Systém LISp-Miner a proces DZD
Analytické procedury
Pokročilé funkce
Výzkum a vývoj
Záložka obsahuje detailní popis nalezené varianty shlukování. Vyvoláme ji stiskem tlačítka Detail nebo dvojitým kliknutím myší na řádek v seznamu variant shlukování na záložce s výsledky úlohy pro MCluster-Miner.
V záhlaví záložky je zjednodušený popis atributů vyskytujících se ve stromu (ne vždy se vejde celý) a případně i aktuální tvar podmínky. Dále je možné přepínat mezi pěti dílčími záložkami:
TEXT … textový popis varianty shlukování, včetně různých charakteristikCENTROIDS … interaktivní seznam vytvořených shluků a jejich grafické reprezentace, otevře se standardně po otevření záložky s detailem varianty shlukováníDATA … náhled na datovou matici s atributy vystupujícími v této variantě shlukováníXY PLOT … grafická vizualizace dat pomocí analýzy hlavních komponentFREQUENCIES … grafické znázornění četností shluků.Dílčí záložka obsahuje seznam atributů použitých v této variantě shlukování a použitý typ algoritmu a míry podobnosti. Následuje tabulka s popisem nalezených shluků, ve které je kromě počtu objektů patřících do daného shluku uveden i vypočtený střed shluku. U každého shluku je dále průměrná, minimální a maximální vnitroshluková vzdálenost. Následují různé další charakteristiky této varianty shlukování.
Ukázku dílčí záložky CENTROIDS vidíme na obrázku výše. Na dílčí záložce nalezneme seznam nalezených shluků, četnosti objektů v nich a popis shluku pomocí jeho středu – pro každý z použitých atributů pro shlukování je uvedena průměrná hodnota ve shluku (pro atributy s numerickými hodnotami) nebo hodnota nejtypičtější (pro atributy s nominálními hodnotami).
Je-li povolen výpočet středu jako desetinné číslo, může být hodnota středu uváděna ve tvaru První kategorie – Druhá kategorie a s uvedením procentní podílu obou kategorií. Například hodnota ‹0;5› {25 % : 75 %} (5;10› znamená, že střed je někde mezi 2,5 (střed intervalu první kategorie) a 7,5 (střed intervalu druhé kategorie) a že je ze 75 % vychýlen směrem k druhé kategorii. To znamená, že přesná hodnota středu je 6,125. V případě 50 % – 50 % by střed byl 5,00.
V grafu pod seznamem jsou pak jednotlivé shluky zobrazeny graficky jako spojnice centrů pro každý z použitých atributů. Spojnice pro shluk aktuálně nastavený v seznamu výše je zvýrazněna.
Dílčí záložka DATA zobrazuje analyzovanou datovou matici se sloupci odpovídajícími atributům aktuálně použitým v této variantě shlukování. Pro každý řádek matice je uveden shluk, do kterého byl daný objekt přiřazen a vzdálenost tohoto objektu od středu shluku. Je-li součástí zadání úlohy i atribut s expertním přiřazením objektů do tříd, je na této dílčí záložce i porovnání hodnoty tohoto atributu pro daný objekt s nejčetnější hodnotou ve shluku, do které byl objekt přiřazen. Červeně jsou pak zvýrazněny řádky, pro které se hodnota ze zadaného sloupci liší od hodnoty vyplývající z přiřazení do shluku.
Na dílčí záložce XY PLOT je bodový graf, jehož jednotlivé body reprezentují objekty v analyzovaných datech. Pomocí analýzy hlavních komponent byl redukován více-rozměrný vektor na dvourozměrný. Po přepnutí na dílčí záložku jsou jednotlivé body obarveny podle příslušnosti objektu do shluku. Najetím myší na bod se ukáže textová informace s hodnotami hlavních komponent a zejména s číslem shluku, do kterého objekt patří.
V případě, že součástí zadání je atribut s expertním přiřazením objektů do tříd, můžeme barevné označení bodů volbou Colorize by pod grafem změnit na jednu ze dvou dalších možností – body mohou být obarveny buď podle expertního přiřazení objektů do tříd (volba Target class), nebo podle „chyby“ přiřazení ve shluku – červeně jsou zvýrazněné objekty, jejichž přiřazení se liší mezi nalezeným řešením a expertním přiřazením do tříd (volba Assignment error).
Poslední dílčí záložka FREQUENCIES zobrazuje četnosti objektů v jednotlivých shlucích. Vidíme jak histogram, tak i barevnou tabulku s odstínem červené od tmavého po světlý směrem k rostoucí četnosti objektů ve shluku. Pomocí volby Values můžeme způsob zobrazení četností změnit na relativní – buď k součtu četností (volba Rel sum), nebo ke s maximální četností (volba Rel max).
Související témata: