Uživatelské nástroje

Nástroje pro tento web


mmc:hypothesis

Detail varianty shlukování

Záložka obsahuje detailní popis nalezené varianty shlukování. Vyvoláme ji stiskem tlačítka Detail nebo dvojitým kliknutím myší na řádek v seznamu variant shlukování na záložce s výsledky úlohy pro MCluster-Miner.

V záhlaví záložky je zjednodušený popis atributů vyskytujících se ve stromu (ne vždy se vejde celý) a případně i aktuální tvar podmínky. Dále je možné přepínat mezi pěti dílčími záložkami:

Dílčí záložka TEXT

Dílčí záložka obsahuje seznam atributů použitých v této variantě shlukování a použitý typ algoritmu a míry podobnosti. Následuje tabulka s popisem nalezených shluků, ve které je kromě počtu objektů patřících do daného shluku uveden i vypočtený střed shluku. U každého shluku je dále průměrná, minimální a maximální vnitroshluková vzdálenost. Následují různé další charakteristiky této varianty shlukování.

Dílčí záložka CENTROIDS

Ukázku dílčí záložky CENTROIDS vidíme na obrázku výše. Na dílčí záložce nalezneme seznam nalezených shluků, četnosti objektů v nich a popis shluku pomocí jeho středu – pro každý z použitých atributů pro shlukování je uvedena průměrná hodnota ve shluku (pro atributy s numerickými hodnotami) nebo hodnota nejtypičtější (pro atributy s nominálními hodnotami).

Je-li povolen výpočet středu jako desetinné číslo, může být hodnota středu uváděna ve tvaru První kategorie – Druhá kategorie a s uvedením procentní podílu obou kategorií. Například hodnota ‹0;5› {25 % : 75 %} (5;10› znamená, že střed je někde mezi 2,5 (střed intervalu první kategorie) a 7,5 (střed intervalu druhé kategorie) a že je ze 75 % vychýlen směrem k druhé kategorii. To znamená, že přesná hodnota středu je 6,125. V případě 50 % – 50 % by střed byl 5,00.

V grafu pod seznamem jsou pak jednotlivé shluky zobrazeny graficky jako spojnice centrů pro každý z použitých atributů. Spojnice pro shluk aktuálně nastavený v seznamu výše je zvýrazněna.

Dílčí záložka DATA

Dílčí záložka DATA zobrazuje analyzovanou datovou matici se sloupci odpovídajícími atributům aktuálně použitým v této variantě shlukování. Pro každý řádek matice je uveden shluk, do kterého byl daný objekt přiřazen a vzdálenost tohoto objektu od středu shluku. Je-li součástí zadání úlohy i atribut s expertním přiřazením objektů do tříd, je na této dílčí záložce i porovnání hodnoty tohoto atributu pro daný objekt s nejčetnější hodnotou ve shluku, do které byl objekt přiřazen. Červeně jsou pak zvýrazněny řádky, pro které se hodnota ze zadaného sloupci liší od hodnoty vyplývající z přiřazení do shluku.

Dílčí záložka XY PLOT

Na dílčí záložce XY PLOT je bodový graf, jehož jednotlivé body reprezentují objekty v analyzovaných datech. Pomocí analýzy hlavních komponent byl redukován více-rozměrný vektor na dvourozměrný. Po přepnutí na dílčí záložku jsou jednotlivé body obarveny podle příslušnosti objektu do shluku. Najetím myší na bod se ukáže textová informace s hodnotami hlavních komponent a zejména s číslem shluku, do kterého objekt patří.

Obarvení bodů v grafu

V případě, že součástí zadání je atribut s expertním přiřazením objektů do tříd, můžeme barevné označení bodů volbou Colorize by pod grafem změnit na jednu ze dvou dalších možností – body mohou být obarveny buď podle expertního přiřazení objektů do tříd (volba Target class), nebo podle „chyby“ přiřazení ve shluku – červeně jsou zvýrazněné objekty, jejichž přiřazení se liší mezi nalezeným řešením a expertním přiřazením do tříd (volba Assignment error).

Dílčí záložka FREQUENCIES

Poslední dílčí záložka FREQUENCIES zobrazuje četnosti objektů v jednotlivých shlucích. Vidíme jak histogram, tak i barevnou tabulku s odstínem červené od tmavého po světlý směrem k rostoucí četnosti objektů ve shluku. Pomocí volby Values můžeme způsob zobrazení četností změnit na relativní – buď k součtu četností (volba Rel sum), nebo ke s maximální četností (volba Rel max).


Související témata:

Prohlížení výsledků úlohy pro MCluster-Miner
MCluster-Miner

mmc/hypothesis.txt · Poslední úprava: 2016/11/29 16:56 (upraveno mimo DokuWiki)