Začínáme
Systém LISp-Miner a proces DZD
Analytické procedury
Pokročilé funkce
Výzkum a vývoj
Začínáme
Systém LISp-Miner a proces DZD
Analytické procedury
Pokročilé funkce
Výzkum a vývoj
Podobně jako u cedentů, zadáváme i atributy pro shlukování jako hierarchii zadání seznamu atributů – zadání dílčích skupin atributů – zadání atributů.
Základní přehled atributů, které se mohou použít při shlukování, je na záložce Task Settings vlevo.
V seznamu ATTRIBUTES FOR CLUSTERING
uvádíme všechny atributy, jejichž hodnoty mohou určovat rozdělení objektů do shluků. Z uvedeného seznamu atributů budou postupně vybírány všechny možné podmnožiny atributů v rámci zadaného minimálního a maximálního počtu.
Pro každé zadání je uveden seznam do něj patřících zadání dílčích skupin atributů a do nich patřících zadání atributů. Na řádku dílčí skupiny je uvedena požadovaná minimální a maximální délka. Na řádku zadání atributu je uvedena váha, kterou se bude podílet na shlukování, a způsob výpočtu středu buď jako průměr (z indexů kategorií), nebo jako modus (index nejčetnější kategorie).
Je-li zároveň generována podmínka, tak se při výběru atributů ze seznamu nepoužije žádný z atributů obsažených v aktuálně vygenerované podmínce.
Při vytváření seznamu atributů můžeme také používat rozdělení atributů do dílčích skupin, zejména z důvodů zvýšení přehlednosti zadání. Rozdělení do skupin bude mít však vliv i na výpočet úlohy, a to v souvislosti se zadaným minimálním a maximálním počtem atributů v každé skupině, jejichž přítomnost bude požadována.
Bude-li v zadání jedna dílčí skupina atributů obsahující čtyři atributy a u této skupiny bude zadané omezení počtu od 2 do 4, tak budou postupně řešeny úlohy shlukové analýzy pro všechny možné dvojice atributů z této skupiny (těch je šest), pro všechny možné trojice (ty jsou tři) a konečně i všechny možné čtveřice (ta je pouze jedna), celkem tedy deset různých úloh shlukování. Tento počet se však může dále násobit, pokud je zadáno i nějaké rozpětí pro cílový počet shluků.
Tímto způsobem můžeme řešit problém s výběrem nejvhodnější podmnožiny atributů pro shlukování – necháme MCluster-Miner vyřešit úlohu pro všechny možné kombinace atributů a z nalezených výsledků na záložce Task Results vybereme ten nejlepší.
Na druhou stranu je třeba mít na paměti kombinatorickou náročnost výběru všech možných kombinací atributů dané délky – viz také Tipy a doporučení pro MCluster-Miner.
Pod seznamem je pak informace o rozpětí počtu atributů v automaticky generovaných variantách shlukování vyplývajících z aktuální podoby zadání. Délka je uváděna ve formátu minimální–maximální.
Buď pravým tlačítkem myši, nebo systémovou klávesou pro kontextové menu ≡
vyvoláme kontextové menu pro právě nastavenou položku v seznamu.
Je-li právě vybraná položka dílčí skupinou atributů, je v nabídce možnost přidání další dílčí skupiny, přidání dalšího zadání atributu do této dílčí skupiny a možnost vymazání dílčí skupiny.
Je-li právě vybraná položka zadání atributu, je v nabídce možnost zobrazení záložky s detailem atributu a možnost vymazání zadání atributu.
Pro změnu parametrů zadání seznamu atributů a pro editaci do něj patřících zadání dílčích skupin slouží dialogové okno, jehož ukázku vidíme na obrázku:
Dialogové okno vyvoláme pomocí tlačítka ATTRIBUTES FOR CLUSTERING
nad seznamem atributů na záložce Task Settings.
Pozor! V případě, že v zadání je pouze jedna dílčí skupina atributů, objeví se po stisku tlačítka rovnou dialogové okno pro zadání dílčí skupiny atributů. V tom případě musíme pro zobrazení dialogového okna pro zadání seznamu atributů stisknout tlačítko Partial groups list
v pravém dolním rohu dialogového okna.
Hlavní část dialogového okna zabírá seznam do něj patřících zadání dílčích skupin atributů a tlačítka pro jeho úpravy. Výběrem položky v seznamu otevřeme dialogové okno pro úpravu zadání dílčí skupiny atributů.
Add
… přidání nového zadání dílčích skupiny atributů;Del
… odstranění právě vybraného zadání. Vybrat a odstranit lze i více zadání dílčích cedentů najednou. Up
a Down
… změna pořadí zadání dílčích skupin. To má vliv jak na pořadí generování variant při výpočtu úlohy, ale zejména na lexikografické řazení nalezených vztahů ve výsledcích úlohy.Kopírování zadání dílčích skupin:
Copy
… všechna právě označená zadání dílčích skupin atributů zkopíruje do interní schránky modulu LM Workspace;Paste
… je následně vloží do zadání (obvykle jiného) cedentu. Tím si můžeme výrazně ušetřit práci, pokud chceme v některé úloze zadat množinu relevantních cedentů, která je podobná zadání z jiné úlohy.
Místo tlačítek Copy
a Paste
můžeme použít tlačítko Import
. Po jeho stisknutí se objeví seznam všech již dříve vytvořených zadání dílčích cedentů ze všech již dříve vytvořených úloh. Z něj si můžeme vybrat jednu nebo i více položek a vložit je do seznamu v aktuálně editovaném zadání seznamu atributů.
Související témata:
Zadání dílčí skupiny atributů
Zadání úlohy pro MCluster-Miner
Kontrola zadání úlohy