Uživatelské nástroje

Nástroje pro tento web


mmc:settings:mccedent

Seznam atributů pro shlukování

Podobně jako u cedentů, zadáváme i atributy pro shlukování jako hierarchii zadání seznamu atributůzadání dílčích skupin atributůzadání atributů.

Seznam na záložce Task Settings

Základní přehled atributů, které se mohou použít při shlukování, je na záložce Task Settings vlevo.

V seznamu ATTRIBUTES FOR CLUSTERING uvádíme všechny atributy, jejichž hodnoty mohou určovat rozdělení objektů do shluků. Z uvedeného seznamu atributů budou postupně vybírány všechny možné podmnožiny atributů v rámci zadaného minimálního a maximálního počtu.

Pro každé zadání je uveden seznam do něj patřících zadání dílčích skupin atributů a do nich patřících zadání atributů. Na řádku dílčí skupiny je uvedena požadovaná minimální a maximální délka. Na řádku zadání atributu je uvedena váha, kterou se bude podílet na shlukování, a způsob výpočtu středu buď jako průměr (z indexů kategorií), nebo jako modus (index nejčetnější kategorie).

Je-li zároveň generována podmínka, tak se při výběru atributů ze seznamu nepoužije žádný z atributů obsažených v aktuálně vygenerované podmínce.

Dílčí skupiny atributů

Při vytváření seznamu atributů můžeme také používat rozdělení atributů do dílčích skupin, zejména z důvodů zvýšení přehlednosti zadání. Rozdělení do skupin bude mít však vliv i na výpočet úlohy, a to v souvislosti se zadaným minimálním a maximálním počtem atributů v každé skupině, jejichž přítomnost bude požadována.

Bude-li v zadání jedna dílčí skupina atributů obsahující čtyři atributy a u této skupiny bude zadané omezení počtu od 2 do 4, tak budou postupně řešeny úlohy shlukové analýzy pro všechny možné dvojice atributů z této skupiny (těch je šest), pro všechny možné trojice (ty jsou tři) a konečně i všechny možné čtveřice (ta je pouze jedna), celkem tedy deset různých úloh shlukování. Tento počet se však může dále násobit, pokud je zadáno i nějaké rozpětí pro cílový počet shluků.

Tímto způsobem můžeme řešit problém s výběrem nejvhodnější podmnožiny atributů pro shlukování – necháme MCluster-Miner vyřešit úlohu pro všechny možné kombinace atributů a z nalezených výsledků na záložce Task Results vybereme ten nejlepší.

Na druhou stranu je třeba mít na paměti kombinatorickou náročnost výběru všech možných kombinací atributů dané délky – viz také Tipy a doporučení pro MCluster-Miner.

Informace o minimální a maximální délce

Pod seznamem je pak informace o rozpětí počtu atributů v automaticky generovaných variantách shlukování vyplývajících z aktuální podoby zadání. Délka je uváděna ve formátu minimální–maximální.

Kontextové menu

Buď pravým tlačítkem myši, nebo systémovou klávesou pro kontextové menu vyvoláme kontextové menu pro právě nastavenou položku v seznamu.

Je-li právě vybraná položka dílčí skupinou atributů, je v nabídce možnost přidání další dílčí skupiny, přidání dalšího zadání atributu do této dílčí skupiny a možnost vymazání dílčí skupiny.

Je-li právě vybraná položka zadání atributu, je v nabídce možnost zobrazení záložky s detailem atributu a možnost vymazání zadání atributu.

Dialogové okno pro zadání seznamu atributů

Pro změnu parametrů zadání seznamu atributů a pro editaci do něj patřících zadání dílčích skupin slouží dialogové okno, jehož ukázku vidíme na obrázku:

Dialogové okno vyvoláme pomocí tlačítka ATTRIBUTES FOR CLUSTERING nad seznamem atributů na záložce Task Settings.

Pozor! V případě, že v zadání je pouze jedna dílčí skupina atributů, objeví se po stisku tlačítka rovnou dialogové okno pro zadání dílčí skupiny atributů. V tom případě musíme pro zobrazení dialogového okna pro zadání seznamu atributů stisknout tlačítko Partial groups list v pravém dolním rohu dialogového okna.

Seznam zadání dílčích skupin atributů

Hlavní část dialogového okna zabírá seznam do něj patřících zadání dílčích skupin atributů a tlačítka pro jeho úpravy. Výběrem položky v seznamu otevřeme dialogové okno pro úpravu zadání dílčí skupiny atributů.

Tlačítka pod seznamem

  • Add … přidání nového zadání dílčích skupiny atributů;
  • Del … odstranění právě vybraného zadání. Vybrat a odstranit lze i více zadání dílčích cedentů najednou.
  • Up a Down … změna pořadí zadání dílčích skupin. To má vliv jak na pořadí generování variant při výpočtu úlohy, ale zejména na lexikografické řazení nalezených vztahů ve výsledcích úlohy.

Kopírování zadání dílčích skupin:

  • Copy … všechna právě označená zadání dílčích skupin atributů zkopíruje do interní schránky modulu LM Workspace;
  • Paste … je následně vloží do zadání (obvykle jiného) cedentu. Tím si můžeme výrazně ušetřit práci, pokud chceme v některé úloze zadat množinu relevantních cedentů, která je podobná zadání z jiné úlohy.

Místo tlačítek Copy a Paste můžeme použít tlačítko Import. Po jeho stisknutí se objeví seznam všech již dříve vytvořených zadání dílčích cedentů ze všech již dříve vytvořených úloh. Z něj si můžeme vybrat jednu nebo i více položek a vložit je do seznamu v aktuálně editovaném zadání seznamu atributů.


Související témata:

Zadání dílčí skupiny atributů
Zadání úlohy pro MCluster-Miner
Kontrola zadání úlohy

mmc/settings/mccedent.txt · Poslední úprava: 2015/09/05 12:28 (upraveno mimo DokuWiki)