Začínáme
Systém LISp-Miner a proces DZD
Analytické procedury
Pokročilé funkce
Výzkum a vývoj
Začínáme
Systém LISp-Miner a proces DZD
Analytické procedury
Pokročilé funkce
Výzkum a vývoj
Záložka s detaily zadání úlohy obsahuje jak ovládací prvky specifické pro proceduru MCluster-Miner, tak ovládací prvky společné pro všechny typy úloh.
Ukázku záložky vidíme na obrázku. Záložka obsahuje tyto ovládací prvky:
ATTRIBUTES FOR CLUSTERING
… seznam atributů pro shlukování;CRITERIONS
… kritéria pro algoritmus shlukování;TARGET SETTINGS
… volba cílového počtu shluků;CONDITION
… volitelné omezení analýzy pouze na podmnožinu záznamů pomocí zadání generovaných variant podmínky.
V seznamu ATTRIBUTES FOR CLUSTERING
uvádíme všechny atributy, jejichž hodnoty mohou určovat rozdělení objektů do shluků. Z uvedeného seznamu atributů budou postupně vybírány všechny možné kombinace atributů v rámci zadaného minimálního a maximálního počtu.
Více viz: Seznam atributů pro shlukování
Parametry v rámečku CRITERIONS
ovlivňují způsob shlukování a upravují chování zvoleného algoritmu.
Více viz: Kritéria pro shlukování
Požadovaný počet shluků, které se má MCluster-Miner pokusit vytvořit, můžeme zadat jako jedno číslo nebo jako interval. Jedno číslo se zadává zadáním stejné hodnoty pro minimum i pro maximum.
Více viz: Cílový počet shluků a cílová třída
Jako u všech ostatních typů analytických procedur, můžeme omezit analýzu pouze na podmnožinu záznamů. Zadání generovaných variant podmínek pro podmnožiny záznamů datové matice vidíme v seznamu v pravém dolním rohu záložky. Při zadávání variant podmínek můžeme využít všechny možnosti zadávání množiny relevantních cedentů.
V případě MCluster-Miner bude patrně nejčastější použití podmínky vymezení přesné podmnožiny záznamů, na které se má shluková analýza provést – např. pouze pro muže, pouze za rok 2015 atp. V tom případě použijeme zadání pevných délek dílčích cedentů a při zadávání literálů koeficienty typu One category.
Kromě obecného parametru omezujícího celkový počet generovaných hypotéz (v tomto případě variant shlukování), je součástí parametrů MCluster-Miner úlohy i omezení celkového počtu vytvořených shluků.
Parametr RandSeed Init number
souvisí se způsobem implementace algoritmu k-Means a nutnosti použít generátor pseudonáhodných čísel – viz výpočet úlohy. Běžný uživatel jej patrně nebude muset měnit.
Související témata:
Kontrola zadání úlohy
Výpočet úlohy
Prohlížení výsledků
MCluster-Miner