Začínáme
Systém LISp-Miner a proces DZD
Analytické procedury
Pokročilé funkce
Výzkum a vývoj
Začínáme
Systém LISp-Miner a proces DZD
Analytické procedury
Pokročilé funkce
Výzkum a vývoj
Jedná se o speciální typ kvantifikátoru pro uživatelsky srozumitelnější zadání požadavku na šikmost rozdělení četností.
Na výběr jsou dvě možnosti – schody nahoru (četnosti v histogramu monotonně rostou) a schody dolů (četnosti v histogramu monotonně klesají).
Pro změnu parametrů zadání distribučního kvantifikátoru slouží dialogové okno, jehož ukázku vidíme na obrázku:
Dialogové okno vyvoláme pomocí tlačítka Detail
v dialogovém okně pro zadávání CF-kvantifikátorů.
Nejprve je nutné vybrat vhodnou míru zajímavosti v rozbalovací nabídce Interest measure type
v levém horním rohu. Pod rozbalovací nabídkou se zobrazuje krátké vysvětlení právě zvolené míry zajímavosti. Počítat se může buď z absolutních četností v histogramu, nebo z hodnot relativních. Způsob volíme v rozbalovací nabídce Source frequencies
.
Následně volíme rozpětí kategorií (Category range
), ze kterého se má míra zajímavosti spočítat. Obvykle ponecháme nastavený celý histogram (rozpětí od 0 do 100 %), ale někdy může být vhodné počítat schody pouze např. na levé části histogramu. Pomocí dvou zadání kvantifikátorů typu schody je pak možné například požadovat, aby v levé části histogramu byly schody nahoru a naopak v pravé části schody dolů.
Rozpětí kategorií můžeme nastavit i jako absolutní indexy kategorií. V tom případě přepneme na volbu Absolute category index
a rozpětí kategorií zadáváme pomocí jejich pořadového čísla v seznamu kategorií atributu.
Dále zadáváme operátor porovnání a požadovaný počet schodů v pravé části dialogového okna. Počet schodů může být zadán buď v absolutní hodnotě, nebo relativně – buď vzhledem k celkovému počtu kategorií atributu, nebo k počtu kategorií v aktuálně vybraném rozpětí.
Obvykle také požudujeme, aby schody tvořily souvislou řadu, nepřerušenou náhlým propadem dolů (u schodů nahoru), nebo naopak skokem nahoru (u schodů dolů). Proto volbu Consecutive steps
necháváme zaškrtlou.
Konečně je třeba určit, jak velká musí být změna v četnosti dvou sousedních kategorií, abychom ji mohli považovat za „schod“. Minimální velikost schodu je opět možné definovat buď v absolutní hodnotě, nebo relativně.
Na obrázku výše je zadán požadavek na existenci souvislé monotonní řady rostoucích četností v histogramu o délce 80 % z celkového počtu kategorií (který je v tomto případě roven celkovému počtu kategorií v atributu). Požadovaná minimální velikost schodu je 1 (stačí tedy změna četnosti o pouhý jeden záznam)
Související témata:
Zadání kvantifikátorů
Zadání úlohy pro CF-Miner
Kontrola zadání úlohy