Začínáme
Systém LISp-Miner a proces DZD
Analytické procedury
Pokročilé funkce
Výzkum a vývoj
Začínáme
Systém LISp-Miner a proces DZD
Analytické procedury
Pokročilé funkce
Výzkum a vývoj
Umožňují zadat požadavky na součty, průměry, minima a maxima četností kategorií v histogramu nebo v jeho části.
Na výběr jsou čtyři základní výpočty – součet četností, průměr četností, minimální četnost a maximální četnost. Speciálním typem míry zajímavosti je jedna z hodnot (agregační operátor SOME
/ANY
).
Pro změnu parametrů zadání jednoduchého frekvenčního kvantifikátoru slouží dialogové okno, jehož ukázku vidíme na obrázku:
Dialogové okno vyvoláme pomocí tlačítka Detail
v dialogovém okně pro zadávání CF-kvantifikátorů.
Nejprve je nutné vybrat vhodnou míru zajímavosti v rozbalovací nabídce Interest measure type
v levém horním rohu. Pod rozbalovací nabídkou se zobrazuje krátké vysvětlení právě zvolené míry zajímavosti. Počítat se může buď z absolutních četností v histogramu, nebo z hodnot relativních. Způsob volíme v rozbalovací nabídce Source frequencies
.
Následně volíme rozpětí kategorií (Category range
), ze kterého se má míra zajímavosti spočítat. Obvykle ponecháme nastavený celý histogram (rozpětí od 0 do 100 %), ale někdy může být vhodné počítat například součet nebo minimální hodnotu pouze z první půlky histogramu. Nebo můžeme chtít kritérium nastavit podle četnosti jedné konkrétní kategorie – potom je vhodnější přepnout na Absolute category index
a danou kategorii zadat pomocí jejího pořadového čísla v seznamu kategorií atributu.
A konečně zadáváme operátor porovnání a prahovou hodnotu v pravé části dialogového okna. Prahová hodnota může být zadána buď v absolutní hodnotě, nebo relativně – buď vzhledem k počtu záznamů v datové matici; vzhledem k součtu četností v aktuálně testovaném histogramu; nebo ku kategorii s nejvyšší četností v aktuálně testovaném histogramu.
Na obrázku výše je vybrána jako míra zajímavosti maximální hodnota počítaná z absolutních hodnot četností kategorií v celém histogramu. Požadujeme, aby takto vypočtená maximální hodnota byla větší než (nebo rovna) zadané prahové hodnotě ve výši 50 % součtu četností v aktuálně testovaném histogramu.
Související témata:
Zadání kvantifikátorů
Zadání úlohy pro CF-Miner
Kontrola zadání úlohy