Začínáme
Systém LISp-Miner a proces DZD
Analytické procedury
Pokročilé funkce
Výzkum a vývoj
Začínáme
Systém LISp-Miner a proces DZD
Analytické procedury
Pokročilé funkce
Výzkum a vývoj
V rámci skupiny Pobyt nejprve vytvoříme jednoduché atributy POsob (počet osob) a PTypPobytu (typ pobytu). Použijeme automatické vytváření kategorií a volbu Each value – one category
. Podobně přidáme binární atributy pro odvozené sloupce PTurnus a PPresSobotniNoc.
Práci si můžeme ušetřit tím, že po stisku tlačítka Add attribute
vybereme v seznamu sloupců najednou všechny odpovídající sloupce (pomocí klávesy Ctrl
) a stiskneme tlačítko Create Attribute
. Další postup už známe, pouze potvrdíme, že jednou zadané vytváření kategorií jako výčet platí pro všechny atributy.
Ve sloupci PNoci (počet nocí) je celkem 28 různých hodnot. To je patrně příliš mnoho pro vytvoření kategorií pro každou z nich. Zároveň si vzpomeneme na doménové znalosti, ve kterých se zmiňují turnusové a víkendové pobyty a služební cesty na jednu noc, či naopak na 28 nocí.
Proto vytvoříme nejprve atribut PNoci_exp s kategoriemi 1 (jednodenní pobyty), 2 (dvoudenní, obvykle víkendové), 7-14-21 (turnusové), 28 (dlouhodobé služební) a se speciální kategorií „ostatní“ obsahující zbylé možné hodnoty ve sloupci PNoci.
Asi nejsnazší je vytvořit kategorie automaticky volbou Each value – one category
a následně pomocí tlačítka Join
kategorie pospojovat. Kategorii ostatní posuneme na poslední místo.
Alternativně můžeme vytvořit kategorie ručně.
Poznámka: Pozorný čtenář si všiml, že ve výčtu hodnot počtu nocí nejsou úplně všechny hodnoty z intervalu 1 až 28. Kdybychom chtěli předzpracování dat používat i při opakovaných analýzách, mohlo by se stát, že by se nově objevil i jiný počet a ten by nebyl zahrnut do kategorie ostatní. V takovém případě by bylo vhodné přidat do ostatní i zbylé hodnoty (pomocí tlačítka New
v dialogovém okně pro zadání výčtu hodnot v kategorii).
Na závěr definice atributu se ještě musíme zamyslet nad pořadím kategorií. Je možné označit atribut za ordinální? Po vytvoření kategorie ostatní už nikoliv. Proto v základních parametrech atributu opravíme volbu NOC type
na nominální.
Dále vytvoříme atribut PNoci_enum_m s kategoriemi 1 (jednodenní pobyty), 2 (dvoudenní, obvykle víkendové), <3;6>, 7, <8;13>, 14, <15;20>, 21, <22;27> a 28. Smyslem tohoto atributu je zachovat pořadí v délkách pobytů (aby mohl být označen jako ordinální) a zároveň zajistit, že pokrývá celý interval možných délek pobytů od 1 do 28.
Opět použijeme funkci hromadného přidání kategorií – stiskneme tlačítko Batch add
(nebo vybereme položku menu Preprocessing/Batch add of categories
) a do editačního pole vypíšeme intervaly a jejich meze, jak je vidět na obrázku:
Alternativně by šlo vytvořit kategorie automaticky volbou Each value – one category
a následně pomocí tlačítka Join
kategorie pospojovat. Nakonec bychom použili hromadné přejmenování kategorií pro opravu názvu spojených kategorií.
V tomto případě však spojené kategorie zůstanou typu enumeration, a proto neprojde kontrola ověření obsahu metabáze pomocí šablony.
Nakonec přidáme ještě atribut pro námi vytvořený odvozený sloupec POsobonoci. Atribut nazveme POsobonoci_ef5 a bude mít pět kategorií vytvořených jako ekvifrekvenční intervaly.
Související témata:
Demo Hotel: Vytvoření atributů ve skupině Pobyt/Začátek
Demo Hotel: Vytvoření atributů a jejich kategorií
Atribut a jeho kategorie