Uživatelské nástroje

Nástroje pro tento web


lmdemo:rmhotel:evolution:01frekvence:columns

Demo ReversMiner: 01 Frekvence hodnot: Charakteristiky sloupců

Na záložce COLUMNS byly přidány charakteristiky pro všechny sloupce, které mají být ve vygenerovaných datech nebo které jsou potřeba pro výpočet fitness jedince na základě zadaných požadavků.

HVek

Celá čísla s hodnotami od 18 do 82 v uniformním rozdělením.

Sloupec je součástí exportované tabulky s výsledky.

Přidány frequency guiding rules na základě specifikací pro tento sloupec.

HPohlavi

Dvě textové hodnoty s přednastavenými frekvencemi. Hodnoty převzaty z pseudotabulky.

Sloupec je součástí exportované tabulky s výsledky.

Přidány frequency guiding rules na základě specifikací pro tento sloupec.

HMesto

Výčet 28 textových hodnot s přednastavenými frekvencemi. Hodnoty převzat z pseudotabulky. Frekvence měst jsou nastaveny ručně a vychází z rozvrženého podílů států.

Sloupec je součástí exportované tabulky s výsledky.

Přidány frequency guiding rules na základě specifikací pro tento sloupec.

HStat

Výčet pěti textových hodnot. Frekvencemi není třeba nastavovat, protože stát je odvozený z města bydliště hosta. Typ přiřazení hodnot ve sloupci je tedy Continuously updated from a mathematical formula. Hodnota ve sloupci je tedy vypočtena při každé změny města. Výpočet spočívá ve vyhledání správného státu v tabulce Bydliste ve sloupci Stat. Hodnota se převezme z toho řádku, kde Hotel.HMesto = Bydliste.Mesto.

Sloupec je součástí exportované tabulky s výsledky.

Pro tento sloupec není třeba přidávat frequency guiding rules, protože frekvence států vyplývají z měst.

HMesto_X, HMesto_Y

Desetinná čísla odvozená z města bydliště hosta. Stejně jako u sloupce HStat je hodnota souřadnice vyhledána v tabulce Bydliste na řádku, kde Hotel.HMesto = Bydliste.Mesto.

Sloupec je součástí exportované tabulky s výsledky.

PTypPobytu

Dvě textové hodnoty s přednastavenými frekvencemi. Hodnoty převzaty z pseudotabulky.

Sloupec je součástí exportované tabulky s výsledky.

Přidány frequency guiding rules na základě specifikací pro tento atribut.

PPobytOd

Hodnoty typu datum z přednastaveého období od 1. 1. 2012 do 31. 12. 2013 v uniformním rozdělením.

Sloupec je součástí exportované tabulky s výsledky.

Přidány frequency guiding rules na základě specifikací pro tento sloupec. Použit byl atribut PMesic.

PNoci

Celočíselné hodnoty z rozpětí 1 až 28, kde pro vybrané hodnoty jsou přednastaveny frekvence. Základní hodnoty převzaty z pseudotabulky. Zbývajících 8 % hodnot je nastaveno náhodně v daném rozpětí 3 až 27.

Sloupec je součástí exportované tabulky s výsledky.

Přidány frequency guiding rules na základě specifikací pro tento sloupec. Použit byl atribut PNoci_exp.

POsob

Celočíselné hodnoty z rozpětí 1 až 4 s přednastavenými frekvencemi. Hodnoty převzaty z pseudotabulky.

Sloupec je součástí exportované tabulky s výsledky.

Přidány frequency guiding rules na základě specifikací pro tento sloupec.

PPresSobotniNoc

Odvozený booleovský sloupec, který použijeme v úlohách DZD, viz výpočet ceny v doménových znalostech.

Hodnoty jsou kontinuálně počítány na základě vztahu (PPobytOd.DayOfWeek % 7+ PNoci) > 6.

Sloupec není součástí exportované tabulky s výsledky.

PSezona

Odvozený booleovský sloupec, který použijeme v úlohách DZD, viz prahové hodnoty v doménových znalostech.

Hodnoty jsou kontinuálně počítány na základě vztahu:

((PPobytOd.Month > 5) & (PPobytOd.Month < 9)) | ((PPobytOd.Month < 3) | (PPobytOd.Month = 12)).

Sloupec není součástí exportované tabulky s výsledky.

PTurnus

Odvozený booleovský sloupec, který použijeme v úlohách DZD, viz prahové hodnoty v doménových znalostech.

Hodnoty jsou kontinuálně počítány na základě vztahu:

(PPobytOd.DayOfWeek = 6) & (PNoci % 7 = 0).

Sloupec není součástí exportované tabulky s výsledky.

DHodnoceni

Tři textové hodnoty s přednastavenými frekvencemi. Hodnoty převzaty z pseudotabulky.

Sloupec je součástí exportované tabulky s výsledky.

Přidány frequency guiding rules na základě specifikací pro tento sloupec.

DUbytovani, DStrava, DPersonal, DZabava

Odvozené číselné sloupce. Hodnoty jsou kontinuálně počítány s využitím pomocné tabulky Dotaznik. Z pomocné tabulky se vybere hodnota z odpovídajícího sloupce a řádku podle hodnoty ve sloupcích DHodnoceni a PPobytOd.Year. Od takto získané hodnoty se odečte náhodné číslo v rozmezí 0 až 19.

Výraz 10*(DHodnoceni-1)+5*(PPobytOd.Year-2012)+ 1+ lm.rowrnd(4) umožňuje zadat do tabulky Dotaznik pro každou kombinaci DHodnoceni a PPobytOd.Year čtyři možné hodnoty dílčího hodnocení. Která ze čtyř hodnot se vybere, záleží na náhodné složce lm.rowrnd(4). Tím je definován model vztahu mezi celkovým a dílčími hodnoceními s dostatečnou variabilitou.

Výraz @lookup- lm.rowrnd(19) odečte od hodnoty vyhledané v tabulce Dotaznik náhodné číslo od 0 do 19. Tabulka je připravena tak, že hodnoty dílčích hodnocení jsou zaokrouhleny na celé 20. Tento výraz tak do dat přidá „šum“, aniž by narušil model.

Sloupce jsou součástí exportované tabulky s výsledky.

MTeplota

Desetinné číslo vyhledané v tabulce Meteo podle dne začátku pobytu (z řádku, kde Hotel.PPobytOd = Meteo.MDatum.

Sloupec je součástí exportované tabulky s výsledky.

MObloha

Výčet tří textových hodnot. Hodnota vyhledaná v tabulce Meteo podle dne začátku pobytu (z řádku, kde Hotel.PPobytOd = Meteo.MDatum.

Sloupec je součástí exportované tabulky s výsledky.

SEUR

Desetinné číslo vyhledané v tabulce Smenarna podle dne začátku pobytu (z řádku, kde Hotel.PPobytOd = Smenarna.SDatum.

Sloupec je součástí exportované tabulky s výsledky.

PCenaUbytovani

Desetinné číslo vypočtené jako ceníková_cena × POsob × PNoci, viz výpočet ceny v doménových znalostech.

Ceníková cena je vyhledána v tabulce Cenik podle roku začátku pobytu (z řádku, kde Hotel.PPobytOd.Year = Cenik.Rok.

Sloupec je součástí exportované tabulky s výsledky.

PCenaStrava

Desetinné číslo vypočtené z ceníkové ceny, počtu osob a počtu nocí a zohledňující sezónu, viz výpočet ceny v doménových znalostech.

Ceníková cena je vyhledána v tabulce Cenik podle roku začátku pobytu (z řádku, kde Hotel.PPobytOd.Year = Cenik.Rok.

Výraz @lookup* PNoci* POsob* (PSezona* lm.rowrnd() > 0.3) vynásobí vyhledanou ceníkovou cenu počtem nocí a počtem osob a hodnotou závorky. Závorka nabývá buď hodnoty 0 (není sezóna, nebo náhodné číslo bylo 0,3 či méně), nebo 1 (je sezóna a zároveň náhodné číslo je vyšší než 0,3). Stravu budou mít tedy zaúčtovanou pouze hosté v sezóně a jen 70 % z nich.

Sloupec je součástí exportované tabulky s výsledky.

PCenaSleva

Desetinné číslo vypočtené výrazem 200* ((PPobytOd.DayOfWeek+ PNoci) > 6)+ 400* (PTurnus & (PSezona = 0))* (PNoci / 7), viz výpočet ceny v doménových znalostech.

Sloupec je součástí exportované tabulky s výsledky.

PCenaCelkem

Desetinné číslo vypočtené výrazem PCenaUbytovani+PCenaStrava-PCenaSleva, viz výpočet ceny v doménových znalostech.

Sloupec je součástí exportované tabulky s výsledky.

lmdemo/rmhotel/evolution/01frekvence/columns.txt · Poslední úprava: 2015/10/10 14:25 (upraveno mimo DokuWiki)