Uživatelské nástroje

Nástroje pro tento web


lmdemo:rmhotel:randomizer:start

Zvětšení a randomizace dat

Nyní máme variantu dat, která v sobě zahrnuje všechny požadavky, ale je svým rozsahem malá. Pomocí RM případů typu Randomizace zvětšíme.

Z původních například 200 řádků však uděláme 2000, 10000… snadno tak, že z každého řádku původní tabulky uděláme 10, 50… nových. To však ve zvětšených datech způsobí na první pohled viditelné artefakty, takže nebudou vypadat realisticky. Tomu zabráníme tak, že do zvětšených dat budeme přidávat „šum“ pomocí náhodných změn hodnot. Při každé změně budeme zároveň kontrolovat, že i potom budou data splňovat všechny na ně kladené požadavky.

Zvětšení počtu řádků

Počet řádků v generovaných datech zvýšíme vytvořením nového RM případu, u kterého nastavíme typ na Randomizer a cílový počet řádků (angl. Target data rows) na 2000.

Na záložce COLUMNS vložíme úplně všechny sloupce. Aby nedešlo k žádné změně hodnot, ale jen a pouze ke zvětšení počtu řádků, nastavíme u všech sloupců, že jsou hodnoty v nich zafixovány (volba Column is fixed).

Na záložce DM TASKS vložíme všechny požadavky v podobě úloh DZD, včetně frequency guiding rules. A na záložce DATA PRESETS jako Master DataPreset vložíme do seznamu RM případ s názvem 98 Evoluce.

Spustíme evoluci a hned po prvním kroku ji můžeme ukončit. Zkontrolujeme, že na záložce RESULTS vidíme data o 2000 řádcích.

Upozornění: V aktuální verzi generování dat Hotel byl tento krok přeskočen a zvětšení počtu řádků bylo realizováno společně s randomizací hodnot ve sloupcích HVek a HPohlavi popisované v následující sekci.

Randomizace sloupců HVek a HPohlavi

Hodnoty ve sloupcích HVek a HPohlavi nejsou zatím použity v žádné doménové znalosti, ani vztahu. Proto mohou být randomizovány zcela libovolně.

V RM případu s názvem 99 Randomizace 02.01b byly zafixovány všechny sloupce, kromě těchto dvou.

Po spuštění randomizace došlo k rychlé změně všech hodnot v obou sloupcích, takže bylo dosaženo přes 27 % rozdílu oproti počáteční podobě dat (po zvětšení z 200 na 2000 řádků).

Randomizace sloupce PPobytOd

RM případ s názvem 99 Randomizace 02.02 PPobytOd byl vytvořen klonem z 99 Randomizace 02.01b. Zafixovány byly všechny sloupce, kromě sloupce PPobytOd.

Na hodnotách ve sloupci PPobytOd závisí celá řada požadavků. Proto se při změnách hodnot v něm musí postupovat opatrně. Základní požadavky vyplývají z dne týdne. Proto je v evolučních parametrech RM případu povolen pouze typ mutace Modify a hodnota změny ve sloupci PPobytOd byla nastavena na 7. Během randomizace se tak mohou začátky pobytu měnit pouze o ±7 dní. Navíc byla ještě na záložce DM TASKS nastavena tolerance pro výsledky úloh DZD představujících požadavky na data.

Na záložce DATA PRESETS byla jako Master Data preset nastaven 99 Randomizace 02.01b.

Po spuštění randomizace dochází pomalu ke změnám hodnot dne začátku pobytu, protože je neustále kontrolována platnost všech požadavků kladených na data. Po 19 minutách bylo dosaženo změn ve výši 6.7 %. Pozastavením randomizace a prohlédnutím aktuální podoby dat na záložce RESULTS bylo shledáno, že je to již dostatečné a randomizace byla přerušena.

Randomizace sloupce HMesto

RM případ s názvem 99 Randomizace 02.03 HMesto byl vytvořen klonem z 99 Randomizace 02.02 PPobytOd. Zafixovány byly všechny sloupce, kromě sloupce HMesto.

Z města bydliště hosta je odvozen i stát a na obou sloupcích je závisí celá řada požadavků. Proto se i zde musí postupovat opatrně. Pro tento sloupec byly použity evoluční parametry mutace Fill a Swap. Na záložce DM TASKS byly ponechány tolerance pro výsledky úloh DZD představujících požadavky na data.

Na záložce DATA PRESETS byla jako Master Data preset nastaven 99 Randomizace 02.02 PPobytOd.

Po spuštění randomizace dochází pomalu ke změnám hodnot, protože je i nyní neustále kontrolována platnost všech požadavků kladených na data. Po 16 minutách bylo dosaženo změn ve výši 4.24 %. Pozastavením randomizace a prohlédnutím aktuální podoby dat na záložce RESULTS bylo shledáno, že je to již dostatečné a randomizace byla přerušena.

Randomizace sloupce POsob

Poslední viditelné artefakty vzniklé rozkopírováním původních 200 řádků jsou vidět ve sloupci POsob. RM případ s názvem byl vytvořen klonem z 99 Randomizace 02.03 HMesto. Zafixovány byly všechny sloupce, kromě sloupce POsob.

Požadavků závisejících na počtu osob není tolik. Opět byly použity evoluční parametry mutace Fill a Swap. Na záložce DM TASKS byly ponechány tolerance pro výsledky úloh DZD představujících požadavky na data.

Na záložce DATA PRESETS byla jako Master Data preset nastaven 99 Randomizace 02.03 HMesto.

Po spuštění randomizace dochází poměrně rychle ke změnám hodnot ve sloupci. Po 3 minutách bylo dosaženo změn ve výši 4.12 %. Pozastavením randomizace a prohlédnutím aktuální podoby dat na záložce RESULTS bylo shledáno, že je to již dostatečné a randomizace byla přerušena.

Konečný výsledek

Tím bylo dosaženo výsledné podoby dat Hotel, která je momentálně používána při výkladu na těchto stránkách.

lmdemo/rmhotel/randomizer/start.txt · Poslední úprava: 2015/10/08 21:32 (upraveno mimo DokuWiki)