Začínáme
Systém LISp-Miner a proces DZD
Analytické procedury
Pokročilé funkce
Výzkum a vývoj
Začínáme
Systém LISp-Miner a proces DZD
Analytické procedury
Pokročilé funkce
Výzkum a vývoj
Nyní máme variantu dat, která v sobě zahrnuje všechny požadavky, ale je svým rozsahem malá. Pomocí RM případů typu Randomizace zvětšíme.
Z původních například 200 řádků však uděláme 2000, 10000… snadno tak, že z každého řádku původní tabulky uděláme 10, 50… nových. To však ve zvětšených datech způsobí na první pohled viditelné artefakty, takže nebudou vypadat realisticky. Tomu zabráníme tak, že do zvětšených dat budeme přidávat „šum“ pomocí náhodných změn hodnot. Při každé změně budeme zároveň kontrolovat, že i potom budou data splňovat všechny na ně kladené požadavky.
Počet řádků v generovaných datech zvýšíme vytvořením nového RM případu, u kterého nastavíme typ na Randomizer a cílový počet řádků (angl. Target data rows
) na 2000.
Na záložce COLUMNS
vložíme úplně všechny sloupce. Aby nedešlo k žádné změně hodnot, ale jen a pouze ke zvětšení počtu řádků, nastavíme u všech sloupců, že jsou hodnoty v nich zafixovány (volba Column is fixed
).
Na záložce DM TASKS
vložíme všechny požadavky v podobě úloh DZD, včetně frequency guiding rules. A na záložce DATA PRESETS
jako Master DataPreset vložíme do seznamu RM případ s názvem 98 Evoluce.
Spustíme evoluci a hned po prvním kroku ji můžeme ukončit. Zkontrolujeme, že na záložce RESULTS
vidíme data o 2000 řádcích.
Upozornění: V aktuální verzi generování dat Hotel byl tento krok přeskočen a zvětšení počtu řádků bylo realizováno společně s randomizací hodnot ve sloupcích HVek a HPohlavi popisované v následující sekci.
Hodnoty ve sloupcích HVek a HPohlavi nejsou zatím použity v žádné doménové znalosti, ani vztahu. Proto mohou být randomizovány zcela libovolně.
V RM případu s názvem 99 Randomizace 02.01b byly zafixovány všechny sloupce, kromě těchto dvou.
Po spuštění randomizace došlo k rychlé změně všech hodnot v obou sloupcích, takže bylo dosaženo přes 27 % rozdílu oproti počáteční podobě dat (po zvětšení z 200 na 2000 řádků).
RM případ s názvem 99 Randomizace 02.02 PPobytOd byl vytvořen klonem z 99 Randomizace 02.01b. Zafixovány byly všechny sloupce, kromě sloupce PPobytOd.
Na hodnotách ve sloupci PPobytOd závisí celá řada požadavků. Proto se při změnách hodnot v něm musí postupovat opatrně. Základní požadavky vyplývají z dne týdne. Proto je v evolučních parametrech RM případu povolen pouze typ mutace Modify a hodnota změny ve sloupci PPobytOd byla nastavena na 7. Během randomizace se tak mohou začátky pobytu měnit pouze o ±7 dní. Navíc byla ještě na záložce DM TASKS
nastavena tolerance pro výsledky úloh DZD představujících požadavky na data.
Na záložce DATA PRESETS
byla jako Master Data preset nastaven 99 Randomizace 02.01b.
Po spuštění randomizace dochází pomalu ke změnám hodnot dne začátku pobytu, protože je neustále kontrolována platnost všech požadavků kladených na data. Po 19 minutách bylo dosaženo změn ve výši 6.7 %. Pozastavením randomizace a prohlédnutím aktuální podoby dat na záložce RESULTS
bylo shledáno, že je to již dostatečné a randomizace byla přerušena.
RM případ s názvem 99 Randomizace 02.03 HMesto byl vytvořen klonem z 99 Randomizace 02.02 PPobytOd. Zafixovány byly všechny sloupce, kromě sloupce HMesto.
Z města bydliště hosta je odvozen i stát a na obou sloupcích je závisí celá řada požadavků. Proto se i zde musí postupovat opatrně. Pro tento sloupec byly použity evoluční parametry mutace Fill a Swap. Na záložce DM TASKS
byly ponechány tolerance pro výsledky úloh DZD představujících požadavky na data.
Na záložce DATA PRESETS
byla jako Master Data preset nastaven 99 Randomizace 02.02 PPobytOd.
Po spuštění randomizace dochází pomalu ke změnám hodnot, protože je i nyní neustále kontrolována platnost všech požadavků kladených na data. Po 16 minutách bylo dosaženo změn ve výši 4.24 %. Pozastavením randomizace a prohlédnutím aktuální podoby dat na záložce RESULTS
bylo shledáno, že je to již dostatečné a randomizace byla přerušena.
Poslední viditelné artefakty vzniklé rozkopírováním původních 200 řádků jsou vidět ve sloupci POsob. RM případ s názvem byl vytvořen klonem z 99 Randomizace 02.03 HMesto. Zafixovány byly všechny sloupce, kromě sloupce POsob.
Požadavků závisejících na počtu osob není tolik. Opět byly použity evoluční parametry mutace Fill a Swap. Na záložce DM TASKS
byly ponechány tolerance pro výsledky úloh DZD představujících požadavky na data.
Na záložce DATA PRESETS
byla jako Master Data preset nastaven 99 Randomizace 02.03 HMesto.
Po spuštění randomizace dochází poměrně rychle ke změnám hodnot ve sloupci. Po 3 minutách bylo dosaženo změn ve výši 4.12 %. Pozastavením randomizace a prohlédnutím aktuální podoby dat na záložce RESULTS
bylo shledáno, že je to již dostatečné a randomizace byla přerušena.
Tím bylo dosaženo výsledné podoby dat Hotel, která je momentálně používána při výkladu na těchto stránkách.