Začínáme
Systém LISp-Miner a proces DZD
Analytické procedury
Pokročilé funkce
Výzkum a vývoj
Začínáme
Systém LISp-Miner a proces DZD
Analytické procedury
Pokročilé funkce
Výzkum a vývoj
Systém LISp-Miner pracuje s dvojicí data+metabáze.
Pro další práci tak musíme mít jak databázovou tabulku s „analyzovány daty“, tak i vytvořenou metabázi. Nad datovou tabulkou pak můžeme vytvářet odvozené hodnoty, připravovat atributy a končeně i zadání úloh DZD pro řízení evoluce.
Protože však data zatím nemáme, můžeme vytvořit pouze tabulku prázdnou, ve které však budou všechny sloupce, které mají být v generovaných datech, včetně správně nastaveného datového typu. Té budeme říkat pseudotabulka.
Práci si můžeme výrazně ušetřit, když do pseudotabulky přidáme několik málo řádků, které zaručí, že v jednotlivých sloupcích budou uvedeny všechny hodnoty, které se v nich mohou vyskytovat. Pro číselné hodnoty stačí, když ve sloupci bude minimální a maxímální hodnota.
Pseudotabulku můžeme vytvářet přímo v databázovém systému. Patrně nejjednodušší je však vytvořit ji v Excelu a následně uložit jako textový soubory. Ten běžným způsobem naimportujeme do systému LISp-Miner.
Část pseudotabulky pro generování dat Hotel vidíme na obrázku:
Pseudotabulka musí obsahovat sloupce jak pro základní data, tak i pro připojená externí data.
Pseudotabulku z Excelu uložíme do textového souboru RMHotel.txt
s oddělovacím znakem (např. tabulátor). Ten známým způsobem naimportujeme do systému LISp-Miner pomocí modulu LM Workspace a necháme vytvořit i metabázi.
V tomto okamžiku tak máme vytvořenu dvojici data+metabáze. Pokud jsme ponechali přenastavený název, bude v seznamu nabízených dvojic pojmenována LM RMHotel MB.
Kromě základní datové tabulky musíme do vzniklé databáze přidat i další pomocné tabulky.
Tabulka Bydliste obsahuje údaje odvozené z města bydliště hosta. Jde o stát a zeměpisné souřadnice města – viz záložka Bydliště
v souboru RMHotel.xls
.
Dojde-li kdykoliv v průběhu evoluce ke změně města bydliště hosta (hodnota ve sloupci HMesto), tak musí zároveň dojít k aktualizaci hodnot ve sloupcích, které jsou z města bydliště hosta odvozeny. To zajistí správné nastavení charakteristik sloupců v RM případu.
Ze stejného důvodu musí být vytvořeny i tabulky Pocasi a Smenarna s údaji pro každý den za roky 2012 a 2013. Hodnoty v nich obsažené budou přeneseny do odpovídajících sloupců datové tabulky podle dne začátku pobytu.
Speciální tabulka Dotaznik definuje statistických model, podle kterého budou nastaveny hodnoty dílčích hodnocení v závislosti na aktuální hodnotě hodnocení celkového.
V tabulce Cenik jsou pro jednotlivé roky uvedeny základní ceny (v Kč) za ubytování a za stravu.