Začínáme
Systém LISp-Miner a proces DZD
Analytické procedury
Pokročilé funkce
Výzkum a vývoj
Začínáme
Systém LISp-Miner a proces DZD
Analytické procedury
Pokročilé funkce
Výzkum a vývoj
Seznámení s daty je druhou fází procesu DZD podle metodiky CRISP-DM.
Základní funkce pro seznámení s daty jsou v systému LISp-Miner soustředěny do modulu LM Workspace. Tyto funkce umožňují jak načtení (nebo připojení) dat, tak i prohlížení dat – tedy získání základní představy o jejich struktuře a obsahu. Bez skutečného porozumění datům – jejich struktuře i obsahu není možné dosáhnout dobrých výsledků analýzy.
Analýzu obvykle zahujememe načtením dat.
Zvláštní péči je třeba věnovat problému při práci s daty s velkým množstvím vlastností (sloupců), které nelze rovnou načíst do databázových tabulek.
Praktická ukázka: Demo Hotel: Načtení dat
Základní funkce pro prohlížení struktury a obsahu dat nalezneme v modulu LM Workspace v menu Data Introduction
. Záložky patřící do fáze Seznámení s daty se budou objevovat ve stromu otevřených záložek po levé straně pracovní plochy ve větvi A. Data Introduction
.
Výchozí záložkou je seznam všech databázových tabulek. Výběrem jedné položky ze seznamu otevřeme záložku s detailem tabulky. Tlačítkem Show Data
otevřeme záložky s obsahem právě vybrané tabulky.
Skládají-li se analyzovaná data z více tabulek, musíme zadat relace, pomocí kterých se mají tabulky spojovat.
Praktická ukázka: Demo Hotel: Prohlížení dat
Na záložce Tables můžeme tlačítkem Import TXT
přidat do analyzovaných dat další databázovou tabulku, jejíž obsah bude načten z textového souboru. Funkce i postup je shodný jako při prvotním importu dat z textového soboru.
Po úspěšném importu dalších dat a vytvoření nové databázové tabulky se tato objeví v seznamu databázových tabulek na záložce Tables. Stejně tak se systém LISp-Miner pokusí automaticky inicializovat tabulku a identifikovat primární klíč.
Související témata:
Načtení dat v textovém souboru nebo v databázi
Propojení existující dvojice data+metabáze