Uživatelské nástroje

Nástroje pro tento web


lmexplore:import

Načtení dat

Systém LISp-Miner předpokládá, že analyzovaná data jsou uložena v relační databázi a přístupná pomocí rozhraní ODBC.

Použití univerzálního databázového rozhraní ODBC dovoluje, aby analyzovaná data byla uložena téměř v libovolné databázi (MS Access, Oracle, MS SQL Server, MySQL…) nebo třeba i jako textový soubor obsahující vhodně naformátovaná data.

V analyzovaných datech nejsou prováděny žádné změny a je k nim přistupováno pouze v režimu read-only. Výjimku představuje funkce importu dat z textového souboru, která data ukládá do databáze, a funkce smazání databázové tabulky na záložce se seznamem databázových tabulek.

Vytvoření dvojice data+metabáze

Ke každým datům je systémem LISp-Miner vytvořena metabáze, do které se ukládají veškerá uživatelská data. Patří mezi ně popis struktury analyzovaných dat, popis kategorizace (atributů), zadání úloh a v neposlední řadě i výsledky běhu úloh.

Abychom tedy mohli začít se systémem pracovat, musíme připravit relační databázi (s jednou nebo více relačními tabulkami) obsahující analyzovaná data. K nim se pak automaticky vytvoří i metabáze. Nastat mohou následující situace, pro které je i následně uveden postup:

Automatická inicializace metabáze

Po úspěšném vytvoření metabáze se otevře základní obrazovka modulu LM Workspace a v něm se automaticky zobrazí záložka se seznamem databázových tabulek. Zároveň se načtou základní údaje o databázové tabulce (počty a názvy sloupců, statistické hodnoty o sloupcích…) a také se označí primární klíč (dokáže-li jej systém LISp-Miner rozpoznat – jeho název musí být ID nebo ID_LM a datový typ Celé číslo).

Že byla tabulka úspěšně inicializována poznáme tak, že v seznamu tabulek bude zvýrazněna zeleně. V opačném případě ji musíme inicializovat ručně.

Připojení existující dvojice data+metabáze

Pokud změníme umístění již existující dvojice data+metabáze na lokálním disku nebo tuto dvojici přeneseme z jiného počítače, musíme oba soubory znovu propojit.

K tomu použijeme tlačítko Associate an existing metabase with data. Tlačítko vyvolá dialogové okno, pomocí kterého označíme nejprve analyzovaná data, a pak i metabázi. Po stisku tlačítka Ok dojde k jejich propojení a od teď bude možné i na tomto počítači vybírat dvojici data+metabáze ze seznamu naposledy otevřených dat k analýze.

Jak analyzovaná data, tak i metabázi můžeme nezávislé na sobě označit dvěma způsoby – buď pomocí ODBC datového zdroje, nebo odkazem na soubor ve formátu MS Access někde na lokálním disku.

V obou případěch je možné jak pro data, tak pro metabázi použít stejný řetěz znaků, protože systém LISp-Miner automaticky odliší název ODBC datového zdroje k metabázi přidáním sufixu MB. Při volbě vhodného názvu ODBC datového zdroje je třeba dodržovat omezení na něj kladená (používat pouze znaky bez diakritiky a nepřekročit maximální délku).

Automatické dohledání souboru metabáze k datům

Po označení MDB souboru s analyzovanými daty pomocí tlačítka Browse se pokusí LISp-Miner ušetřit uživateli práci a automaticky dohledat soubor s metabází. Zároveň se i předvyplnění názvy obou ODBC datových zdrojů.

K automatickému dohledání a vyplnění dojde v případě, že analyzovaná data i metabáze jsou ve stejné složce a v podobě MDB souborů a zároveň je použito standardní pojmenování obou souborů – se zakončením na .Data.mdb (analyzovaná data) a .LMMB.mdb (metabáze).

File DSN

V případě identifikace odkazem na soubor je vhodné opravit přednastavený název pro ODBC datový zdroj, který bude použit k přístupu k datům přes rozhraní ODBC.

Volby související s mezinárodním nastavením systému Windows a databáze

Po vytvoření nové metabáze i po připojení existující je třeba zkontrolovat nastavení související s jazykovým prostředím. Zejména je třeba zkontrolovat formát datumů, který má LISp-Miner používat při komunikaci při databází – viz uživatelská nastavení. Jsou-li data uložena v systému s anglickým formátem datumu, je třeba změnit formát datumů na MM/DD/YYYY.

Doporučení a omezení podle velikosti dat

Systém LISp-Miner je uzpůsoben pro práci s daty od desítek záznamů po stovky miliónů záznamů. Podle velikosti dat i složitosti úloh byl připraven seznam doporučení a omezení.


Související témata:

Seznámení s daty
Záložka s detailem databázové tabulky

lmexplore/import.txt · Poslední úprava: 2016/02/24 22:13 (upraveno mimo DokuWiki)