Začínáme
Systém LISp-Miner a proces DZD
Analytické procedury
Pokročilé funkce
Výzkum a vývoj
Začínáme
Systém LISp-Miner a proces DZD
Analytické procedury
Pokročilé funkce
Výzkum a vývoj
Řešení úloh patří do fáze Modelování a prohlížení výsledků do fáze Vyhodnocení výsledků.
V explorační analýze rozumíme modelováním hledání různých typů vztahů v datech. Typ vztah je dán použitou analytickou procedurou. Vztahy se hledají v rámci analytických úloh, které sdružují zadání úlohy a nalezené výsledky. Při klasifikaci rozumíme modelováním vytvoření modelu na určité úrovni abstrakce, který data popisuje s přijatelnou přesností.
V současné době je v systému LISp-Miner k dispozici celkem devět analytických procedur implementovaných prostřednictvím modulů uvedených v tabulce níže.
Způsob zadávání úloh a prohlížení výsledků byl navržen jednotně. To by mělo uživateli usnadnit práci s další analytickou procedurou, pokud již zvládl rozhraní systému a má o ni dostatečné teoretické znalosti.
Zde jsou popsány základní záložky modulu LM Workspace pro obě zmíněné fáze DZD (viz Přehled analytických úloh, Detaily zadání úlohy, Prohlížení výsledků) a dále hlavní činnosti (Vytvoření a klonování úlohy a Výpočet úlohy). Ve všech analytických procedurách je možné zadávat množinu relevantních cedentů s bohatou syntaxí.
Název procedury | Ikona | Zkrácený název | Dvoupísmenná zkratka | Vysvětlení |
---|---|---|---|---|
CF-Miner | CF | CF | Podmíněná frekvenční analýza jednoho atributu | |
KL-Miner | KL | KL | Podmíněná kontingenční analýza dvou atributů | |
4ft-Miner | 4ft | FT | Rozšířená asociační pravidla s bohatou syntaxí | |
MCluster-Miner | MCluster | MC | Podmíněná shluková analýza s variantami použití vysvětlujících atributů | |
ETree-Miner | ETree | ET | Podmíněné rozhodovací a explorační stromy, rozhodovací pravidla | |
SDCF-Miner | SDCF | DC | Porovnávání histogramů na podmnožinách záznamů | |
SDKL-Miner | SDKL | DK | Porovnávání kontingenčních tabulek na podmnožinách záznamů | |
SD4ft-Miner | SD4ft | DF | Porovnávání platnosti rozšířeného asociačního pravidla na podmnožinách záznamů | |
Ac4ft-Miner | Ac4ft | AF | Rozšířená akční pravidla s bohatou syntaxí |
Výše uvedené analytické procedury implementované v systému LISp-Miner je možné považovat za GUHA-procedury. Jednotlivým analytickým procedurám se blíže věnují samostatné stránky.
Analytická úloha se snaží nalézt odpověď na dříve formulovanou analytickou otázku. Na jednu analytickou otázku přitom může odpovídat více úloh – buď z důvodu zpřesňování analytické otázky, nebo kvůli široké obecné formulaci analytické otázky a nutnosti použití více různých technik DZD pro její zodpovězení.
Při analýze dat formulujeme obvykle více analytických otázek, a z toho vyplývá i velké množství řešených analytických úloh. Úlohy je proto vhodné rozřazovat do skupin.
Více viz: Analytická úloha
Seznam všech vytvořených analytických úloh nalezneme na záložce Tasks Overview
.
Úlohy jsou řazeny abecedně podle jejich názvu a zeleně jsou zvýrazněny úlohy vyřešené. Úlohy je možné rozdělovat do skupin a následně zobrazit pouze seznam úloh patřících do vybrané skupiny. Název skupiny úloh obvykle vychází z textu formulované analytické otázky. Do jedné skupiny pak patří všechny analytické úlohy, které hledají odpověď na tuto analytickou otázku.
Více viz: Přehled analytických úloh
Po zadání úlohy a případné kontrole zadání můžeme spusit výpočet. Doba výpočtu závisí na velikosti dat, ale zejména na složitosti zadání úlohy a použitých typech koeficientů.
Více viz: Výpočet úlohy
Po skončení výpočtu úlohy je konečně možné začít prohlížet výsledky a pokoušet se o jejich interpretaci. Výsledky jsou k dispozice jak zvlášť pro každou analytickou úlohu, tak i agregované za všechny úlohy z metabáze.
Více viz: Výsledky jedné úlohy
Více viz: Souhrnné výsledky všech úloh
Výsledkem analýzy dat by měla být zpráva, která popisuje vlastní data, postup analýzy a získané výsledky a zejména dává doporučení pro využití výsledků v praxi.
Osnova zprávy
Související témata:
Předzpracování dat
Interaktivní analýza
Souhrnné výsledky všech úloh