Začínáme
Systém LISp-Miner a proces DZD
Analytické procedury
Pokročilé funkce
Výzkum a vývoj
Začínáme
Systém LISp-Miner a proces DZD
Analytické procedury
Pokročilé funkce
Výzkum a vývoj
Funkce LISp-Mineru pro interaktivní analýzu nabízí prostředky pro jednoduchou předběžnou analýzu dat. Ta má význam pro vhodnou formulaci analytických otázek a pro lepší pochopení toho, co bychom mohli následně považovat za zajímavé výsledky. Typickým příkladem je zjištění platnosti nějakého vztahu v celých datech (např. tvaru histogramu) a následné hledání takových podmnožin dat, pro které je tento tvar výrazně odlišný.
Interaktivní analýza se vyznačují tím, že se provádí ručně a ihned vidíme požadované výsledky. Jde o pohledy na vztahy platící v celých datech (nebo platící na jednoduše definován podmnožinách dat) a neumožňují data analyzovat tolik do hloubky. Analytické úlohy naproti tomu automaticky prověřují miliony a miliardy různých kombinací na základě námi připraveného zadání a mohou prověřovat platnost vztahů i na velmi složitě definovaných podmnožinách.
Interaktivní analýza patří jak do fáze porozumění datům, tak i do modelování.
Jde o jeden ze základních typů statistické analýzy (někdy též označována jako XY-plot analýza) a slouží pro vizuální porovnání hodnot dvou (numerických) veličin.
Více viz: Scatter-plot analýza
Analýza hlavních komponent (angl. Principal Component Analysis, zkr. PCA) je statistická technika používaná pro redukci dimenzí u mnoharozměrných dat. V systému LISp-Miner je využita pro dvourozměrnou vizualizaci záznamů.
Více viz: Analýza hlavních komponent
Frekvenční analýza kategorií (v LISp-Mineru jako Category frequency analysis) zobrazí základní přehled frekvencí kategorií jednoho nebo více atributů. Na rozdíl od předchozích dvou funkcí ze skupiny Interaktivní analýza se tak týká až předzpracovaných hodnot.
Více viz: Frekvenční analýza kategorií
Korelační analýza atributů (v LISp-Mineru jako KL Attributes correlation analysis) zobrazuje vzájemnou korelaci mezi všemi dvojicemi předzpracovaných kategoriálních atributů. Stejně jako výše popsaná frekvenční analýza se tak týká až předzpracovaných hodnot.
Více viz: Korelační analýza atributů
Kontingenční analýza jednoho atributu (v LISp-Mineru jako CF Contingency analysis) nebo též interaktivní CF-analýza nabízí rychlý způsob zobrazení četností kategorií předzpracovaného kategoriálního atributu v grafické podobě.
Více viz: Kontingenční analýza jednoho atributu
Kontingenční analýza dvou atributů (v LISp-Mineru jako KL Contingency analysis) nebo též interaktivní KL-analýza nabízí rychlý způsob výpočtu kontingenční tabulky popisující vztah dvou předzpracovaných kategoriálních atributů. Stejně jako interaktivní CF-analýza se týká až předzpracovaných hodnot.
Více viz: Kontingenční analýza dvou atributů
Kontingenční analýza dvou booleovských atributů (v LISp-Mineru jako 4ft Contingency analysis) nebo též interaktivní 4ft-kontingenční analýza nabízí rychlý způsob výpočtu čtyřpolní kontingenční tabulky popisující vztah dvou booleovských atributů, případně ještě za platnosti určité podmínky (opět zadané jako booleovský atribut). Stejně jako CF-analýza a KL-analýza pracuje s předzpracovanými atributy.
Interaktivní vytváření rozhodovacího stromu (v LISp-Mineru jako ET Decision Trees Analysis (TDIDT)) umožňuje ruční vytváření rozhodovacího stromuv intencích algoritmu Top-down induction of decision trees (zkr. TDIDT).
Interaktivní analýza geografických dat umožňuje zobrazení dat s geografickými souřadnicemi nebo s názvy geografických oblastí na mapě. To může vést k snazšímu rozpoznání prostorových závislostí, které by jinak zůstaly neodhalené. V současné době jsou v systému LISp-Miner implementovány dvě možnosti zobrazení geografických dat – geografická analýza bodů (Geodata XY analysis) s různě obarvenými body a geografická analýza četností záznamů podle oblastí (Geodata CF analysis) umožňující vyjádřit frekvence záznamů v oblasti pomocí jejího barevného odstínu.
Více viz: Interaktivní geografická analýza bodů
Více viz: Interaktivní geografická CF analýza
Více viz: Práce s geografickými daty
Související témata:
Seznámení s daty
Předzpracování dat
Praktická ukázka: Demo Hotel: Interaktivní analýza