Uživatelské nástroje

Nástroje pro tento web


lmianalysis:start

Interaktivní analýza

Funkce LISp-Mineru pro interaktivní analýzu nabízí prostředky pro jednoduchou předběžnou analýzu dat. Ta má význam pro vhodnou formulaci analytických otázek a pro lepší pochopení toho, co bychom mohli následně považovat za zajímavé výsledky. Typickým příkladem je zjištění platnosti nějakého vztahu v celých datech (např. tvaru histogramu) a následné hledání takových podmnožin dat, pro které je tento tvar výrazně odlišný.

Interaktivní analýza se vyznačují tím, že se provádí ručně a ihned vidíme požadované výsledky. Jde o pohledy na vztahy platící v celých datech (nebo platící na jednoduše definován podmnožinách dat) a neumožňují data analyzovat tolik do hloubky. Analytické úlohy naproti tomu automaticky prověřují miliony a miliardy různých kombinací na základě námi připraveného zadání a mohou prověřovat platnost vztahů i na velmi složitě definovaných podmnožinách.

Interaktivní analýza patří jak do fáze porozumění datům, tak i do modelování.

Scatter-plot analýza

Jde o jeden ze základních typů statistické analýzy (někdy též označována jako XY-plot analýza) a slouží pro vizuální porovnání hodnot dvou (numerických) veličin.

Více viz: Scatter-plot analýza

Analýza hlavních komponent

Analýza hlavních komponent (angl. Principal Component Analysis, zkr. PCA) je statistická technika používaná pro redukci dimenzí u mnoharozměrných dat. V systému LISp-Miner je využita pro dvourozměrnou vizualizaci záznamů.

Více viz: Analýza hlavních komponent

Frekvenční analýza kategorií

Frekvenční analýza kategorií (v LISp-Mineru jako Category frequency analysis) zobrazí základní přehled frekvencí kategorií jednoho nebo více atributů. Na rozdíl od předchozích dvou funkcí ze skupiny Interaktivní analýza se tak týká až předzpracovaných hodnot.

Více viz: Frekvenční analýza kategorií

Korelační analýza atributů

Korelační analýza atributů (v LISp-Mineru jako KL Attributes correlation analysis) zobrazuje vzájemnou korelaci mezi všemi dvojicemi předzpracovaných kategoriálních atributů. Stejně jako výše popsaná frekvenční analýza se tak týká až předzpracovaných hodnot.

Více viz: Korelační analýza atributů

Kontingenční analýza jednoho atributu

Kontingenční analýza jednoho atributu (v LISp-Mineru jako CF Contingency analysis) nebo též interaktivní CF-analýza nabízí rychlý způsob zobrazení četností kategorií předzpracovaného kategoriálního atributu v grafické podobě.

Více viz: Kontingenční analýza jednoho atributu

Kontingenční analýza dvou atributů

Kontingenční analýza dvou atributů (v LISp-Mineru jako KL Contingency analysis) nebo též interaktivní KL-analýza nabízí rychlý způsob výpočtu kontingenční tabulky popisující vztah dvou předzpracovaných kategoriálních atributů. Stejně jako interaktivní CF-analýza se týká až předzpracovaných hodnot.

Více viz: Kontingenční analýza dvou atributů

Kontingenční analýza dvou booleovských atributů

Kontingenční analýza dvou booleovských atributů (v LISp-Mineru jako 4ft Contingency analysis) nebo též interaktivní 4ft-kontingenční analýza nabízí rychlý způsob výpočtu čtyřpolní kontingenční tabulky popisující vztah dvou booleovských atributů, případně ještě za platnosti určité podmínky (opět zadané jako booleovský atribut). Stejně jako CF-analýza a KL-analýza pracuje s předzpracovanými atributy.

Více viz: Kontingenční analýza dvou booleovských atributů

Interaktivní vytváření rozhodovacího stromu

Interaktivní vytváření rozhodovacího stromu (v LISp-Mineru jako ET Decision Trees Analysis (TDIDT)) umožňuje ruční vytváření rozhodovacího stromuv intencích algoritmu Top-down induction of decision trees (zkr. TDIDT).

Více viz: Interaktivní vytváření rozhodovacího stromu

Interaktivní analýza geografických dat

Interaktivní analýza geografických dat umožňuje zobrazení dat s geografickými souřadnicemi nebo s názvy geografických oblastí na mapě. To může vést k snazšímu rozpoznání prostorových závislostí, které by jinak zůstaly neodhalené. V současné době jsou v systému LISp-Miner implementovány dvě možnosti zobrazení geografických dat – geografická analýza bodů (Geodata XY analysis) s různě obarvenými body a geografická analýza četností záznamů podle oblastí (Geodata CF analysis) umožňující vyjádřit frekvence záznamů v oblasti pomocí jejího barevného odstínu.

Více viz: Interaktivní geografická analýza bodů
Více viz: Interaktivní geografická CF analýza
Více viz: Práce s geografickými daty


Související témata:

Seznámení s daty
Předzpracování dat

Praktická ukázka: Demo Hotel: Interaktivní analýza

lmianalysis/start.txt · Poslední úprava: 2015/09/01 17:22 (upraveno mimo DokuWiki)