Začínáme
Systém LISp-Miner a proces DZD
Analytické procedury
Pokročilé funkce
Výzkum a vývoj
Začínáme
Systém LISp-Miner a proces DZD
Analytické procedury
Pokročilé funkce
Výzkum a vývoj
Jde o jeden ze základních typů statistické analýzy (někdy též označována jako XY-plot analýza) a slouží pro vizuální porovnání hodnot dvou (numerických) veličin.
Záložku Scatter-plot analýzy otevřeme z menu Interactive analysis
, nebo z kontextové nabídky pro položku C. Interactive analysis
ve stromu otevřených záložek po levé straně obrazovky.
Na ose x jsou hodnoty první veličiny (obvykle vysvětlující) a na ose y pak hodnoty druhé veličiny (vysvětlované). Vznikne bodový graf, kde každý bod reprezentuje jeden objekt analyzovaných dat. Jeho souřadnice jsou odvozeny z hodnot první veličiny (x-ová souřadnice) a druhé (y-ová souřadnice) veličiny.
Je důležité si pamatovat, že scatter-plot analýza pracuje s původními (nepředzpracovanými) hodnotami databázových sloupců v původní databázové tabulce, nikoliv nad kategorizovanými atributy. Pro předzpracovaná data (zejména diskretizovaná) se používá kontingenční analýza.
Zároveň z podstaty vyplývá, že v bodovém grafu mohou být zobrazeny pouze číselné (numerické) hodnoty. Proto nejsou v nabízeném seznamu atributů ty s nominálními hodnotami.
Zobrazený „mrak“ bodů může představovat určitý trend. Trendovou křivku si můžeme nechat zobrazit přímo v grafu, pomocí volby Show trend
. Body se prokládají polynomem n-tého řádu, který volíme výběrem z možností PolyOrder
– od jedné (přímka) do sedmi (polynom sedmého řádu).
Body v grafu je možné omezit pouze na podmnožinu záznamů z databázové tabulky. Podmnožina se definuje pomocí již předzpracovaného kategoriálního atributu tak, že nejprve zaškrtneme volbu Use attribute for condition
v pravém horním rohu záložky, a pak vybereme požadovaný atribut z rozbalovací nabídky. Následně pomocí posuvníku vybereme jednu z kategorií atributů. V grafu se budou zobrazovat pouze body pro záznamy, jejichž hodnota ve sloupci daném vybraným atributem patří do vybrané kategorie.
Jak měníme posuvníkem právě nastavenou kategorii, tak se mění i podoba grafu.
Související témata:
Analýza hlavních komponent
Korelační analýza
Interaktivní analýza
Seznámení s daty
Praktická ukázka: Demo Hotel: Scatter-plot analýza