Uživatelské nástroje

Nástroje pro tento web


lmexplore:columnhypothesis

Sloupce založené na výsledcích úloh

Jde o speciální typ sloupců založených na nalezených hypotézách ve výsledcích dříve vyřešených úloh. „Předzpracováním“ je v tomto případě tak kompletní vyřešení analytické úlohy. I to lze však chápat jako další pohled na analyzovaná data z určitého úhlu.

Představme si úlohu shlukování vyřešenou v analytické proceduře MCluster-Miner. Výsledkem takové úlohy je jedna nebo více hypotéz, kde každá navrhuje jedno možné rozdělení záznamů v analyzované matici do daného počtu shluků, například do čtyř. První záznam tak může být přiřazen do prvního shluku, druhý záznam do čtvrtého shluku, třetí záznam do druhého shluku atd.

Založíme-li nad takovou hypotézou sloupec, budou hodnoty v tomto sloupci od jedné do čtyř a budou reprezentovat shluk, do kterého daný záznam patří. Nad sloupcem můžeme vytvořit atribut a ten použít v zadání další úlohy DZD. Ta může řešit analytickou otázkou, jestli příslušnost do některého shluku vede spolu s dalšími atributy znamená převážně spokojené hosty, či nikoliv.

Podobně můžeme použít analytickou proceduru ETree-Miner, jejímž výsledkem je rozhodovací strom, který každý záznam datové matice klasifikuje do některé z předem daných cílových tříd. Sloupec založený nad tímto rozhodovacím stromem (hypotézou) bude pro každý záznam obsahovat cílovou třídu zjištěnou z rozhodovacího stromu.

Odvozený sloupec se vytváří na záložce konkrétní hypotézy tlačítkem Add as column. Vytvořit sloupce nad výsledky můžeme v současné době i pro hypotézy analytických procedur CF-Miner, KL-Miner a 4ft-Miner. U každého typu hypotézy jsou vysvětleny hodnoty, které se ve sloupci založeném nad danou hypotézou mohou vyskytovat.

FIXME Odkaz na záložku s detailem hypotézy!

Nad takto vytvořenými sloupci je možné vytvořit kategorizované atributy, stejně jako nad kterýmkoliv jiným sloupcem. Následně mohou být atributy použity v zadání další úlohy libovolného typu. Teoreticky je pak možné nad výsledky úlohy opět založit sloupec a takto „řetězit“ analytické úlohy. Toto navazování analytických úloh je předmětem aktuálního výzkumu, zejména v projektu EverMiner.


Související témata:

Odvozené hodnoty
Záložka s detaily o tabulce
Zobrazení hodnot v tabulce

lmexplore/columnhypothesis.txt · Poslední úprava: 2016/01/03 20:30 (upraveno mimo DokuWiki)