Začínáme
Systém LISp-Miner a proces DZD
Analytické procedury
Pokročilé funkce
Výzkum a vývoj
Začínáme
Systém LISp-Miner a proces DZD
Analytické procedury
Pokročilé funkce
Výzkum a vývoj
Jde o speciální typ sloupců založených na nalezených hypotézách ve výsledcích dříve vyřešených úloh. „Předzpracováním“ je v tomto případě tak kompletní vyřešení analytické úlohy. I to lze však chápat jako další pohled na analyzovaná data z určitého úhlu.
Představme si úlohu shlukování vyřešenou v analytické proceduře MCluster-Miner. Výsledkem takové úlohy je jedna nebo více hypotéz, kde každá navrhuje jedno možné rozdělení záznamů v analyzované matici do daného počtu shluků, například do čtyř. První záznam tak může být přiřazen do prvního shluku, druhý záznam do čtvrtého shluku, třetí záznam do druhého shluku atd.
Založíme-li nad takovou hypotézou sloupec, budou hodnoty v tomto sloupci od jedné do čtyř a budou reprezentovat shluk, do kterého daný záznam patří. Nad sloupcem můžeme vytvořit atribut a ten použít v zadání další úlohy DZD. Ta může řešit analytickou otázkou, jestli příslušnost do některého shluku vede spolu s dalšími atributy znamená převážně spokojené hosty, či nikoliv.
Podobně můžeme použít analytickou proceduru ETree-Miner, jejímž výsledkem je rozhodovací strom, který každý záznam datové matice klasifikuje do některé z předem daných cílových tříd. Sloupec založený nad tímto rozhodovacím stromem (hypotézou) bude pro každý záznam obsahovat cílovou třídu zjištěnou z rozhodovacího stromu.
Odvozený sloupec se vytváří na záložce konkrétní hypotézy tlačítkem Add as column
. Vytvořit sloupce nad výsledky můžeme v současné době i pro hypotézy analytických procedur CF-Miner, KL-Miner a 4ft-Miner. U každého typu hypotézy jsou vysvětleny hodnoty, které se ve sloupci založeném nad danou hypotézou mohou vyskytovat.
Odkaz na záložku s detailem hypotézy!
Nad takto vytvořenými sloupci je možné vytvořit kategorizované atributy, stejně jako nad kterýmkoliv jiným sloupcem. Následně mohou být atributy použity v zadání další úlohy libovolného typu. Teoreticky je pak možné nad výsledky úlohy opět založit sloupec a takto „řetězit“ analytické úlohy. Toto navazování analytických úloh je předmětem aktuálního výzkumu, zejména v projektu EverMiner.
Související témata:
Odvozené hodnoty
Záložka s detaily o tabulce
Zobrazení hodnot v tabulce