Začínáme
Systém LISp-Miner a proces DZD
Analytické procedury
Pokročilé funkce
Výzkum a vývoj
Začínáme
Systém LISp-Miner a proces DZD
Analytické procedury
Pokročilé funkce
Výzkum a vývoj
Odvozené hodnoty jsou počítány z hodnot již dostupných v analyzovaných datech, ale nabízejí jiný, trochu odlišný pohled na data.
Přístupné jsou jako dodatečně přidané (odvozené) sloupce (angl. derived columns) do původní databázové tabulky. Objevují se tak v seznamu sloupců na záložce databázové tabulky, kde můžeme přidávat i další odvozené sloupce.
Typickou odvozenou hodnotou je den v týdnu vypočtený z datumu. Zároveň je možné z datumu vypočítat i pořadový den v roce, pořadí týdne v roce, čtvrtletí nebo i pořadový den na základě minimální hodnoty v daném sloupci.
Samotné datum a čas jsou složené datové typy, které se skládají z dílčích hodnot – rok, měsíc a den pro datum a hodina, minuta, sekunda pro čas. S každou z těchto dílčích hodnot můžeme pracovat samostatně jako s odvozenou hodnotou.
Výše zmíněné odvozené hodnoty vytvoří LISp-Miner automaticky.
Častým případem odvozených hodnot je výpočet jednotkových cen z cen celkových. Dalším příkladem může být věk vypočtený z datumu narození nebo BMI (body-mass index) používaný v lékařském prostředí a zohledňující jak hmotnost, tak výšku pacienta.
Jde o odvozené hodnoty vypočtené z jiných sloupců, ale vždy pouze z hodnot v jednom řádku databázové tabulky.
Více viz: Hodnoty vypočtené výrazem
Za odvozené hodnoty je možné považovat i různé agregované údaje. Ty můžeme vypočítat jak ze samotné databázové tabulky, nad kterou provádíme analýzu, tak i z dalších (nějakým způsobem provázaných) databázových tabulek.
Příklad první agregované hodnoty může být pro každého hosta výpočet počtu dalších hostů, kteří ve stejný den přijeli ze stejného města. Příkladem druhého způsobu výpočtu může být zjištění vzdálenosti k nejbližší policejní stanici pro každý ze spáchaný zločinů na základě souřadnic místa zločinu v hlavní tabulce a souřadnic policejních stanic v tabulce druhé.
Více viz: Hodnoty vypočtené vnořeným SQL dotazem
Jsou-li součástí dat i geografické souřadnice bodu (např. místa nehody nebo trestného činu, bydliště hosta…), můžeme je využít pro výpočet dalšího typu odvozených hodnot počítaných na základě geografických relací jako např. „vzdálenost od místa nehody k nejbližší nemocnici“, „název (konkurenčního) hotelu, ke kterému má host nejblíže ze svého bydliště“ nebo „název gangu, v jehož teritoriu se zločin stal“.
Více viz: Hodnoty vypočtené z geografických dat
Dalším typem odvozených sloupců jsou sloupce vzniklé představující jednotlivé hlavní komponenty jako výsledek analýzy hlavní komponent.
Více viz: Analýza hlavních komponent
Konečně je možné vytvářet odvozené sloupce nad nalezenými vztahy.
Více viz: Hodnoty vypočtené z výsledků úloh DZD
Související témata:
Záložka s detaily o tabulce
Zobrazení hodnot v tabulce
Praktická ukázka: Demo Hotel: Výpočet odvozených hodnot