Uživatelské nástroje

Nástroje pro tento web


lmexplore:columnderived

Výpočet odvozených hodnot

Odvozené hodnoty jsou počítány z hodnot již dostupných v analyzovaných datech, ale nabízejí jiný, trochu odlišný pohled na data.

Přístupné jsou jako dodatečně přidané (odvozené) sloupce (angl. derived columns) do původní databázové tabulky. Objevují se tak v seznamu sloupců na záložce databázové tabulky, kde můžeme přidávat i další odvozené sloupce.

Automaticky vytvořené odvozené hodnoty

Typickou odvozenou hodnotou je den v týdnu vypočtený z datumu. Zároveň je možné z datumu vypočítat i pořadový den v roce, pořadí týdne v roce, čtvrtletí nebo i pořadový den na základě minimální hodnoty v daném sloupci.

Samotné datum a čas jsou složené datové typy, které se skládají z dílčích hodnot – rok, měsíc a den pro datum a hodina, minuta, sekunda pro čas. S každou z těchto dílčích hodnot můžeme pracovat samostatně jako s odvozenou hodnotou.

Výše zmíněné odvozené hodnoty vytvoří LISp-Miner automaticky.

Hodnoty vypočtené výrazem

Častým případem odvozených hodnot je výpočet jednotkových cen z cen celkových. Dalším příkladem může být věk vypočtený z datumu narození nebo BMI (body-mass index) používaný v lékařském prostředí a zohledňující jak hmotnost, tak výšku pacienta.

Jde o odvozené hodnoty vypočtené z jiných sloupců, ale vždy pouze z hodnot v jednom řádku databázové tabulky.

Více viz: Hodnoty vypočtené výrazem

Hodnoty vypočtené vnořeným SQL dotazem

Za odvozené hodnoty je možné považovat i různé agregované údaje. Ty můžeme vypočítat jak ze samotné databázové tabulky, nad kterou provádíme analýzu, tak i z dalších (nějakým způsobem provázaných) databázových tabulek.

Příklad první agregované hodnoty může být pro každého hosta výpočet počtu dalších hostů, kteří ve stejný den přijeli ze stejného města. Příkladem druhého způsobu výpočtu může být zjištění vzdálenosti k nejbližší policejní stanici pro každý ze spáchaný zločinů na základě souřadnic místa zločinu v hlavní tabulce a souřadnic policejních stanic v tabulce druhé.

Více viz: Hodnoty vypočtené vnořeným SQL dotazem

Hodnoty vypočtené z geografických dat

Jsou-li součástí dat i geografické souřadnice bodu (např. místa nehody nebo trestného činu, bydliště hosta…), můžeme je využít pro výpočet dalšího typu odvozených hodnot počítaných na základě geografických relací jako např. „vzdálenost od místa nehody k nejbližší nemocnici“, „název (konkurenčního) hotelu, ke kterému má host nejblíže ze svého bydliště“ nebo „název gangu, v jehož teritoriu se zločin stal“.

Více viz: Hodnoty vypočtené z geografických dat

Hodnoty odvozené z analýzy hlavních komponent

Dalším typem odvozených sloupců jsou sloupce vzniklé představující jednotlivé hlavní komponenty jako výsledek analýzy hlavní komponent.

Více viz: Analýza hlavních komponent

Hodnoty odvozené z výsledků úloh

Konečně je možné vytvářet odvozené sloupce nad nalezenými vztahy.

Více viz: Hodnoty vypočtené z výsledků úloh DZD


Související témata:

Záložka s detaily o tabulce
Zobrazení hodnot v tabulce

Praktická ukázka: Demo Hotel: Výpočet odvozených hodnot

lmexplore/columnderived.txt · Poslední úprava: 2016/12/12 17:11 (upraveno mimo DokuWiki)