Začínáme
Systém LISp-Miner a proces DZD
Analytické procedury
Pokročilé funkce
Výzkum a vývoj
Začínáme
Systém LISp-Miner a proces DZD
Analytické procedury
Pokročilé funkce
Výzkum a vývoj
Součástí dat bývají často i geografické souřadnice bodu (např. místa nehody nebo trestného činu, bydliště hosta…). Ty můžeme využít pro výpočet dalšího typu odvozených hodnot počítaných na základě geografických relací – např. „vzdálenost od místa nehody k nejbližší nemocnici“, „název (konkurenčního) hotelu, ke kterému má host nejblíže ze svého bydliště“ nebo „název gangu, v jehož teritoriu se zločin stal“.
Kromě souřadnic v datech budeme potřebovat ještě soubor s definicí zájmových bodů nebo hranic oblastí.
Pozor! Odvozené hodnoty vypočtené z geografických dat byly do systému LISp-Miner přidány zejména pro potřeby výuky a pro vyzkoušení možností jejich vyžití při analýze (výukových) dat. V případě analýzy rozsáhlých reálných dat je z hlediska časové náročnosti výpočtu nutné použít vhodný databázový systém (DBMS) a tento typ odvozenýcgh hodnot počítat přímo v něm.
V současné době je možné vybírat ze tří typů geografických relací:
NULL
.
Odvozený sloupec vypočtený z geografických dat přidáme tlačítkem Add geo
.
Nejprve je třeba zadat výstižný název nově přidávaného sloupce – ten musí být unikátní v rámci databázové tabulky.
Následně zvolíme typ geografické relace, který se má pro tento odvozený sloupec počítat (viz Typy odvozených hodnot z geografických dat).
Pro výpočet vzdálenosti je třeba zvolit vhodný způsob podle použitého souřadnicového systému:
Pak vybereme sloupce v analyzovaných datech, které reprezentují souřadnice bodu (nejprve pro x-ovou souřadnici, následně pro y-ovou).
Konečně je třeba zadat cestu k souboru s vektorovou definicí bodů (resp. hranic oblastí) a jejich názvy. Pro snazší vyhledání souboru můžeme použít tlačítko Browse
.
Po stisku tlačítka Ok
se objeví záložka s detaily o databázovém sloupci. Oproti sloupcům existujících přímo v databázi obsahuje tato i souřadnice a název souboru, ze kterých jsou hodnoty v odvozeném sloupci vypočteny. Zadání odvozeného sloupce je možné upravovat po stisku tlačítka Edit
. Funkčnost záložky i další zacházení s odvozenými sloupci je však zcela shodné jako v případě původních databázových sloupců.
V seznamu sloupců databázové tabulky bude odvozený sloupec označen typem Geo.
V současné době jsou pro definici bodů/hranic oblastí podporovány pouze soubory ve formátu KML.
V případě relací „Vzdálenost k nejbližšímu bodu“ a „Název nejbližšího bodu“ musí být v souboru nadefinován alespoň jeden pojmenovaný bod. Obvykle však bude bodů více.
V případě relace „Bod v oblasti“ musí být v souboru nadefinován alespoň jeden pojmenovaný polygon představující hranice oblasti. Obvykle však bude polygonů více. V případě, že se polygony budou překrývat (nebo budou uvnitř jiného), bude vrácen název prvního z polygonů, do kterého bod patří.
Datový typ odvozeného sloupce je automaticky nastaven na Text
, protože se vrací název oblasti.
Související témata:
Odvozené hodnoty
Záložka s detaily o tabulce
Zobrazení hodnot v tabulce
Praktická ukázka: Demo Hotel: Výpočet odvozených hodnot