Uživatelské nástroje

Nástroje pro tento web


lmprepro:attribute:xcategory

Předzpracování dat s neúplnou informací

Vyskytují-li se v databázovém sloupci nevyplněné hodnoty (hodnoty typu NULL), je při automatickém vytváření kategorií vytvořena i tzv. X-kategorie. Ta slouží právě k označení nevyplněných hodnot v datech.

V praxi se však často setkáme s případy, kdy pro nevyplněné hodnoty byl použit nějaký kód nebo znak (například ‘?’ nebo ‘N/A’). Ten je třeba ručně označit, aby s ním bylo odpovídajícím způsobem zacházeno – to znamená přidat do X-kategorie. Do X-kategorie bývá vhodné přidat i hodnoty velmi odlehlé, resp. zjevně špatně zadané. V současné době se s X-kategorií pracuje v proceduře 4ft-Miner.

X-kategorie se přidává pomocí tlačítka Set na záložce [[:lmprepro:attribute|detailu atribut] a editovat její nastavení lze následně pomocí tlačítka X-Category.

Libovolnou kategorii v seznamu kategorií můžeme přeměnit na X-kategori pomocí tlačítka From list. To se hodí zejména v případě, že mezi „obyčejnými“ kategoriemi vytvořenými automaticky byla i hodnota reprezentující odpověď „nevím“, „neuvedeno“ atp.

Naopak zrušit existující X-kategorii můžeme tlačítkem Reset. Přesunout ji zpět do seznamu „obyčejných“ kategorií ji můžeme pomocí tlačítka Convert back.

lmprepro/attribute/xcategory.txt · Poslední úprava: 2015/06/30 18:10 (upraveno mimo DokuWiki)