Začínáme
Systém LISp-Miner a proces DZD
Analytické procedury
Pokročilé funkce
Výzkum a vývoj
Začínáme
Systém LISp-Miner a proces DZD
Analytické procedury
Pokročilé funkce
Výzkum a vývoj
Po zadání úlohy a případné kontrola zadání můžeme spusit výpočet.
Výpočet úlohy spustíme jedním z tlačítek v levém dolním rohu záložky s detaily zadání úlohy. Implementovány jsou tři způsobu výpočtu – interaktivní výpočet (tlačítko Run
); výpočet na pozadí (tlačítko Bkgrnd Run
); a vzdálený výpočet na gridu (tlačítko Grid Run
).
Doba výpočtu závisí na velikosti dat a použitém způsobu výpočtu, ale zejména složitosti zadání úlohy a použitých typech koeficientů.
Před vlastním výpočtem je spuštěna kontrola zadání. Výpočet úlohy neproběhne, pokud jsou v zadání úlohy nějaké chyby. První z nalezených chyb se zobrazí v rámečku s informacemi o výpočtu.
Jde-li o opětovné spuštění výpočtu úlohy, pro kterou již byly nalezeny nějaké výsledky, musí být tyto před novým výpočtem smazány.
Smazáním výsledků se ztratí i ruční rozdělení nalezených hypotéz do skupin hypotéz. Skupiny samotné však zůstanou zachovány a po novém výpočtu je možné do nich hypotézy opět vložit. Zároveň jsou před opětovným výpočtem zavřeny všechny záložky s detaily hypotéz a případně další záložky týkající se výsledků této úlohy (např. záložka s rozhodovacími pravidly vytvořenými z rozhodovacího stromu v proceduře ETree-Miner).
I z výše uvedených důvodů je před opětovným spuštěním výpočtu nad stejnou úlohou vhodné zvážit, zda není lepší vyklonovat nejprve její kopii, požadované změny zadání provést v této kopii a spustit výpočet. Pokud se však přesto rozhodneme znovu spustit výpočet původní úlohy, objeví se nejprve dialogové okno s upozorněním, že dojde ke smazání stávajících výsledků, a s dotazem, jestli chceme ve výpočtu opravdu pokračovat.
V současné době jsou k dispozici tři způsoby výpočtu: interaktivně, na pozadí a vzdálený výpočet.
Zvolený způsob výpočtu se objevuje i na záložce Task Settings v rámečku s informacemi o průběhu výpočtu
Tlačítko Run
spustí výpočet, jehož průběh můžeme sledovat přímo v modulu LM Workspace a případně jej můžeme přerušit. Nevýhodou je, že po dobu výpočtu nemůžeme s modulem jinak pracovat (a třeba prohlížet již nalezené výsledky pro aktuálně počítanou úlohu). Zároveň je pro výpočet použito pouze jedno jádro procesoru, a tak bude výpočet trvat déle.
Průběh výpočtu zobrazuje dialogové okno. Informace o celkovém pokroku generování v levém horním rohu jsou velmi přibližné. Je to dáno povahou použitého algoritmu procházení stavového prostoru, který je sekvenční a zároveň optimalizovaný podle konkrétních hodnot v datech. Proto není dopředu možné zjistit celkový čas výpočtu, a tím ani aktuální pozici.
Lepší představu o aktuální pozici výpočtu získáme z tvaru cedentu vypisovaného v rámečku Actual step
. Varianty cedentů se procházejí v pořadí podle zadání úlohy a do hloubky. Výpočet se blíží ke konci, když se začnou objevovat literály s názvy atributů z dolní části seznamu na záložce s s detaily zadání úlohy. S blížícím se koncem se obvykle také budou literály rychleji obměňovat. V seznamu na pravé straně postupně přibývají řádky, jak výpočet úlohy postupuje od prvotní kontroly zadání, přes inicializaci až po samotné generování a verifikaci hypotéz.
Důležitým údajem o průběhu generování je počet provedených verifikací, a zejména pak počet už nalezených hypotéz. Roste-li počet nalezených hypotéz příliš rychle, bude patrně potřeba upravit zadání úlohy. Podobně tomu bude, když se počet hypotéz stále drží na nule. V těchto případech můžeme výpočet úlohy přerušit.
Výpočet můžeme přerušit tlačítkem Cancel
v levém dolním rohu dialogového okna. K přerušení výpočtu dojde také automaticky po dosažení limitu hypotéz v zadání úlohy. I v případě, že výpočet byl přerušen, jsou všechny již nalezené hypotézy zobrazeny v seznamu hypotéz na záložce Task Results.
Tlačítko Bkgrnd Run
spustí výpočet úlohy na pozadí. Pro tento účel je spuštěn samostatný modul LM ProcPooler. Výhodou výpočtu na pozadí je možnost pokračování v práci s modulem LM Workspace a třeba i prohlížení již nalezených hypotéz v aktuálně generované úloze.
Další výhodou je, že generování na pozadí využívá více procesorových jader (v počtu daném uživatelským parametrem. To může výrazně zrychlit výpočet úlohy. Konečně je výhodou, že takto na pozadí můžeme spustit najednou úloh více. Úlohy se umístí do fronty a spočteny budou postupně, jak se uvolní jednotlivá procesorová jádra. Na druhou stranu je třeba počítat s tím, že doba odezvy počítače v jiných spuštěných aplikacích se může zhoršit.
Na modul LM ProcPooler můžeme přepnout (jako na jakoukoliv jinou aplikaci v systému MS Windows) a získat přehled o průběhu výpočtu aktuálně zpracovávané úlohy i o úlohách čekajících ve frontě.
Před získáním zkušeností se zadáváním úloh doporučujeme používat spíše interaktivní výpočet úloh. Rozhodně není vhodné spustit „bez rozmyslu“ výpočet na pozadí velkého množství úloh. Dlouhé doby řešení budou zpočátku totiž způsobené spíše nevhodným zadáním, než složitostí úlohy. Až v případě, že jsme si správností zadání jisti a jde o úlohu s očekávanou delší dobou výpočtu, použijeme výpočet na pozadí.
Tlačítko Grid Run
spustí vzdálený výpočet úlohy na počítačovém gridu. Princip je stejný jako u výpočtu na pozadí s tím, že výpočet úlohy je navíc odeslán na server a následně počítán na vzdálených počítačích tvořících uzly gridu. Nedochází tak k zatěžování počítače, na kterém je spuštěn modul LM Workspace. Přístup na grid musí být nainstalován zvlášť a je pouze pro uživatele s přiděleným oprávněním.
Záložka obsahuje informace o průběhu výpočtu úlohy. Význam má zejména v analytické proceduře ETree-Miner, kde zobrazuje údaje o testování vytvořeného rozhodovacího stromu.
Záložka se otevře automaticky po úspěšném skončení výpočtu úlohy. Byla-li už otevřena s informací o průběhu předchozího výpočtu úlohy, jsou informace na ni nahrazeny průběhem posledního výpočtu. Při ukončení modulu LM Workspace se záložka zavře (po jeho opětovném spouštění už není k dispozici).
Související témata: