Rozhodovací stromy

Transkript

Rozhodovací stromy
Dobývání znalostí z databází
T9: genetické algoritmy
Evoluční algoritmy
Použítí evoluční principů, založených na metodách
optimalizace funkcí a umělé inteligenci, pro hledání
řešení nějaké úlohy.
Populace – množina jedinců, potenciálních řešení
Fitness function – hodnocení kvality jedince
Genetické operátory – selekce, křížení, mutace
Genetický algoritmus(fit,N,K,M)
Inicializace
1. přiřaď t:= 0 (počítadlo generací)
2. náhodně vytvoř populaci P(t) velikosti N
3. urči hodnoty funkce fit pro každého jedince v P(t)
Hlavní cyklus
1. dokud není splněna podmínka pro zastavení
1.1. proveď selekci:
1.1.1. vyber z P(t) jedince kteří se přímo přenesou do P(t+1)
1.2. proveď křížení:
1.2.1. vyber z P(t) jedince určené k reprodukci
1.2.2. aplikuj na každou dvojci [h1,h2] z výběru operaci křížení
1.2.3. zařaď potomky do P(t+1)
1.3. proveď mutaci:
1.3.1. vyber jedince z P(t+1) určené k mutaci
1.3.2. aplikuj na každé vybrané h operaci mutace
1.4. přiřaď t:= t + 1 (nová populace má opět velikost N)
1.5. spočítej pro každé h P(t) hodnotu fit(h)
2. vrať hypotézy h s nejvyšší hodnotu fit(h)
Podmínka zastavení
počet iterací
kvalita nejlepšího jedince v populaci
změna kvality nejlepšího jedince mezi iteracemi
P. Berka, 2011
1/8
Dobývání znalostí z databází
Selekce
(1 – K)
ruletové kolo
T9: genetické algoritmy
N jedinců přímo
pravděpodobnost, že bude vybrán jedinec h je úměrná poměru
fit(h)
,
i fit(hi)
pořadová selekce
nejprve jsou jedinci v populaci uspořádáni podle hodnoty fit, selekce se pak
provádí na základě pravděpodobnosti, která je úměrná pořadí jedince v tomto
uspořádání,
turnajová selekce
nejprve se náhodně vyberou dva jedinci, s předefinovanou pravděpodobností p se
pak vybere jedinec s vyšší hodnotou fit, s pravděpodobností 1-p se vybere jedinec
s nižší hodnotou fit.
Křížení
K N
dvojic
2
jednobodové
111010010
111000101
000100101
000110010
dvoubodové
Mutace
111010010
111000100
000100101
000110011
M N jedinců
111010010
P. Berka, 2011
111011010
2/8
Dobývání znalostí z databází
T9: genetické algoritmy
GA Demo (Obitko, 1998)
počáteční populace
selekce
P. Berka, 2011
3/8
Dobývání znalostí z databází
T9: genetické algoritmy
křížení
mutace
P. Berka, 2011
4/8
Dobývání znalostí z databází
T9: genetické algoritmy
GA pro učení se konceptům
paralelní náhodné prohledávání
GABIL (deJong, 1993)
Jedinci jsou pravidla:
If konto(nízké)
příjem(nízký)
If konto(vysoké)
then úvěr(ne)
then úvěr(ano)
100 10 01
001 11 10
zpřesnění základního algoritmu
1. funkce fit(h) je druhou mocninou správnosti klasifikace
fit(h) = (
a
)2,
a+b
2. počet jedinců v populaci je mezi 100 a 1000 v závislosti na
konkretní úloze,
3. parametr K vyjadřující podíl křížení má hodnotu 0.6,
4. parametr M vyjadřující podíl mutací má hodnotu 0.001,
5. použitý operátor křížení je rozšířením výše uvedeného
dvoubodového křížení; provedené rozšíření umožňuje
křížit řetězce různých délek,
6. mutace je použita tak, jak je uvedeno výše.
P. Berka, 2011
5/8
Dobývání znalostí z databází
T9: genetické algoritmy
GA jako součást jiných algoritmů učení
GA-CN4 (Bruha, Kralik, 1999) – algoritmus pokrývání
množin, pravidlo se generuje pomocí GA
procedure GA-CN4(T)
Let ListOfRules be an empty list
Until T is empty do
1. Let Cond be the best condition found by the genetic
algorithm
GA(T) for the given set T
2. If Cond is not nil then
Let T' T be examples covered by Cond
Let T become T \ T'
Add the rule If Cond then class is C to the end of
ListOfRules where C is the majority class in T'
enddo
Add the default rule If true then class is majority class to the
end of ListOfRules
Return ListOfRules
procedure GA(T)
Initialize randomly a new population
Until stopping condition is satisfied do
1. Select objects by tournament selection routine
2. Generate offsprings by two-point crossover procedure
3. Perform the bit mutation
4. Check whether each new object has the correct attribute
and class values (within their ranges);
if not the object's fitness is set to 0
enddo
Select the fittest object (rule)
If this objet is statistically significant then return this object
P. Berka, 2011
6/8
Dobývání znalostí z databází
T9: genetické algoritmy
GA jako nástroj pro optimalizaci parametrů
GA pro optimalizaci nastavení neuronové sítě
GA pro hledání topologie bayesovské sítě (Weka)
GA pro selekci atributů (Weka)
P. Berka, 2011
7/8
Dobývání znalostí z databází
T9: genetické algoritmy
Genetické programování
jedinci jsou funkce
+
sin
+
x
^
x
y
2
Stromová (prefixová) reprezentace funkce sin(x) + (x2+y)
Křížení dvou stromů
P. Berka, 2011
8/8

Podobné dokumenty

5.5 Evoluční algoritmy

5.5 Evoluční algoritmy tohoto řešení vyjádřená pomocí funkce fit (fitness function). V případě učení se konceptům je touto funkcí např. přesnost jedince (hypotézy) při klasifikaci, v případě hledání extrému nějaké funkce...

Více

slajdy - Sorry

slajdy - Sorry V případě uspořádaných pravidel (rozhodovacího seznamu) se hledají pravidla ke všem třídám najednou Algoritmus CN4 – rozhodovací seznam 1. nechť ListOfRules je prázdný seznam 2. dokud trénovací mno...

Více

Návod k instalaci a uvedení do provozu (česky)

Návod k instalaci a uvedení do provozu (česky) 1. Odstraňte kryt baterie a vložte baterie dodané spolu s výrobkem (2x AA LR6 alkalické baterie). nebo

Více

PLAY pin, tune, LED_mask (jen pro PICAXE řady M2)

PLAY pin, tune, LED_mask (jen pro PICAXE řady M2) Pin – konstanta, označující I/O kontakt. U osmipinových PICAXE je pevně určen vývod C.2. Tune – proměnná nebo konstanta, určující, která melodie se zahraje

Více

5.3 Rozhodovací pravidla

5.3 Rozhodovací pravidla dojít, protože pravidla mají přidělena pořadí použití.

Více

Návrh na zrušení části zákona č. 202/1990 Sb., o loteriích a jiných

Návrh na zrušení části zákona č. 202/1990 Sb., o loteriích a jiných Lokální loterijní systém (dále jen „LLS“) je vícemístné herní zařízení. Objektově je LLS 3 nábytkové kabinety, zapojené sériově. Každý kabinet je samostatně vybavený počítačovým hardwarem a softwar...

Více