Meta-data

Transkript

Meta-data
Meta-optimization
for combinatorial problems
Oleg Kovářík
[email protected]
SUI 31.3.2011
Computational Intelligence Group
Faculty of Electrical Engineering
Faculty of Information Technology
Czech Technical University in Prague
http://cig.felk.cvut.cz
Content


Part 1: Combinatorial optimization

TSP and improvements

Algorithm combination
Part 2: Meta-optimization

TSP Meta-data extraction

on-line database

GPTSP: evolving data
Part 1: Combinatorial optimization
Combinatorial optimization


NP-complete problems

TSP - Traveling Salesman Problem

SAT - Boolean Satisfiability Problem

JSP - Job-shop Problem

QAP - Quadratic Assignment Problem

...
Algorithms

Exact

Heuristics

Local search algorithms
Computational
Intelligence
Group
Seminář strojového učení a modelování | 31.3.2011
Oleg Kovářík | [email protected] | http://kovarik.felk.cvut.cz/pheromone/
Traveling Salesman Problem (TSP)



Find shortest possible tour that visits each city from
given set exactly once.
Exact algorithms

Branch & Bound, solution of LP relaxation, ...

Best: Concorde http://www.tsp.gatech.edu/concorde.html
Heuristics


Local search algorithms


Simulate Annealing, Evolutionary Algorithms, Tabu Search,
GRASP, Ant Colony Optimization, … often combined with
2-OPT, 3-OPT, k-OPT, Lin-Kernighan (best), …
Construction heuristics
Computational
Intelligence
Group
Seminář strojového učení a modelování | 31.3.2011
Oleg Kovářík | [email protected] | http://kovarik.felk.cvut.cz/pheromone/
Problems

Exact algorithms: non-standard (dynamic) problems,
very large instances, complicated

Local search: is local

Heuristics: many possibilities


All: parameters, different implementations,
unknown performance for given data
Improvements: adaptivity, parallelization,
combination of various algorithms
Computational
Intelligence
Group
Seminář strojového učení a modelování | 31.3.2011
Oleg Kovářík | [email protected] | http://kovarik.felk.cvut.cz/pheromone/
Previous improvements

Ant Colony Optimization with Castes


Ant Colony Optimization with Parallel Subsolutions
Heuristic (2008)


diversification of parameters inside one algorithm
decomposition & parallelization on PS3
described in previous presentation
Computational
Intelligence
Group
Seminář strojového učení a modelování | 31.3.2011
Oleg Kovářík | [email protected] | http://kovarik.felk.cvut.cz/pheromone/
Algorithm combination - serial

switching

by ants
Computational
Intelligence
Group
Seminář strojového učení a modelování | 31.3.2011
Oleg Kovářík | [email protected] | http://kovarik.felk.cvut.cz/pheromone/
Algorithm combination - parallel

Ant Colony Optimization

probabilistic representation of solution space - pheromone
pheromone
Computational
Intelligence
Group
best solution
Seminář strojového učení a modelování | 31.3.2011
Oleg Kovářík | [email protected] | http://kovarik.felk.cvut.cz/pheromone/
Algorithm combination - parallel

exchanges (ants on TSP)
3 instances of
solution space
representations
4 algorithms
working with
representations
Computational
Intelligence
Group
Seminář strojového učení a modelování | 31.3.2011
Oleg Kovářík | [email protected] | http://kovarik.felk.cvut.cz/pheromone/
Parallel combination - example

Kovářík, Skrbek. Simulation of Ant Colonies with Hints Generated by
Parallel Heuristics, Eurosim 2010
pheromone – probability of each edge to be present in good solution
Main
ant algorithm
pheromone matrix
Intersection of solutions
from 4 Simulated Annealing algorithms
similar to ”tour merging”
Computational
Intelligence
Group
Seminář strojového učení a modelování | 31.3.2011
Oleg Kovářík | [email protected] | http://kovarik.felk.cvut.cz/pheromone/
Parallel combination - example

only for random distance matrix instances

only in limited time interval
Computational
Intelligence
Group
Seminář strojového učení a modelování | 31.3.2011
Oleg Kovářík | [email protected] | http://kovarik.felk.cvut.cz/pheromone/
How to improve results?

find best performing algorithm



can be temporarily achieved e.g. by new speed-up
technique
difficulties on theoretic level: No Free Lunch Theorem for
Search/Optimization (Wolpert and Macready 1997)
specialization

learn from previous experiments

recommend optimization settings
Computational
Intelligence
Group
Seminář strojového učení a modelování | 31.3.2011
Oleg Kovářík | [email protected] | http://kovarik.felk.cvut.cz/pheromone/
Part 2: Meta-optimization
Meta-learning

Meta-learning: Automatic learning from meta-data

Meta-data:


data about experiments

characteristics of data
Target: improving results of learning algorithms
Computational
Intelligence
Group
Seminář strojového učení a modelování | 31.3.2011
Oleg Kovářík | [email protected] | http://kovarik.felk.cvut.cz/pheromone/
Meta-optimization


Meta-learning applied to optimization
problems/experiments
Target: for given data recommend

algorithm

parameters

combination of algorithms

strategy of data exchange
Computational
Intelligence
Group
Seminář strojového učení a modelování | 31.3.2011
Oleg Kovářík | [email protected] | http://kovarik.felk.cvut.cz/pheromone/
Meta-data


static

e.g. statistical descriptors of input or results

helps decide what to do with given data
dynamic

information from optimization in progress

helps decide how to adjust optimization
Computational
Intelligence
Group

parameter adjustment

switch to more suitable algorithm

stop optimization
Seminář strojového učení a modelování | 31.3.2011
Oleg Kovářík | [email protected] | http://kovarik.felk.cvut.cz/pheromone/
Meta-data: TSP

Features available for TSP (general + Euclidean)

size

symmetric, geometric

average & std. deviation of edge lengths

edge length diversity

nearest neighbor distance, direction distribution

analytic & empiric lower bounds

max & min edge length, diameter

Held-Karp Lower Bound estimate and its estimate

construction heuristics (e.g. greedy) solution length

results of heuristics with fast configuration sampled after 10s

determinant of distance matrix

height/width ratio

...
Computational
Intelligence
Group
Seminář strojového učení a modelování | 31.3.2011
Oleg Kovářík | [email protected] | http://kovarik.felk.cvut.cz/pheromone/
TSP can vary in city distribution

City distribution can be uniform vs. clustered
Computational
Intelligence
Group
Seminář strojového učení a modelování | 31.3.2011
Oleg Kovářík | [email protected] | http://kovarik.felk.cvut.cz/pheromone/
TSP can vary in distance distribution

Distance matrix can be euclidean or random
Histograms of city distances (20 nearest neighbors)
Random euclidian instance
Computational
Intelligence
Group
Random instance
(random matrix)
Seminář strojového učení a modelování | 31.3.2011
Oleg Kovářík | [email protected] | http://kovarik.felk.cvut.cz/pheromone/
Meta-data extraction

Perform automatic experiments to fill database
Computational
Intelligence
Group
Seminář strojového učení a modelování | 31.3.2011
Oleg Kovářík | [email protected] | http://kovarik.felk.cvut.cz/pheromone/
On-line TSP meta-data

http://kovarik.felk.cvut.cz/pheromone/data.php
live
livedemo...
demo...
“easy”
“easy”problem
problemsize
size
Computational
Intelligence
Group
Seminář strojového učení a modelování | 31.3.2011
Oleg Kovářík | [email protected] | http://kovarik.felk.cvut.cz/pheromone/
On-line TSP heuristics results
live
livedemo...
demo...
ants
on
ants onDIMACS
DIMACS“M”
“M”instances
instances
Computational
Intelligence
Group
Seminář strojového učení a modelování | 31.3.2011
Oleg Kovářík | [email protected] | http://kovarik.felk.cvut.cz/pheromone/
Further development


Automatic experimenter
Generate experiment configurations from
descriptions of parameters

Target: automatic meta-data collection

General task, will be applied in our other projects:

Continuous optimization

FAKE GAME – heterogeneous inductive neural network

Data preprocessing framework
Computational
Intelligence
Group
Seminář strojového učení a modelování | 31.3.2011
Oleg Kovářík | [email protected] | http://kovarik.felk.cvut.cz/pheromone/
Meta-data usage: quick view

correlation matrix
Computational
Intelligence
Group
Seminář strojového učení a modelování | 31.3.2011
Oleg Kovářík | [email protected] | http://kovarik.felk.cvut.cz/pheromone/
Meta-data usage: extracting rules

Smith-Miles BAO2010


SOM for meta-data
Decision trees (C4.5) for classification to classes Easy and
Hard for 2 algorithms
Computational
Intelligence
Group
Seminář strojového učení a modelování | 31.3.2011
Oleg Kovářík | [email protected] | http://kovarik.felk.cvut.cz/pheromone/
Diversity is necessary


Combining algorithms make sense only for set of algorithms
which differ in exploration/exploitation strategy
Benchmark data with low number of instances (TSPLIB, VLSI,
WORLD) or only simple artificial data (DIMACS)
=> evolve data to examine differences between algorithms and
generate large number of instances for meta-data mining
Computational
Intelligence
Group
Seminář strojového učení a modelování | 31.3.2011
Oleg Kovářík | [email protected] | http://kovarik.felk.cvut.cz/pheromone/
GPTSP: evolving interesting data

Genetic Programming (Jan Drchal @ FEE CTU)

evolve 2D functions = probability density functions for cities

fitness average difference of results for 2 algorithms –
competition
Greedy vs. Simulated Annealing champion
z = (((-1) + exp(-exp(-((y-1.84073)-sin((x+x))).^2).^2))*-1)
Computational
Intelligence
Group
Seminář strojového učení a modelování | 31.3.2011
Oleg Kovářík | [email protected] | http://kovarik.felk.cvut.cz/pheromone/
GPTSP: other evolved examples
Computational
Intelligence
Group
Seminář strojového učení a modelování | 31.3.2011
Oleg Kovářík | [email protected] | http://kovarik.felk.cvut.cz/pheromone/
Visualizing solution space

continuous optimization


combinatorial optimization


direct visualization or dimension reduction techniques
large neighborhoods, visualization problematic
indirect visualization

sample random solutions

examine distribution of solution quality
Computational
Intelligence
Group
Seminář strojového učení a modelování | 31.3.2011
Oleg Kovářík | [email protected] | http://kovarik.felk.cvut.cz/pheromone/
Visualizing solution space
live
livedemo...
demo...
Computational
Intelligence
Group
Seminář strojového učení a modelování | 31.3.2011
Oleg Kovářík | [email protected] | http://kovarik.felk.cvut.cz/pheromone/
Distribution of solutions


For random geometric instances: Rayleigh
distribution (Gremlich et al. 2006)
404 paper
Computational
Intelligence
Group
Seminář strojového učení a modelování | 31.3.2011
Oleg Kovářík | [email protected] | http://kovarik.felk.cvut.cz/pheromone/
Usage of distribution info

more meta-data

prediction of optima,
possibly useful for setting
bounds for branch&bound

comparison of algorithms
Computational
Intelligence
Group
Seminář strojového učení a modelování | 31.3.2011
Oleg Kovářík | [email protected] | http://kovarik.felk.cvut.cz/pheromone/
GPTSP meta-data ranking example

Greedy algorithm vs. Simulated Annealing

Weka: CfsSubsetEval – Exhaustive


Selected attributes: edgeNormStdDev, diameterMin,
diameterMax, distNormMax
Weka: GainRatioAttributeEval – Ranker
Computational
Intelligence
Group
Seminář strojového učení a modelování | 31.3.2011
Oleg Kovářík | [email protected] | http://kovarik.felk.cvut.cz/pheromone/
GPTSP meta-data
greedy ~ simulated annealing
Computational
Intelligence
Group
greedy > simulated annealing
Seminář strojového učení a modelování | 31.3.2011
Oleg Kovářík | [email protected] | http://kovarik.felk.cvut.cz/pheromone/
GPTSP meta-data
correlations
greedy ~ simulated annealing
Computational
Intelligence
Group
greedy > simulated annealing
Seminář strojového učení a modelování | 31.3.2011
Oleg Kovářík | [email protected] | http://kovarik.felk.cvut.cz/pheromone/
GPTSP meta-data trees & rules

Weka:
J48graft pruned tree
Single conjunctive
rule learner:
(edgeNormStdDev <= 5.779428)
and (diameterMin <= 42.134596)
and (avgEdge > 3811)
=> difference = '(-inf-9146.5]'
Computational
Intelligence
Group
'(9146.5-inf)' (233.0/65.0)
Seminář strojového učení a modelování | 31.3.2011
Oleg Kovářík | [email protected] | http://kovarik.felk.cvut.cz/pheromone/
Conclusion



Large amount of Ad-hoc experiments/comparisons
for new algorithms – not very useful
We need automatic experimenter to explore
performance of algorithms/implementations
We want to collect meta-data and use them to
improve future optimization by specialization
Computational
Intelligence
Group
Seminář strojového učení a modelování | 31.3.2011
Oleg Kovářík | [email protected] | http://kovarik.felk.cvut.cz/pheromone/
Conclusion - Goal of project

Framework for combinatorial optimization

JCOP (general) - http://jcop.sourceforge.net/

Pheromone (TSP) - http://kovarik.felk.cvut.cz/pheromone

Module for automatic meta-data extraction

Rules extraction =>

algorithm recommendation

parameter recommendation

serial/parallel algorithm combination scenarios
recommendation
Computational
Intelligence
Group
Seminář strojového učení a modelování | 31.3.2011
Oleg Kovářík | [email protected] | http://kovarik.felk.cvut.cz/pheromone/
Thank you
http://kovarik.felk.cvut.cz/pheromone

Podobné dokumenty

03 Dell SonicWall a priklady praktickeho nasazeni

03 Dell SonicWall a priklady praktickeho nasazeni Zabezpečení – vynucení antiviru na klientovi • Kontrola přítomnosti antiviru na klientovi • Kontrola verze antiviru na klientovi • Povolení/Blokace komunikace ven • Sken – ondemand/schedule • Repo...

Více

SAT - České vysoké učení technické v Praze

SAT - České vysoké učení technické v Praze je nesplnitelná. Pro praxi je to zcela dostačující. Nabízí se však myšleka implementovat algoritmus, který by generoval vektor ohodnocení obsahující i neúplně určené stavy (tzv. don’t cares). Navrh...

Více

Automatický generátor testovac´ıch vektor˚u (ATPG) zalozený na

Automatický generátor testovac´ıch vektor˚u (ATPG) zalozený na S výrobou stále složitějšı́ch čı́slicových obvodů je stále obtı́žnějšı́ nalézt rychlý a efektivnı́ způsob testovánı́ vyráběných součástek. Doba testu a jeho schopnost odhalit n...

Více

Experimentální analýza algoritmů je empirickým protějškem

Experimentální analýza algoritmů je empirickým protějškem C. Demetrescu, G. F. Italiano: What do we learn from Experimental algorithmics?, in Proc. MFCS 2000, LNCS 1893, 36 – 51 http://www.springerlink.com/content/yj370kk82q958drx/fulltext.pdf Obsah: pře...

Více

Metropolitní policie Londýn

Metropolitní policie Londýn osmdesát osm seržantů a osm set devadesát pět strážníků

Více