Zum Inhalt springen

Simulierte Abkühlung

aus Wikipedia, der freien Enzyklopädie

Die simulierte Abkühlung ({{Modul:Vorlage:lang}} Modul:Vorlage:lang:103: attempt to index field 'wikibase' (a nil value), auch simuliertes Tempern oder simulierte Vergütung<ref>Raúl Rojas: Theorie der neuronalen Netze: eine systematische Einführung (= Springer-Lehrbuch). 4., korrigierter Nachdr Auflage. Springer, Berlin Heidelberg 1996, ISBN 978-3-540-56353-2.</ref> genannt) ist ein heuristisches Approximationsverfahren. Sie wird zum Auffinden einer Näherungslösung von Optimierungsproblemen eingesetzt, die durch ihre hohe Komplexität das vollständige Ausprobieren aller Möglichkeiten und mathematische Optimierungsverfahren ausschließen.

Grundidee ist die Nachbildung eines Abkühlungsprozesses, wie er etwa beim Glühen in der Metallurgie stattfindet: Nach dem Erhitzen eines Metalls sorgt die langsame Abkühlung dafür, dass die Atome ausreichend Zeit haben, sich zu ordnen und stabile Kristalle zu bilden. Dadurch wird ein energiearmer Zustand nahe am Optimum erreicht. Übertragen auf das Optimierungsverfahren entspricht die Temperatur einer Wahrscheinlichkeit, mit der sich ein Zwischenergebnis der Optimierung auch verschlechtern darf. Wie viele andere Lokale-Suche-Algorithmen kann das Verfahren dadurch ein lokales Optimum wieder verlassen, um ein besseres zu finden. Vom Metropolis-Algorithmus in Monte-Carlo-Simulationen unterscheidet sich das Verfahren durch das Absenken der Temperatur im Verlauf der Iteration.

Der Algorithmus wird beispielsweise beim Floorplanning im Laufe eines Chipentwurfs oder für die Standort- und Routenplanung verwendet.<ref>Bogatzki, A.: Fabrikplanung: Verfahren zur Optimierung von Maschinenaufstellung. Diss. Universität Wuppertal (1998). Roderer 1998. ISBN 978-3-89073-234-3</ref>

In den 1990er Jahren wurden Quantenversionen der simulierten Abkühlung (mit Tunnelung zwischen den Minima) eingeführt.<ref>T. Kadowaki, H. Nishimori, Quantum annealing in the transverse Ising model, Phys. Rev. E, Band 58, 1998, S. 5355</ref><ref>A. B. Finilla, M. A. Gomez, C. Sebenik, J. D. Doll, Quantum annealing: A new method for minimizing multidimensional functions, Chem. Phys. Lett., Band 219, 1994, S. 343</ref>

Motivation

Der Algorithmus der simulierten Abkühlung ist durch physikalische Überlegungen motiviert.<ref>JP Dr. A. Arnold, Universität Stuttgart, Institut für Computerphysik, Skript zur Vorlesung Physik auf dem Computer (PDF; 3,3 MB) S. 181 ff.</ref> Gesucht sei ein energetisch günstigster Zustand eines Systems, welches mithilfe der Boltzmann-Statistik beschrieben werden kann. Gemäß der Boltzmann-Statistik ist die Wahrscheinlichkeit, einen Mikrozustand mit Energie <math>\ge E_j</math> anzutreffen, gegeben durch die Wahrscheinlichkeitsverteilung

<math>p(E_j) \propto \exp \left( -\frac{E_j}{k_\mathrm B T} \right),</math>

wobei <math>k_\mathrm B</math> die Boltzmann-Konstante und <math>T</math> die Temperatur ist. Die Energie des energetisch günstigsten Zustandes sei <math>E_0</math>. Die obige Proportionalität bleibt bestehen bei Multiplikation mit einem von <math>E_j</math> unabhängigen Faktor:

<math>p(E_j) \propto \exp \left(- \frac{(E_j-E_0)}{k_\mathrm B T} \right) </math>

Da <math>E_0</math> der energetisch günstigste Zustand ist, gilt <math>E_j-E_0 \ge 0</math>. Weiterhin ist <math>k_\mathrm B>0</math> und <math>T > 0</math>. Somit ist der Exponent negativ, und mit abnehmender Temperatur wird sein Betrag größer, wodurch die Wahrscheinlichkeit sinkt, einen angeregten Energiezustand mit mindestens <math>E_j</math> zu finden. Senkt man somit die Temperatur des Systems langsam ab, so wird der energetisch günstigste Zustand mit immer größerer Wahrscheinlichkeit angetroffen.

Problemstellung

Gegeben sei der Lösungsraum <math>D</math>, eine Fitnessfunktion <math>f \colon D \rightarrow \mathbb{R}</math>, die jeder Lösung in <math>D</math> einen Wert zuweist, und ein Abbruchkriterium.

Gesucht ist eine approximative Lösung des globalen Minimums von <math>f</math> über <math>D</math>, also ein <math>x \in D</math> mit möglichst kleinem Wert <math>f(x)</math>. Sollte ein <math>x</math> mit möglichst großem Wert gesucht sein (Maximierungsproblem), kann man dies durch Negieren von <math>f</math> einfach auf den vorigen Fall zurückführen.

Außerdem wird ein Umgebungsbegriff <math>U \colon D \rightarrow \mathcal P(D)</math> benötigt (wobei <math>\mathcal P(D)</math> die Potenzmenge von <math>D</math> bezeichnet), um zu gegebenem <math>x \in D</math> eine benachbarte Lösung <math>y \in U(x)</math> zu erzeugen.

Algorithmus

  1. Initialisierung:
    • wähle eine Startlösung <math>x \in D</math>
    • setze <math>x_\mathrm{approx} = x</math>
    • wähle eine monoton gegen Null fallende Folge von positiven Temperaturwerten <math>(T_t)_{t \in \N}</math>
    • Setze <math>t = 0</math>
  2. lokale Veränderung:
    • wähle zu <math>x</math> einen Nachbarn <math>y \in U(x)</math> zufällig aus
  3. Selektion:
    • wenn <math>f(y) \le f(x)</math>, setze <math>x = y</math>
    • anderenfalls setze <math>x = y</math> nur mit Wahrscheinlichkeit <math>\exp \left( -\frac{f \left( y \right) - f \left( x \right)}{T_t} \right)</math>.
  4. Bisher beste Lösung aktualisieren:
    • wenn <math>f(x) < f(x_\text{approx})</math>, setze <math>x_\text{approx}=x</math>
  5. Inkrementiere:
    • setze <math>t = t+1</math>
  6. Abbruch oder weiter:

Erläuterungen

Die Wahrscheinlichkeit <math>\exp \left( -\frac{f (y) - f (x)}{T_t} \right)</math>, dass <math>x</math> durch ein schlechteres <math>y</math> ersetzt wird, ist umso kleiner, je größer die Verschlechterung <math>f(y) - f(x)</math> ist. Weil <math>T_t</math> eine monoton fallende Folge ist, nimmt die Wahrscheinlichkeit außerdem während eines Programmlaufs immer mehr ab. Das Verfahren verhält sich mit abnehmendem <math>T_t</math> mehr und mehr wie ein Bergsteigeralgorithmus.

Wie ein Nachbar <math>y \in U(x)</math> gewählt werden sollte, hängt von dem vorliegenden Problem ab. In der Informatik ist häufig der Wertebereich <math>D = \{0,1\}^n</math> und <math>x = (x_1, x_2, \dotsc, x_n)</math> wird als Bit-Vektor betrachtet. Ein Nachbar <math>y</math> von <math>x</math> kann dann z. B. durch das Flippen (Invertieren) von einem oder von wenigen Bits erzeugt werden (siehe Wegener 2005).

Es sind verschiedene Abbruchbedingungen denkbar. Zum Beispiel wird nur eine maximale Anzahl von Durchläufen erlaubt, eine ausreichende Fitness definiert, eine Untergrenze für die Abkühlung festgelegt oder eine Anzahl <math>t</math> von Zeitpunkten definiert, über die <math>x_\mathrm{approx}</math> sich nicht mehr geändert hat.

Graphische Verdeutlichung

Datei:SimAnnealingLandschaft.png
Graphische Darstellung einer Landschaft, in der ein globales Minimum gefunden werden soll.

Die Idee des simulierten Abkühlens kann man sich graphisch verdeutlichen.<ref>Google TechTalk Vortrag Eine kurze, aber sehr verständliche Erklärung zum Thema findet man ab Minute 35.</ref>

Angenommen, man sucht in einer zweidimensionalen Landschaft den (global) tiefsten Punkt. Die Landschaft selbst besteht aus vielen unterschiedlich tiefen Dellen. Die einfache Suchstrategie (suche den nächsten tiefsten Punkt) entspricht dem Verhalten einer Kugel, welche in dieser Landschaft ausgesetzt wird. Sie rollt zum nächsten lokalen Minimum und bleibt dort. Bei der simulierten Abkühlung wird der Kugel immer wieder ein Stoß versetzt, der mit zunehmender „Abkühlung“ schwächer wird. Dieser ist idealerweise stark genug, um die Kugel aus einer flachen Delle (lokales Minimum) zu entfernen, reicht aber nicht aus, um aus dem globalen Minimum zu fliehen.

Datei:Hill Climbing with Simulated Annealing.gif
Simulierte Abkühlung bei der Suche nach einem Maximum. Die zahlreichen lokalen Maxima werden durch die bei noch hoher „Temperatur“ starke Rausch-Bewegung der Temperatursimulation schnell wieder verlassen. Das globale Maximum wird aber zuverlässig gefunden, da der fallende „Temperatur“-Wert zum Ende nicht mehr ausreicht, es zu verlassen. Das erbringt bessere Resultate als ein einfacher Bergsteigeralgorithmus.

Siehe auch

Literatur

  • Ingo Wegener: Simulated Annealing Beats Metropolis in Combinatorial Optimization. In: Lecture Notes in Computer Science. Band 3580. Springer, Berlin/Heidelberg 2005, ISBN 978-3-540-27580-0, S. 589–601, doi:10.1007/11523468 (Für ein einfach zu beschreibendes Problem wird gezeigt, dass unabhängig von der Temperatur die simulierte Abkühlung effizienter ist als der Metropolisalgorithmus.).

Weblinks

Einzelnachweise

<references />