imported>Boehm: typog

2026-04-25T00:14:00Z

typog

Neue Seite

'''Wahrscheinlich Annähernd Richtiges Lernen''' (WARL) oder englisch '''Probably approximately correct learning''' (PAC learning) ist ein [[Framework]] für das [[maschinelles Lernen|maschinelle Lernen]], das 1984 von [[Leslie Valiant]] in seinem Paper ''A theory of the learnable''<ref>{{Literatur |Autor=L. G. Valiant |Titel=A Theory of the Learnable |Sammelwerk=Communications of the ACM |Band=27(11) |Jahr=1984 |Seiten=1134-1142}}[https://web.mit.edu/6.435/www/Valiant84.pdf] (PDF; 806 kB).</ref>
eingeführt wurde.

In diesem Framework erhält die lernende Einheit Beispiele, die gemäß einer bestimmten [[Funktion (Mathematik)|Funktion]] klassifiziert sind. Das Ziel des Trainings ist es, mit großer [[Wahrscheinlichkeit]] eine Annäherung dieser Funktion zu finden. Man erwartet von der lernenden Einheit, das [[Begriff|Konzept]] mit einer beliebigen [[Annäherungsrate]], einer beliebigen [[Erfolgswahrscheinlichkeit]] und einer beliebigen [[Verteilung einer Zufallsvariablen|Verteilung]] der Beispiele zu lernen.

== Definition ==
Das PAC-Framework erlaubt eine genaue mathematische Analyse von [[Lernverfahren]]. <math>H</math> sei der endliche [[Hypothesenraum]].
<math>\epsilon</math> sei die gewünschte Genauigkeit des vom Lernverfahren erzeugten Klassifikators bei ungesehenen Daten.
<math>\delta</math> sei die Wahrscheinlichkeit, dass das Lernverfahren so einen Klassifikator nicht erzeugen kann.
Es gelte <math>0 < \epsilon < 0{,}5</math> und <math>0 < \delta < 0{,}5</math>. Einem konsistenten Lernverfahren reichen dann <math>m</math> [[Trainingsbeispiel]]e aus, um einen Klassifikator mit den Anforderungen von <math>\epsilon</math> und <math>\delta</math> zu lernen. Mit anderen Worten, <math>m</math> Trainingsbeispiele reichen aus, um mit der Wahrscheinlichkeit von <math>1-\delta</math> ein PAC-lernbares Problem so zu lernen, dass auf neuen Daten eine Fehlerrate von maximal <math>\epsilon</math> zu erhalten. Dabei muss die Laufzeit bis zur Ausgabe des Klassifikators polynomiell in <math>\tfrac{1}{\epsilon}, \tfrac{1}{\delta} </math> und <math>m</math> sein. Für <math>m</math> gilt dabei

:<math>m \geq \frac{1}{\epsilon}\left(\ln(|H|)+\ln\left(\frac{1}{\delta}\right)\right)</math>

== Herleitung ==
Die Abschätzung für <math>m</math> ist eng mit dem [[Versionsraum]] verbunden. Ein konsistentes Lernverfahren gibt definitionsgemäß eine [[Hypothese]] aus dem Versionsraum aus. Jede Hypothese im Versionsraum ist konsistent mit den Trainingsdaten, kann jedoch auf ungesehenen Daten Fehler machen.
Seien <math>h_1,\ldots,h_\ell</math> die Hypothesen, die einen echten Fehler mit Wahrscheinlichkeit größer <math>\epsilon</math> machen. So eine Hypothese ist mit Wahrscheinlichkeit <math>1-\epsilon</math> mit einem zufälligen Beispiel und mit Wahrscheinlichkeit <math>(1-\epsilon)^m</math> mit m Beispielen konsistent. Existiert mindestens eine solche Hypothese, dann ist sie Teil des Versionsraums und könnte von einem konsistenten Lernverfahren als Hypothese ausgegeben werden. Die Wahrscheinlichkeit, dass im Versionsraum eine solche Hypothese enthalten ist, ist nach oben beschränkt durch <math>\ell (1-\epsilon)^m</math>. Man benötigt eine Abschätzung in Abhängigkeit von der Anzahl an Trainingsbeispielen. Es gilt <math>\ell (1 - \epsilon)^m \leq |H|(1-\epsilon)^m \leq |H| e^{- \epsilon m}</math>. In mindestens <math>1-\delta</math> aller Fälle soll nach obiger Forderung keine Hypothese mit echtem Fehler größer als <math>\epsilon</math> im Versionsraum enthalten sein, d. h. <math>1-|H| e^{-\epsilon m} > 1-\delta</math>. Damit folgt <math>|H| e^{-\epsilon m} \leq \delta</math> und Auflösung nach m ergibt
:<math>m \geq \frac{1}{\epsilon}\left(\ln(|H|)+\ln\left(\frac{1}{\delta}\right)\right)</math>.

Die Abschätzung für die Anzahl benötigter Beispiele <math>m</math> ist meist sehr grob, und in der Praxis reichen weniger Beispiele aus. Dieses Modell wurde noch erweitert, um mit [[Störterm|Rauschen]], also falsch klassifizierten Beispielen, umgehen zu können.

== Einzelnachweise ==
<references/>

== Literatur ==
* {{Literatur|Autor=M. Kearns, U. Vazirani|Titel=An Introduction to Computational Learning Theory|Verlag=MIT Press|Jahr=1994|ISBN=0262111934}}
* {{Literatur|Autor=Tom M. Mitchell|Titel=Machine Learning|Verlag=McGraw-Hill Education|Jahr=1997|ISBN=0071154671}}

[[Kategorie:Maschinelles Lernen]]

Probably Approximately Correct Learning - Versionsgeschichte

imported>Boehm: typog