<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="de">
	<id>https://wiki-de.moshellshocker.dns64.de/index.php?action=history&amp;feed=atom&amp;title=Porter-Stemmer-Algorithmus</id>
	<title>Porter-Stemmer-Algorithmus - Versionsgeschichte</title>
	<link rel="self" type="application/atom+xml" href="https://wiki-de.moshellshocker.dns64.de/index.php?action=history&amp;feed=atom&amp;title=Porter-Stemmer-Algorithmus"/>
	<link rel="alternate" type="text/html" href="https://wiki-de.moshellshocker.dns64.de/index.php?title=Porter-Stemmer-Algorithmus&amp;action=history"/>
	<updated>2026-05-31T12:39:26Z</updated>
	<subtitle>Versionsgeschichte dieser Seite in Wikipedia (Deutsch) – Lokale Kopie</subtitle>
	<generator>MediaWiki 1.43.8</generator>
	<entry>
		<id>https://wiki-de.moshellshocker.dns64.de/index.php?title=Porter-Stemmer-Algorithmus&amp;diff=45572&amp;oldid=prev</id>
		<title>imported&gt;Leyo: Punkt vor und nach Klammer</title>
		<link rel="alternate" type="text/html" href="https://wiki-de.moshellshocker.dns64.de/index.php?title=Porter-Stemmer-Algorithmus&amp;diff=45572&amp;oldid=prev"/>
		<updated>2024-05-01T07:01:49Z</updated>

		<summary type="html">&lt;p&gt;Punkt vor und nach Klammer&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Neue Seite&lt;/b&gt;&lt;/p&gt;&lt;div&gt;Der &amp;#039;&amp;#039;&amp;#039;Porter-Stemmer-Algorithmus&amp;#039;&amp;#039;&amp;#039; ist ein verbreiteter [[Algorithmus]] der [[Computerlinguistik]] zum automatischen Zurückführen von Wörtern auf ihren Wortstamm ([[Stemming]]). Der Algorithmus basiert auf einer Menge von Verkürzungsregeln, die so lange auf ein Wort angewandt werden, bis dieses eine Minimalanzahl von [[Silbe]]n aufweist. Der ursprünglich für Wörter der [[Englische Sprache|englischen Sprache]] entwickelte Algorithmus kann relativ leicht für andere Sprachen portiert werden.&lt;br /&gt;
&lt;br /&gt;
== Funktionsweise ==&lt;br /&gt;
=== Bestimmung der Silbenanzahl ===&lt;br /&gt;
Maßgeblich ist genaugenommen nicht die Anzahl der Silben, sondern die Anzahl der Vokal-Konsonant-Sequenzen. Jedes Wort lässt sich als eine Zeichenkette der Form &amp;lt;span style=&amp;quot;font-family:monospace;&amp;quot;&amp;gt;[C](VC)&amp;lt;sup&amp;gt;m&amp;lt;/sup&amp;gt;[V]&amp;lt;/span&amp;gt; interpretieren, wobei &amp;lt;span style=&amp;quot;font-family:monospace;&amp;quot;&amp;gt;C&amp;lt;/span&amp;gt; für eine Folge von einem oder mehreren Konsonanten und &amp;lt;span style=&amp;quot;font-family:monospace;&amp;quot;&amp;gt;V&amp;lt;/span&amp;gt; für eine Folge von einem oder mehreren Vokalen steht. Gemessen wird die Anzahl &amp;lt;span style=&amp;quot;font-family:monospace;&amp;quot;&amp;gt;m&amp;lt;/span&amp;gt; der Vokal-Konsonant-Sequenzen zwischen optional führenden Konsonanten und einer optionalen Folge von Vokalen am Ende.&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;Beispiele&amp;#039;&amp;#039;:&lt;br /&gt;
* tr-ee, t-o (m=0)&lt;br /&gt;
* w-&amp;#039;&amp;#039;&amp;#039;eb&amp;#039;&amp;#039;&amp;#039;, &amp;#039;&amp;#039;&amp;#039;ant&amp;#039;&amp;#039;&amp;#039; (m=1)&lt;br /&gt;
* b-&amp;#039;&amp;#039;&amp;#039;etw-een&amp;#039;&amp;#039;&amp;#039; (m=2)&lt;br /&gt;
* W-&amp;#039;&amp;#039;&amp;#039;ik-ip-ed&amp;#039;&amp;#039;&amp;#039;-ia (m=3)&lt;br /&gt;
&lt;br /&gt;
=== Verkürzungsregeln ===&lt;br /&gt;
Die Verkürzungsregeln bestehen aus Paaren von Bedingungen und Ableitungen für verschiedene [[Suffix]]e (Wortendungen). Die Regeln sind in Gruppen zusammengefasst, die nacheinander abgearbeitet werden. Aus jeder Gruppe darf nur eine Regel angewandt werden.&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;Beispiel&amp;#039;&amp;#039;:&lt;br /&gt;
Die erste Gruppe beinhaltet die Suffix-Verkürzungsregeln &amp;quot;sses&amp;quot; → &amp;quot;s&amp;quot;,  &amp;quot;ies&amp;quot; → &amp;quot;i&amp;quot; und &amp;quot;s&amp;quot; → &amp;quot;&amp;quot;, die beispielsweise zu den Ableitungen &amp;quot;librar&amp;#039;&amp;#039;&amp;#039;ies&amp;#039;&amp;#039;&amp;#039;&amp;quot; → &amp;quot;librari&amp;quot; und &amp;quot;Wiki&amp;#039;&amp;#039;&amp;#039;s&amp;#039;&amp;#039;&amp;#039;&amp;quot; → &amp;quot;Wiki&amp;quot; führen.&lt;br /&gt;
Eine später folgende Gruppe besteht aus der Regel &amp;quot;y&amp;quot; → &amp;quot;i&amp;quot;, so dass beispielsweise das Wort &amp;quot;librar&amp;#039;&amp;#039;&amp;#039;y&amp;#039;&amp;#039;&amp;#039;&amp;quot; auf den gleichen Stamm (&amp;quot;library&amp;quot; → &amp;quot;librari&amp;quot;) zurückgeführt wird.&lt;br /&gt;
&lt;br /&gt;
== Implementierungen ==&lt;br /&gt;
Auf der Webseite des Porter-Stemmer-Algorithmus finden sich Implementierungen in mehreren [[Programmiersprache]]n. Unter &amp;#039;&amp;#039;snowballstem.org&amp;#039;&amp;#039; befindet sich die von Martin Porter entwickelte Zeichenkettenverarbeitungssprache &amp;quot;Snowball&amp;quot;, mit deren Hilfe Porter-Stemmer beschrieben werden können. Dort findet man auch einen Porter-Stemmer für die deutsche Sprache.&amp;lt;ref&amp;gt;{{Internetquelle |autor=Martin Porter |url=https://snowballstem.org/ |titel=Snowball: A language for stemming algorithms |werk= |hrsg= |datum= |zugriff=2019-02-11 |sprache=en}}&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
== Anmerkungen ==&lt;br /&gt;
Die aus einem Wort abgeleiteten Stämme entsprechen oft nicht den linguistisch korrekten Wortstämmen. Da das Ziel des Stemmings jedoch keine linguistische Analyse ist, sondern verwandte Worte auf ein und dieselbe Zeichenkette zurückgeführt werden sollen, spielt dies keine Rolle.&lt;br /&gt;
&lt;br /&gt;
Wie praktisch alle Stemming-Algorithmen arbeitet auch der Porter-Stemmer nicht mit hundertprozentiger Genauigkeit, so dass es bei einigen Worten vorkommen kann, dass zu viel (&amp;#039;&amp;#039;Overstemming&amp;#039;&amp;#039;) oder zu wenig (&amp;#039;&amp;#039;Understemming&amp;#039;&amp;#039;) abgeschnitten wird. In der Praxis ist er jedoch ausreichend gut (siehe auch weitere Hintergrundinformationen zum Thema im Artikel [[Stemming]]).&lt;br /&gt;
&lt;br /&gt;
== Literatur ==&lt;br /&gt;
* M.F. Porter: &amp;#039;&amp;#039;An algorithm for suffix stripping&amp;#039;&amp;#039;. In: Program, 14(3), S. 130–137, Juli 1980&lt;br /&gt;
&lt;br /&gt;
== Weblinks ==&lt;br /&gt;
* [https://tartarus.org/martin/PorterStemmer/ The Porter Stemming Algorithm] – Martin Porters Webseite zum Porter-Stemming-Algorithmus&lt;br /&gt;
&lt;br /&gt;
== Einzelnachweise ==&lt;br /&gt;
&amp;lt;references /&amp;gt;&lt;br /&gt;
&lt;br /&gt;
[[Kategorie:Algorithmus]]&lt;br /&gt;
[[Kategorie:Computerlinguistik]]&lt;/div&gt;</summary>
		<author><name>imported&gt;Leyo</name></author>
	</entry>
</feed>