<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="de">
	<id>https://wiki-de.moshellshocker.dns64.de/index.php?action=history&amp;feed=atom&amp;title=Stemming</id>
	<title>Stemming - Versionsgeschichte</title>
	<link rel="self" type="application/atom+xml" href="https://wiki-de.moshellshocker.dns64.de/index.php?action=history&amp;feed=atom&amp;title=Stemming"/>
	<link rel="alternate" type="text/html" href="https://wiki-de.moshellshocker.dns64.de/index.php?title=Stemming&amp;action=history"/>
	<updated>2026-05-28T14:08:52Z</updated>
	<subtitle>Versionsgeschichte dieser Seite in Wikipedia (Deutsch) – Lokale Kopie</subtitle>
	<generator>MediaWiki 1.43.8</generator>
	<entry>
		<id>https://wiki-de.moshellshocker.dns64.de/index.php?title=Stemming&amp;diff=45574&amp;oldid=prev</id>
		<title>imported&gt;Aka: https, Kleinkram</title>
		<link rel="alternate" type="text/html" href="https://wiki-de.moshellshocker.dns64.de/index.php?title=Stemming&amp;diff=45574&amp;oldid=prev"/>
		<updated>2021-07-07T08:39:19Z</updated>

		<summary type="html">&lt;p&gt;https, Kleinkram&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Neue Seite&lt;/b&gt;&lt;/p&gt;&lt;div&gt;Als &amp;#039;&amp;#039;&amp;#039;Stemming&amp;#039;&amp;#039;&amp;#039; (&amp;#039;&amp;#039;&amp;#039;Stammformreduktion&amp;#039;&amp;#039;&amp;#039;, &amp;#039;&amp;#039;&amp;#039;Normalformenreduktion&amp;#039;&amp;#039;&amp;#039;) bezeichnet man im [[Information Retrieval]] sowie in der [[Computerlinguistik|linguistischen Informatik]] ein Verfahren, mit dem verschiedene [[Morphologie (Sprache)|morphologische]] Varianten eines [[Wort]]es auf ihren gemeinsamen [[Wortstamm]] zurückgeführt werden, z.&amp;amp;nbsp;B. die [[Deklination (Grammatik)|Deklination]] von &amp;#039;&amp;#039;Wortes&amp;#039;&amp;#039; oder &amp;#039;&amp;#039;Wörter&amp;#039;&amp;#039; zu &amp;#039;&amp;#039;Wort&amp;#039;&amp;#039; und [[Konjugation (Grammatik)|Konjugation]] von &amp;#039;&amp;#039;gesehen&amp;#039;&amp;#039; oder &amp;#039;&amp;#039;sah&amp;#039;&amp;#039; zu &amp;#039;&amp;#039;seh&amp;#039;&amp;#039;.&lt;br /&gt;
&lt;br /&gt;
== Geschichte ==&lt;br /&gt;
Im Jahr 1968 veröffentlichte [[Julie Beth Lovins]] (1945–2018) den ersten bekannten Stemming-Algorithmus.&amp;lt;ref&amp;gt;Julie Beth Lovins: &amp;#039;&amp;#039;Development of a stemming algorithm.&amp;#039;&amp;#039; In: &amp;#039;&amp;#039;Mechanical Translation and Computational Linguistics.&amp;#039;&amp;#039; Bd. 11, Nr. 2, Juni 1968, S. 22–31.&amp;lt;/ref&amp;gt; Dieser [[Algorithmus]] hatte einen großen Einfluss auf die weitere Entwicklung von Stemming-Algorithmen. Ein späterer Stemmer wurde 1980 von [[Martin Porter]] veröffentlicht.&amp;lt;ref&amp;gt;Martin Porter: &amp;#039;&amp;#039;An algorithm for suffix stripping.&amp;#039;&amp;#039; In: &amp;#039;&amp;#039;Program.&amp;#039;&amp;#039; Bd. 3, Nr. 14, Juli 1980, S. 130–137.&amp;lt;/ref&amp;gt; Dieser Stemmer wurde zum De-facto-Standard für das Stemming englischsprachiger Texte. Porter erhielt im Jahr 2000 den &amp;#039;&amp;#039;[[Tony Kent Strix Award]]&amp;#039;&amp;#039; für seine Arbeit auf dem Gebiet der Stemming-Algorithmen und des Information Retrievals.&lt;br /&gt;
&lt;br /&gt;
Es wurden viele Implementierungen des [[Porter-Stemmer-Algorithmus]] geschrieben und kostenlos verteilt, von denen viele jedoch kleine Fehler enthielten. Dies führte dazu, dass diese Stemmer niemals ihr volles Potenzial abschöpfen konnten. Um diese Fehlerquelle zu beseitigen, veröffentlichte Porter um das Jahr 2000 eine offizielle Implementierung des Algorithmus.&amp;lt;ref&amp;gt;[https://tartarus.org/martin/PorterStemmer/ Offizielle Implementierung des Porter-Stemmer-Algorithmus]&amp;lt;/ref&amp;gt; In den folgenden Jahren erweiterte er seine Arbeit, indem er mit [[Snowball (Programmiersprache)|Snowball]] ein Framework zum Schreiben von Stemming-Algorithmen schuf. Des Weiteren schuf er einen verbesserten Stemmer für die englische Sprache zusammen mit Stemmern für andere Sprachen.&lt;br /&gt;
&lt;br /&gt;
== Stemming-Verfahren ==&lt;br /&gt;
Zum Stemming gibt es verschiedene [[Algorithmus|Algorithmen]] für verschiedene Sprachen. Die Entwicklung eines Stemmers ist eine experimentelle Wissenschaft, da Algorithmen nicht verifiziert werden können, sondern erst an [[Textkorpus|Textkorpora]] und in der Praxis getestet werden müssen.&lt;br /&gt;
&lt;br /&gt;
Beispiele:&lt;br /&gt;
* [[Porter-Stemmer-Algorithmus]]&lt;br /&gt;
* [[KSTEM]] (Robert Krovetz: &amp;#039;&amp;#039;Viewing morphology as an inference process&amp;#039;&amp;#039;, 1993)&lt;br /&gt;
* [[N-Gramm]]-Verfahren&lt;br /&gt;
* [[lexikonbasiertes Stemming]] ([[Lemmatisierung]])&lt;br /&gt;
* [[korpusbasiertes Stemming]]&lt;br /&gt;
* statistische Verfahren&lt;br /&gt;
* [[Computerlinguistik|computerlinguistische]] Verfahren.&lt;br /&gt;
&lt;br /&gt;
Eine alternative, sehr viel einfachere und weniger genaue Möglichkeit ist die Suche nach Teil-Zeichenketten, z.&amp;amp;nbsp;B. mit dem [[Wildcard (Informatik)|Stern-Operator]]. Dies bezeichnet man auch als [[Trunkierung (Datenbank)|Trunkierung]].&lt;br /&gt;
&lt;br /&gt;
== Anmerkungen ==&lt;br /&gt;
Im Gegensatz zur Suche, beispielsweise mit [[Regulärer Ausdruck|regulären Ausdrücken]], die für Suche in großen Datenbeständen – z.&amp;amp;nbsp;B. [[Suchmaschine]]n – zu langsam wäre, wird eine Menge von Texten einmalig [[Indexierung|indexiert]], um später schnell durchsucht werden zu können.&lt;br /&gt;
&lt;br /&gt;
In einigen Sprachen spielt auch die Wortzerlegung und Zusammensetzung (&amp;#039;&amp;#039;lief weg&amp;#039;&amp;#039; → &amp;#039;&amp;#039;weglaufen&amp;#039;&amp;#039;) eine wichtige Rolle.&lt;br /&gt;
&lt;br /&gt;
== Siehe auch ==&lt;br /&gt;
* [[Indexierung]], [[Volltextindexierung]]&lt;br /&gt;
* [[Stoppwort]]&lt;br /&gt;
* [[Part-of-speech-Tagging]]&lt;br /&gt;
* [[Gemeinschaftliches Indexieren]] (Tagging)&lt;br /&gt;
&lt;br /&gt;
== Einzelnachweise ==&lt;br /&gt;
&amp;lt;references /&amp;gt;&lt;br /&gt;
&lt;br /&gt;
[[Kategorie:Dokumentation]]&lt;br /&gt;
[[Kategorie:Linguistische Morphologie]]&lt;br /&gt;
[[Kategorie:Computerlinguistik]]&lt;/div&gt;</summary>
		<author><name>imported&gt;Aka</name></author>
	</entry>
</feed>