<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="de">
	<id>https://wiki-de.moshellshocker.dns64.de/index.php?action=history&amp;feed=atom&amp;title=Stoppwort</id>
	<title>Stoppwort - Versionsgeschichte</title>
	<link rel="self" type="application/atom+xml" href="https://wiki-de.moshellshocker.dns64.de/index.php?action=history&amp;feed=atom&amp;title=Stoppwort"/>
	<link rel="alternate" type="text/html" href="https://wiki-de.moshellshocker.dns64.de/index.php?title=Stoppwort&amp;action=history"/>
	<updated>2026-06-02T15:14:11Z</updated>
	<subtitle>Versionsgeschichte dieser Seite in Wikipedia (Deutsch) – Lokale Kopie</subtitle>
	<generator>MediaWiki 1.43.8</generator>
	<entry>
		<id>https://wiki-de.moshellshocker.dns64.de/index.php?title=Stoppwort&amp;diff=51376&amp;oldid=prev</id>
		<title>imported&gt;Alazon: Redundanz erl.</title>
		<link rel="alternate" type="text/html" href="https://wiki-de.moshellshocker.dns64.de/index.php?title=Stoppwort&amp;diff=51376&amp;oldid=prev"/>
		<updated>2024-08-29T15:21:04Z</updated>

		<summary type="html">&lt;p&gt;Redundanz erl.&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Neue Seite&lt;/b&gt;&lt;/p&gt;&lt;div&gt;{{Dieser Artikel|behandelt Stoppwörter im Bereich der Suchmaschinen; zu Stoppwörtern in der Sexualität siehe [[Safeword]].}}&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Stoppwörter&amp;#039;&amp;#039;&amp;#039; nennt man in der Informationsrückgewinnung bzw. im [[Information Retrieval]] Wörter, die bei einer [[Volltextindexierung]] nicht beachtet werden, da sie sehr häufig auftreten und gewöhnlich keine Relevanz für die Erfassung des [[Dokumentarische Bezugseinheit|Dokumentinhalts]] besitzen. Die Stoppwörter befanden sich bei älteren Suchmaschinen gewöhnlich auf einer Liste und wurden aus dem Text entfernt und nicht indexiert. Heute basieren die meisten Internet-Suchmaschinen auf Vollindexierung, dabei werden die Stoppwörter angezeigt, tragen aber nichts zur Suche bei.&amp;lt;ref name=&amp;quot;DK&amp;quot;&amp;gt;{{Literatur|Titel=Suchmaschinen-Optimierung: Website-Marketing für Entwickler|Autor=Daniel Koch|Verlag=Pearson Deutschland|Jahr=2007|ISBN=9783827324696|Seiten=35}}&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Es handelt sich üblicherweise bei den Stoppwörtern um die am häufigsten vorkommenden Wörter einer Sprache. Man spricht dann auch von einer „festen Stoppwortliste“. Allen Stoppwörtern ist gemeinsam, dass sie vor allem grammatikalische/syntaktische Funktionen übernehmen und daher keine Rückschlüsse auf den Inhalt des Dokumentes zulassen.&amp;lt;ref&amp;gt;{{Literatur|Titel=Website Boosting 2.0: Suchmaschinen-Optimierung, Usability, Online-Marketing|Autor=Mario Fischer|Verlag=mitp Verlag|Jahr=2009|ISBN=9783826617034|Seiten=203}}&amp;lt;/ref&amp;gt; Eine weitere Gemeinsamkeit ist ihre große Zahl: Sie treten in jedem Dokument sehr oft auf und kommen in sehr vielen Dokumenten vor, wodurch sie bei der Erschließung der Dokumente einen hohen Aufwand verursachen würden. Handelt es sich um die am häufigsten vorkommenden Wörter einer Menge von Dokumenten (beispielsweise Akten und Berichte) spricht man von einer „berechneten Stoppwortliste“. Das Erkennen von Stoppwörtern macht [[Suchmaschine]]n [[Effizienz (Informatik)|effizienter]]. Würde man Stoppwörter bei einem Suchauftrag beachten, wäre nahezu jedes Dokument ein Treffer. Ein solches Suchergebnis wäre für den Anwender nutzlos.&amp;lt;ref&amp;gt;{{Literatur|Titel=Empfehlungssysteme: Recommender Systems - Grundlagen, Konzepte und Lösungen|Autor=André Klahold|Verlag=Springer-Verlag|Jahr=2009|ISBN=9783834805683|Seiten=25}}&amp;lt;/ref&amp;gt; Allerdings ist es nicht immer sinnvoll, Stoppwörter komplett auszublenden. Beispiele hierfür sind im Englischen die Rockgruppe „[[The Who]]“ oder im Deutschen „[[Die Ärzte]]“ und Personen mit dem Nachnamen „[[Weil (Familienname)|Weil]]“&amp;lt;ref name=&amp;quot;Weil&amp;quot;&amp;gt;{{internetquelle|url=https://www.sempria.de/hop/sempria/Ministerpr%C3%A4sident_Stoppwort|titel=Der unsichtbare Ministerpräsident Stoppwort|datum=November 2017|zugriff=2017-11-02}}&amp;lt;/ref&amp;gt;. Daher ist es heute bei Vollindizierung möglich, auch nach diesen Kombinationen suchen zu lassen.&amp;lt;ref name=&amp;quot;KWIC&amp;quot; /&amp;gt; Früher war dazu bei den meisten Suchmaschinen ein Operator notwendig, zum Beispiel „+“ oder die Phrasensuche.&amp;lt;ref&amp;gt;{{Literatur|Titel=Suchmaschinenoptimierung am Beispiel von Google|Autor=Philipp Wiedmaier|Verlag=Diplom.de|ISBN=9783832498382|Jahr=2006|Seiten=55}}&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Allgemein übliche Stoppwörter in [[Deutsche Sprache|deutschsprachigen]] Dokumenten sind [[Artikel (Wortart)|bestimmte Artikel]] (&amp;#039;der&amp;#039;, &amp;#039;die&amp;#039;, &amp;#039;das&amp;#039;), [[Artikel (Wortart)|unbestimmte Artikel]] (&amp;#039;einer&amp;#039;, &amp;#039;eine&amp;#039;, &amp;#039;ein&amp;#039;), [[Konjunktion (Wortart)|Konjunktionen]] (z.&amp;amp;nbsp;B. &amp;#039;und&amp;#039;, &amp;#039;oder&amp;#039;, &amp;#039;doch&amp;#039;, &amp;#039;weil&amp;#039;) und häufig gebrauchte [[Präposition]]en (z.&amp;amp;nbsp;B. &amp;#039;an&amp;#039;, &amp;#039;in&amp;#039;, &amp;#039;von&amp;#039;) sowie die [[Negation]] &amp;#039;nicht&amp;#039;.&amp;lt;ref name=&amp;quot;DK&amp;quot; /&amp;gt; Im Englischen sind unter anderem &amp;#039;a&amp;#039;, &amp;#039;of&amp;#039;, &amp;#039;the&amp;#039;, &amp;#039;I&amp;#039;, &amp;#039;it&amp;#039;, &amp;#039;you&amp;#039; und &amp;#039;and&amp;#039; Stoppwörter. Abhängig von den zu erschließenden Dokumenten können Stoppwörter auch mehrsprachig vorliegen. Obwohl eher als Stoppzeichen zu benennen, werden häufig auch der Punkt (.), das Komma (,) und der Strichpunkt (;) als Stoppwörter bezeichnet. In der [[freie Software|freien Software]]-[[Programmbibliothek|Bibliothek]] [[Natural Language Toolkit|NLTK]] sind Listen von Stoppwörtern für 21 Sprachen sowie fertige Methoden zu deren Benutzung enthalten.&amp;lt;ref&amp;gt;{{Internetquelle |autor= |url=https://www.nltk.org/book/ch02.html |titel=2. Accessing Text Corpora and Lexical Resources |werk= |hrsg=NLTK.org |datum= |abruf=2019-04-10 |sprache=en}}&amp;lt;/ref&amp;gt;&amp;lt;ref&amp;gt;{{Internetquelle |autor= |url=https://stackoverflow.com/questions/19130512/stopword-removal-with-nltk |titel=python - Stopword removal with NLTK |werk= |hrsg=stackoverflow.com |datum= |abruf=2019-04-10 |sprache=en}}&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
[[Hans Peter Luhn]], einer der Pioniere des Information Retrieval, prägte den Begriff der Stoppwörter und benutzte dieses Konzept im Design und in der Implementation des Indexers [[KWIC]].&amp;lt;ref name=&amp;quot;KWIC&amp;quot;&amp;gt;{{internetquelle|url=https://www.kidscodecs.com/stop-words/|autor=Tom Slevin|titel=Stop Words|hrsg=Kids, Code, and Computer Science|datum=November 2013|zugriff=2016-05-11}}&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Abzugrenzen ist das Stoppwort von den sogenannten [[Schwarze Liste|Black Lists]], dabei handelt es sich um eine Liste von unzulässigen Wörtern. Das Vorkommen eines solchen führt nicht zum Ausschluss des Wortes aus der Indizierung, sondern zur Elimination des gesamten Dokuments.&amp;lt;ref&amp;gt;{{Literatur|Autor=Michael Glöggler|Titel=Suchmaschinen im Internet: Funktionsweisen, Ranking Methoden, Top Positionen|Verlag=Springer-Verlag|Jahr=2013|Seiten=56|ISBN=9783642593215}}&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
== Weblinks ==&lt;br /&gt;
* [https://www.textfixer.com/tutorials/common-english-words.txt Liste englischer Stoppwörter]&lt;br /&gt;
* [https://github.com/solariz/german_stopwords Liste deutscher Stoppwörter]&lt;br /&gt;
&lt;br /&gt;
== Einzelnachweise ==&lt;br /&gt;
&amp;lt;references&amp;gt;&amp;lt;/references&amp;gt;&lt;br /&gt;
&lt;br /&gt;
[[Kategorie:Information Retrieval]]&lt;/div&gt;</summary>
		<author><name>imported&gt;Alazon</name></author>
	</entry>
</feed>