<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="de">
	<id>https://wiki-de.moshellshocker.dns64.de/index.php?action=history&amp;feed=atom&amp;title=Normalisierung_%28Text%29</id>
	<title>Normalisierung (Text) - Versionsgeschichte</title>
	<link rel="self" type="application/atom+xml" href="https://wiki-de.moshellshocker.dns64.de/index.php?action=history&amp;feed=atom&amp;title=Normalisierung_%28Text%29"/>
	<link rel="alternate" type="text/html" href="https://wiki-de.moshellshocker.dns64.de/index.php?title=Normalisierung_(Text)&amp;action=history"/>
	<updated>2026-06-02T12:40:22Z</updated>
	<subtitle>Versionsgeschichte dieser Seite in Wikipedia (Deutsch) – Lokale Kopie</subtitle>
	<generator>MediaWiki 1.43.8</generator>
	<entry>
		<id>https://wiki-de.moshellshocker.dns64.de/index.php?title=Normalisierung_(Text)&amp;diff=1912951&amp;oldid=prev</id>
		<title>imported&gt;Aka: /* Weblinks */ https</title>
		<link rel="alternate" type="text/html" href="https://wiki-de.moshellshocker.dns64.de/index.php?title=Normalisierung_(Text)&amp;diff=1912951&amp;oldid=prev"/>
		<updated>2021-02-12T17:52:36Z</updated>

		<summary type="html">&lt;p&gt;&lt;span class=&quot;autocomment&quot;&gt;Weblinks: &lt;/span&gt; https&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Neue Seite&lt;/b&gt;&lt;/p&gt;&lt;div&gt;Unter &amp;#039;&amp;#039;&amp;#039;Normalisierung&amp;#039;&amp;#039;&amp;#039; von Text versteht man das Überführen in eine andere Form, bei der nur die für den gewünschten Kontext relevanten Informationen beibehalten werden. Je nach Anwendung kann die Normalisierung ganz unterschiedlich ablaufen.&lt;br /&gt;
&lt;br /&gt;
== Beispiele ==&lt;br /&gt;
Einige Zeichensätze, insbesondere [[Unicode]], ermöglichen die Darstellung eines Zeichens auf unterschiedliche Arten. In Anwendungen ist meist aber nur eine der möglichen Formen erwünscht, sodass die Normalisierung den Text in diese Form überführen muss. Speziell für Unicode gibt es vier Möglichkeiten für diese [[Normalisierung (Unicode)|Normalisierung]].&lt;br /&gt;
&lt;br /&gt;
Bei der Erstellung eines Suchindex muss die Normalisierung je nach Erwartung des Benutzers unterschiedliche Anforderungen erfüllen. Einige Möglichkeiten sind:&lt;br /&gt;
* Satzzeichen können entfernt werden.&lt;br /&gt;
* Zeichen mit Akzenten können durch ihren Grundbuchstaben ersetzt werden. Ebenso kann ä durch ae und ß durch ss ersetzt werden.&lt;br /&gt;
* Alle Zeichen können in Großbuchstaben umgewandelt werden.&lt;br /&gt;
* Zeichen aus anderen Alphabeten können [[Transliteration|transliteriert]] werden.&lt;br /&gt;
Einige dieser Anforderungen können mit Hilfe des [[Unicode Collation Algorithm]] erfüllt werden.&lt;br /&gt;
&lt;br /&gt;
Um [[Spoofing]] zu verhindern, also zum Beispiel die Möglichkeit, dass sich in einem Internetforum zwei Benutzer anmelden können, deren Namen identisch aussehen, müssen bei der Normalisierung visuell ähnliche Zeichen durch dasselbe Zeichen ersetzt werden. Es könnte also sowohl die Ziffer 1, als auch der Kleinbuchstabe l durch den Großbuchstaben I ersetzt werden.&lt;br /&gt;
&lt;br /&gt;
Für die [[Sprachsynthese]] müssen Zahlen, Sonderzeichen und Abkürzungen – teilweise abhängig vom Kontext – aufgelöst werden, um korrekt vorgelesen zu werden.&lt;br /&gt;
&lt;br /&gt;
== Weblinks ==&lt;br /&gt;
* [https://util.unicode.org/UnicodeJsps/confusables.jsp Demonstration] optisch ähnlicher Zeichen (englisch)&lt;br /&gt;
&lt;br /&gt;
[[Kategorie:Datenformat]]&lt;/div&gt;</summary>
		<author><name>imported&gt;Aka</name></author>
	</entry>
</feed>