<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="de">
	<id>https://wiki-de.moshellshocker.dns64.de/index.php?action=history&amp;feed=atom&amp;title=CESU-8</id>
	<title>CESU-8 - Versionsgeschichte</title>
	<link rel="self" type="application/atom+xml" href="https://wiki-de.moshellshocker.dns64.de/index.php?action=history&amp;feed=atom&amp;title=CESU-8"/>
	<link rel="alternate" type="text/html" href="https://wiki-de.moshellshocker.dns64.de/index.php?title=CESU-8&amp;action=history"/>
	<updated>2026-06-02T10:39:54Z</updated>
	<subtitle>Versionsgeschichte dieser Seite in Wikipedia (Deutsch) – Lokale Kopie</subtitle>
	<generator>MediaWiki 1.43.8</generator>
	<entry>
		<id>https://wiki-de.moshellshocker.dns64.de/index.php?title=CESU-8&amp;diff=455651&amp;oldid=prev</id>
		<title>imported&gt;Wassermaus: /* Beispiel */ Formatierung</title>
		<link rel="alternate" type="text/html" href="https://wiki-de.moshellshocker.dns64.de/index.php?title=CESU-8&amp;diff=455651&amp;oldid=prev"/>
		<updated>2025-01-14T10:47:32Z</updated>

		<summary type="html">&lt;p&gt;&lt;span class=&quot;autocomment&quot;&gt;Beispiel: &lt;/span&gt; Formatierung&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Neue Seite&lt;/b&gt;&lt;/p&gt;&lt;div&gt;&amp;#039;&amp;#039;&amp;#039;CESU-8&amp;#039;&amp;#039;&amp;#039; (kurz für &amp;#039;&amp;#039;Compatibility Encoding Scheme for UTF-16: 8-Bit&amp;#039;&amp;#039;) ist eine Variante von [[UTF-8]], die im [[Unicode]] Technical Report #26 beschrieben wird. Der [[Codepoint]] wird zunächst in [[UTF-16]] ausgedrückt, dann wird das Ergebnis in UTF-8 rekodiert, als wäre es [[UCS-2]].&lt;br /&gt;
&lt;br /&gt;
== Kodierung ==&lt;br /&gt;
CESU-8-kodierter Text entsteht, wenn bei der Kodierung nach UTF-8 eine etwaige UTF-16-Kodierung der Ausgangsdaten nicht berücksichtigt wird, sei es aus Unkenntnis oder weil der Programmcode noch aus der Zeit stammt, in der Unicode nur ein 16-Bit-Zeichensatz war.&lt;br /&gt;
&lt;br /&gt;
Bei Zeichen aus dem Bereich der [[Unicode#Gliederung|Basic Multilingual Plane]] (Zeichen bis Nummer 65.535) sind UTF-8 und CESU-8 identisch. Zeichen außerhalb der BMP werden durch die UTF-16-Kodierung durch jeweils &amp;#039;&amp;#039;zwei&amp;#039;&amp;#039; 16-Bit-Werte (aus dem für diese Zwecke reservierten Bereich von D800&amp;lt;sub&amp;gt;hex&amp;lt;/sub&amp;gt; bis DFFF&amp;lt;sub&amp;gt;hex&amp;lt;/sub&amp;gt;) repräsentiert. Werden diese beiden Werte nun einzeln in UTF-8 umgewandelt, entstehen daraus jeweils 3-Byte-Sequenzen aus dem Bereich &amp;lt;code&amp;gt;ED A0 xx&amp;lt;/code&amp;gt; … &amp;lt;code&amp;gt;ED BF xx&amp;lt;/code&amp;gt;, welche in normalem UTF-8 &amp;#039;&amp;#039;nicht&amp;#039;&amp;#039; vorkommen können. Ein korrekter UTF-8-Kodierer muss dagegen zuerst die UTF-16-Kodierung der Eingangsdaten erkennen und dekodieren (wobei Code-Werte &amp;gt;65535 auftreten können) und anschließend erst die UTF-8-Kodierung durchführen, wobei Werte &amp;gt;65535 in 4-Byte-Sequenzen kodiert werden, die mit &amp;lt;code&amp;gt;F0&amp;lt;/code&amp;gt;&amp;lt;sub&amp;gt;hex&amp;lt;/sub&amp;gt; bis &amp;lt;code&amp;gt;F4&amp;lt;/code&amp;gt;&amp;lt;sub&amp;gt;hex&amp;lt;/sub&amp;gt; beginnen.&lt;br /&gt;
&lt;br /&gt;
== Verwendung ==&lt;br /&gt;
Da diese eigentlich „falsche UTF-8-Kodierung“ eine gewisse Verbreitung gefunden hat, wurde sie nachträglich durch das Unicode-Consortium genormt, allerdings unter dem neuen Namen &amp;#039;&amp;#039;CESU-8&amp;#039;&amp;#039;. CESU-8 wird ausdrücklich &amp;#039;&amp;#039;nicht&amp;#039;&amp;#039; als Datenaustauschformat empfohlen, sondern nur als internes Format, wenn eine Kompatibilität zu UTF-16 erforderlich ist.&lt;br /&gt;
&lt;br /&gt;
CESU-8 wird z.&amp;amp;nbsp;B. von der [[Oracle (Datenbanksystem)|Oracle]]-[[Datenbank]]-Software verwendet: Mit Version 8 wurde ein &amp;quot;UTF8&amp;quot; genannter Zeichensatz eingeführt, der aber in Wirklichkeit der CESU-8-Kodierung entspricht. Mit Version 9.0 wurde ein korrekter UTF-8-Zeichenatz eingeführt, der allerdings den Namen &amp;quot;AL32UTF8&amp;quot; erhielt, um die Kompatibilität zu vorhandenen, älteren Datenbanken zu bewahren.&lt;br /&gt;
&lt;br /&gt;
== Beispiel ==&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot; style=&amp;quot;text-align:center;&amp;quot;&lt;br /&gt;
|-&lt;br /&gt;
! rowspan=&amp;quot;2&amp;quot; style=&amp;quot;background-color: #f2f2f2; border:1px #aaaaaa solid; vertical-align:bottom;&amp;quot; | Kodierung&lt;br /&gt;
! colspan=&amp;quot;19&amp;quot; style=&amp;quot;background-color: #f2f2f2; border:1px #aaaaaa solid&amp;quot; | Unicode code point&lt;br /&gt;
|-&lt;br /&gt;
| style=&amp;quot;border:1px #aaaaaa solid&amp;quot; | U+0045&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; style=&amp;quot;border:1px #aaaaaa solid&amp;quot; | U+0205&lt;br /&gt;
| colspan=&amp;quot;12&amp;quot; style=&amp;quot;border:1px #aaaaaa solid&amp;quot; | U+10400&lt;br /&gt;
|-&lt;br /&gt;
! style=&amp;quot;background-color: #f2f2f2; border:1px #aaaaaa solid&amp;quot; | UTF-8&lt;br /&gt;
| style=&amp;quot;border:1px #aaaaaa solid&amp;quot; | 45&lt;br /&gt;
| style=&amp;quot;border:1px #aaaaaa solid; border-right: 1px #dddddd solid&amp;quot; | C8&lt;br /&gt;
| style=&amp;quot;border:1px #aaaaaa solid; border-left: 1px #dddddd solid&amp;quot; | 85&lt;br /&gt;
| colspan=&amp;quot;3&amp;quot; style=&amp;quot;border:1px #aaaaaa solid; border-right: 1px #dddddd solid&amp;quot; | F0&lt;br /&gt;
| colspan=&amp;quot;3&amp;quot; style=&amp;quot;border:1px #aaaaaa solid; border-left: 1px #dddddd solid; border-right: 1px #dddddd solid&amp;quot; | 90&lt;br /&gt;
| colspan=&amp;quot;3&amp;quot; style=&amp;quot;border:1px #aaaaaa solid; border-left: 1px #dddddd solid; border-right: 1px #dddddd solid&amp;quot; | 90&lt;br /&gt;
| colspan=&amp;quot;3&amp;quot; style=&amp;quot;border:1px #aaaaaa solid; border-left: 1px #dddddd solid&amp;quot; | 80&lt;br /&gt;
|-&lt;br /&gt;
! style=&amp;quot;background-color: #f2f2f2; border:1px #aaaaaa solid&amp;quot; | UTF-16&lt;br /&gt;
| style=&amp;quot;border:1px #aaaaaa solid&amp;quot; | 0045&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; style=&amp;quot;border:1px #aaaaaa solid&amp;quot; | 0205&lt;br /&gt;
| colspan=&amp;quot;6&amp;quot; style=&amp;quot;border:1px #aaaaaa solid&amp;quot; | D801&lt;br /&gt;
| colspan=&amp;quot;6&amp;quot; style=&amp;quot;border:1px #aaaaaa solid&amp;quot; | DC00&lt;br /&gt;
|-&lt;br /&gt;
! style=&amp;quot;background-color: #f2f2f2; border:1px #aaaaaa solid&amp;quot; | CESU-8&lt;br /&gt;
| style=&amp;quot;border:1px #aaaaaa solid&amp;quot; | 45&lt;br /&gt;
| style=&amp;quot;border:1px #aaaaaa solid; border-right: 1px #dddddd solid&amp;quot; | C8&lt;br /&gt;
| style=&amp;quot;border:1px #aaaaaa solid; border-left: 1px #dddddd solid&amp;quot; | 85&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; style=&amp;quot;border:1px #aaaaaa solid; border-right: 1px #dddddd solid&amp;quot; | ED&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; style=&amp;quot;border:1px #aaaaaa solid; border-left: 1px #dddddd solid; border-right: 1px #dddddd solid&amp;quot; | A0&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; style=&amp;quot;border:1px #aaaaaa solid; border-left: 1px #dddddd solid&amp;quot; | 81&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; style=&amp;quot;border:1px #aaaaaa solid; border-right: 1px #dddddd solid&amp;quot; | ED&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; style=&amp;quot;border:1px #aaaaaa solid; border-left: 1px #dddddd solid; border-right: 1px #dddddd solid&amp;quot; | B0&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; style=&amp;quot;border:1px #aaaaaa solid; border-left: 1px #dddddd solid&amp;quot; | 80&lt;br /&gt;
|}&lt;br /&gt;
&lt;br /&gt;
== Gleiches Beispiel mit Binärdarstellung ==&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
|-&lt;br /&gt;
! colspan=&amp;quot;2&amp;quot; style=&amp;quot;background-color: #f2f2f2; text-align:left;&amp;quot;| Kodierung&lt;br /&gt;
! colspan=&amp;quot;1&amp;quot; style=&amp;quot;background-color: #f2f2f2; text-align:left;&amp;quot;| Hexadezimal&lt;br /&gt;
! colspan=&amp;quot;1&amp;quot; style=&amp;quot;background-color: #f2f2f2; text-align:left;&amp;quot;| Binär&lt;br /&gt;
! colspan=&amp;quot;1&amp;quot; style=&amp;quot;background-color: #f2f2f2; text-align:left;&amp;quot;| Unicode code point&lt;br /&gt;
|- style=&amp;quot;text-align:center&amp;quot;&lt;br /&gt;
|-&lt;br /&gt;
! colspan=&amp;quot;2&amp;quot; style=&amp;quot;background-color: #f2f2f2;text-align:left;border-top: 1.15pt black solid; text-align:left;&amp;quot;| UTF-8&lt;br /&gt;
| style=&amp;quot;text-align:right;border-top: 1.15pt black solid; text-align:right;&amp;quot;| 45&lt;br /&gt;
| style=&amp;quot;text-align:right;border-top: 1.15pt black solid; text-align:right;&amp;quot;| 0100 0101&lt;br /&gt;
| colspan=&amp;quot;1&amp;quot; rowspan=&amp;quot;3&amp;quot; style=&amp;quot;text-align:left;border-top: 1.15pt black solid; text-align:left;&amp;quot;| U+0045 ([[E]], Lateinischer Großbuchstabe E)&lt;br /&gt;
|-&lt;br /&gt;
! colspan=&amp;quot;2&amp;quot; style=&amp;quot;background-color: #f2f2f2;text-align:left;&amp;quot;| UTF-16&lt;br /&gt;
| style=&amp;quot;text-align:right;&amp;quot;| 00 45&lt;br /&gt;
| style=&amp;quot;text-align:right;&amp;quot;| 0000&amp;amp;nbsp;0000 0100&amp;amp;nbsp;0101&lt;br /&gt;
|-&lt;br /&gt;
! colspan=&amp;quot;2&amp;quot; style=&amp;quot;background-color: #f2f2f2;text-align:left;&amp;quot;| CESU-8&lt;br /&gt;
| style=&amp;quot;text-align:right;&amp;quot;| 45&lt;br /&gt;
| style=&amp;quot;text-align:right;&amp;quot;| 0100&amp;amp;nbsp;0101&lt;br /&gt;
|-&lt;br /&gt;
! colspan=&amp;quot;2&amp;quot; style=&amp;quot;background-color: #f2f2f2;text-align:left;border-top: 1.15pt black solid; text-align:left;&amp;quot;| UTF-8&lt;br /&gt;
| style=&amp;quot;text-align:right;border-top: 1.15pt black solid; text-align:right;&amp;quot;| C8 85&lt;br /&gt;
| style=&amp;quot;text-align:right;border-top: 1.15pt black solid; text-align:right;&amp;quot;| &amp;lt;span style=&amp;quot;color:#00F&amp;quot;&amp;gt;110&amp;lt;/span&amp;gt;0&amp;amp;nbsp;1000 &amp;lt;span style=&amp;quot;color:#00F&amp;quot;&amp;gt;10&amp;lt;/span&amp;gt;00&amp;amp;nbsp;0101&lt;br /&gt;
| colspan=&amp;quot;1&amp;quot; rowspan=&amp;quot;3&amp;quot; style=&amp;quot;text-align:left;border-top: 1.15pt black solid; text-align:left;&amp;quot;| U+0205 ([[Unicodeblock Lateinisch, erweitert-B|ȅ]], Lateinischer Kleinbuchstabe E mit Doppelgravis)&lt;br /&gt;
|-&lt;br /&gt;
! colspan=&amp;quot;2&amp;quot; style=&amp;quot;background-color: #f2f2f2;text-align:left;&amp;quot;| UTF-16&lt;br /&gt;
| style=&amp;quot;text-align:right;&amp;quot;| 02 05&lt;br /&gt;
| style=&amp;quot;text-align:right;&amp;quot;| 0000&amp;amp;nbsp;0010 0000&amp;amp;nbsp;0101&lt;br /&gt;
|-&lt;br /&gt;
! colspan=&amp;quot;2&amp;quot; style=&amp;quot;background-color: #f2f2f2;text-align:left;&amp;quot;| CESU-8&lt;br /&gt;
| style=&amp;quot;text-align:right;&amp;quot;| C8 85&lt;br /&gt;
| style=&amp;quot;text-align:right;&amp;quot;| &amp;lt;span style=&amp;quot;color:#00F&amp;quot;&amp;gt;110&amp;lt;/span&amp;gt;0&amp;amp;nbsp;1000 &amp;lt;span style=&amp;quot;color:#00F&amp;quot;&amp;gt;10&amp;lt;/span&amp;gt;00&amp;amp;nbsp;0101&lt;br /&gt;
|-&lt;br /&gt;
! colspan=&amp;quot;2&amp;quot; style=&amp;quot;background-color: #f2f2f2;text-align:left;border-top: 1.15pt black solid; text-align:left;&amp;quot;| UTF-8&lt;br /&gt;
| style=&amp;quot;text-align:right;border-top: 1.15pt black solid; text-align:right;&amp;quot;| F0 90 90 80&lt;br /&gt;
| style=&amp;quot;text-align:right;border-top: 1.15pt black solid; text-align:right;&amp;quot;| &amp;lt;span style=&amp;quot;color:#00F&amp;quot;&amp;gt;1111&amp;amp;nbsp;0&amp;lt;/span&amp;gt;000 &amp;lt;span style=&amp;quot;color:#00F&amp;quot;&amp;gt;10&amp;lt;/span&amp;gt;0&amp;#039;&amp;#039;&amp;#039;&amp;lt;span style=&amp;quot;color:#F0F&amp;quot;&amp;gt;1&amp;lt;/span&amp;gt;&amp;#039;&amp;#039;&amp;#039;&amp;amp;nbsp;0000 &amp;lt;span style=&amp;quot;color:#00F&amp;quot;&amp;gt;10&amp;lt;/span&amp;gt;01&amp;amp;nbsp;0000 &amp;lt;span style=&amp;quot;color:#00F&amp;quot;&amp;gt;10&amp;lt;/span&amp;gt;00&amp;amp;nbsp;0000&lt;br /&gt;
| colspan=&amp;quot;1&amp;quot; rowspan=&amp;quot;5&amp;quot; style=&amp;quot;text-align:left;border-top: 1.15pt black solid; text-align:left;&amp;quot;| U+10400 ([[Unicodeblock Mormonenalphabet|𐐀]], Deseret-Großbuchstabe langes I)&lt;br /&gt;
|-&lt;br /&gt;
! rowspan=&amp;quot;2&amp;quot; style=&amp;quot;background-color: #f2f2f2;text-align:left;&amp;quot;| UTF-16&lt;br /&gt;
! style=&amp;quot;background-color: #f2f2f2; text-align:left;&amp;quot;| &amp;#039;&amp;#039;High-Surrogate&amp;#039;&amp;#039;&lt;br /&gt;
| style=&amp;quot;text-align:right;&amp;quot;| D8 01&lt;br /&gt;
| style=&amp;quot;text-align:right;&amp;quot;| &amp;#039;&amp;#039;&amp;#039;1101&amp;amp;nbsp;10&amp;#039;&amp;#039;&amp;#039;00 0000&amp;amp;nbsp;0001&lt;br /&gt;
|-&lt;br /&gt;
! style=&amp;quot;background-color: #f2f2f2;text-align:left;&amp;quot;| &amp;#039;&amp;#039;Low-Surrogate&amp;#039;&amp;#039;&lt;br /&gt;
| style=&amp;quot;text-align:right;&amp;quot;| DC 00&lt;br /&gt;
| style=&amp;quot;text-align:right;&amp;quot;| &amp;#039;&amp;#039;&amp;#039;1101&amp;amp;nbsp;11&amp;#039;&amp;#039;&amp;#039;00 0000&amp;amp;nbsp;0000&lt;br /&gt;
|-&lt;br /&gt;
! rowspan=&amp;quot;2&amp;quot; ! style=&amp;quot;background-color: #f2f2f2;text-align:left;&amp;quot;| CESU-8&lt;br /&gt;
! style=&amp;quot;background-color: #f2f2f2;text-align:left;text-align:left;&amp;quot; | &amp;#039;&amp;#039;High&amp;#039;&amp;#039;&lt;br /&gt;
| style=&amp;quot;text-align:right;&amp;quot;| ED A0 81&lt;br /&gt;
| style=&amp;quot;text-align:right;&amp;quot;| &amp;lt;span style=&amp;quot;color:#00F&amp;quot;&amp;gt;1110&amp;lt;/span&amp;gt;&amp;amp;nbsp;&amp;#039;&amp;#039;&amp;#039;1101&amp;#039;&amp;#039;&amp;#039; &amp;lt;span style=&amp;quot;color:#00F&amp;quot;&amp;gt;10&amp;lt;/span&amp;gt;&amp;#039;&amp;#039;&amp;#039;10&amp;#039;&amp;#039;&amp;#039;&amp;amp;nbsp;0000 &amp;lt;span style=&amp;quot;color:#00F&amp;quot;&amp;gt;10&amp;lt;/span&amp;gt;00&amp;amp;nbsp;0001&lt;br /&gt;
|-&lt;br /&gt;
! style=&amp;quot;background-color: #f2f2f2;text-align:left;text-align:left;&amp;quot;| &amp;#039;&amp;#039;Low&amp;#039;&amp;#039;&lt;br /&gt;
| style=&amp;quot;text-align:right;&amp;quot;| ED B0 80&lt;br /&gt;
| style=&amp;quot;text-align:right;&amp;quot;| &amp;lt;span style=&amp;quot;color:#00F&amp;quot;&amp;gt;1110&amp;lt;/span&amp;gt;&amp;amp;nbsp;&amp;#039;&amp;#039;&amp;#039;1101&amp;#039;&amp;#039;&amp;#039; &amp;lt;span style=&amp;quot;color:#00F&amp;quot;&amp;gt;10&amp;lt;/span&amp;gt;&amp;#039;&amp;#039;&amp;#039;11&amp;#039;&amp;#039;&amp;#039;&amp;amp;nbsp;0000 &amp;lt;span style=&amp;quot;color:#00F&amp;quot;&amp;gt;10&amp;lt;/span&amp;gt;00&amp;amp;nbsp;0000&lt;br /&gt;
|}&lt;br /&gt;
&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
|-&lt;br /&gt;
! colspan=&amp;quot;2&amp;quot; style=&amp;quot;background-color: #f2f2f2; text-align:left;&amp;quot;| Legende&lt;br /&gt;
|-&lt;br /&gt;
| 0100 0101 etc.&lt;br /&gt;
| Datenbits&lt;br /&gt;
|-&lt;br /&gt;
|&amp;#039;&amp;#039;&amp;#039;&amp;lt;span style=&amp;quot;color:#F0F&amp;quot;&amp;gt;10000&amp;lt;sub&amp;gt;hex&amp;lt;/sub&amp;gt;&amp;lt;/span&amp;gt;&amp;#039;&amp;#039;&amp;#039;&lt;br /&gt;
| Größe der [[Liste der Unicodeblöcke#Ebenen|Ebene 0: Basic Multilingual Plane]] (wird für die UTF-16 Codierung abgezogen)&lt;br /&gt;
|-&lt;br /&gt;
| &amp;#039;&amp;#039;&amp;#039;110110&amp;#039;&amp;#039;&amp;#039;&lt;br /&gt;
| UTF-16 High-Surrogate Kodierungsbits&lt;br /&gt;
|-&lt;br /&gt;
| &amp;#039;&amp;#039;&amp;#039;110111&amp;#039;&amp;#039;&amp;#039;&lt;br /&gt;
| UTF-16 Low-Surrogate Kodierungsbits&lt;br /&gt;
|-&lt;br /&gt;
| &amp;lt;span style=&amp;quot;color:#00F&amp;quot;&amp;gt;110&amp;lt;/span&amp;gt;,&lt;br /&gt;
&amp;lt;span style=&amp;quot;color:#00F&amp;quot;&amp;gt;1110&amp;lt;/span&amp;gt;,&lt;br /&gt;
&amp;lt;span style=&amp;quot;color:#00F&amp;quot;&amp;gt;11110&amp;lt;/span&amp;gt;,&lt;br /&gt;
&amp;lt;span style=&amp;quot;color:#00F&amp;quot;&amp;gt;10&amp;lt;/span&amp;gt;&lt;br /&gt;
| UTF-8 Kodierungsbits&lt;br /&gt;
|}&lt;br /&gt;
&lt;br /&gt;
== Weblinks ==&lt;br /&gt;
* [http://www.unicode.org/reports/tr26/ Unicode Technical Report #26]&lt;br /&gt;
&lt;br /&gt;
{{SORTIERUNG:Cesu8}}&lt;br /&gt;
[[Kategorie:Unicode]]&lt;br /&gt;
[[Kategorie:Abkürzung|CESU]]&lt;/div&gt;</summary>
		<author><name>imported&gt;Wassermaus</name></author>
	</entry>
</feed>