<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="de">
	<id>https://wiki-de.moshellshocker.dns64.de/index.php?action=history&amp;feed=atom&amp;title=HOCR_%28Standard%29</id>
	<title>HOCR (Standard) - Versionsgeschichte</title>
	<link rel="self" type="application/atom+xml" href="https://wiki-de.moshellshocker.dns64.de/index.php?action=history&amp;feed=atom&amp;title=HOCR_%28Standard%29"/>
	<link rel="alternate" type="text/html" href="https://wiki-de.moshellshocker.dns64.de/index.php?title=HOCR_(Standard)&amp;action=history"/>
	<updated>2026-06-11T19:49:54Z</updated>
	<subtitle>Versionsgeschichte dieser Seite in Wikipedia (Deutsch) – Lokale Kopie</subtitle>
	<generator>MediaWiki 1.43.8</generator>
	<entry>
		<id>https://wiki-de.moshellshocker.dns64.de/index.php?title=HOCR_(Standard)&amp;diff=1833072&amp;oldid=prev</id>
		<title>imported&gt;Stefan Weil: /* Software */ Wikilink aktualisiert</title>
		<link rel="alternate" type="text/html" href="https://wiki-de.moshellshocker.dns64.de/index.php?title=HOCR_(Standard)&amp;diff=1833072&amp;oldid=prev"/>
		<updated>2025-02-18T15:06:27Z</updated>

		<summary type="html">&lt;p&gt;&lt;span class=&quot;autocomment&quot;&gt;Software: &lt;/span&gt; Wikilink aktualisiert&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Neue Seite&lt;/b&gt;&lt;/p&gt;&lt;div&gt;{{SEITENTITEL:hOCR (Standard)}}&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;hOCR&amp;#039;&amp;#039;&amp;#039; ist ein [[offener Standard]], der ein [[Datenformat]] beschreibt, das der Repräsentation von [[Texterkennung]]sergebnissen dient. Mit diesem Format lassen sich zusätzlich zum Text dessen Layout, Erkennungsgenauigkeit, Formatierungen und andere Informationen erfassen. Das Format baut auf [[Extensible Hypertext Markup Language|XHTML]] (oder auch [[Hypertext Markup Language|HTML]]) auf.&lt;br /&gt;
[[Metadaten]] werden nach der [[Dublin Core|Dublin-Core]]-Konvention zur Einbettung von Metadaten in HTML in speziellen &amp;lt;meta&amp;gt;-Tags abgespeichert.&lt;br /&gt;
&lt;br /&gt;
== Software ==&lt;br /&gt;
Das Format wurde in Googles [[OCRopus]] eingeführt.&lt;br /&gt;
Außer von OCRopus kann das Format auch von [[CuneiForm]], von [[hebOCR]] (ehemals &amp;#039;&amp;#039;HOCR&amp;#039;&amp;#039;), einer auf hebräische Schrift spezialisierten Texterkennungssoftware, und ab Version 3.0 auch von [[Tesseract (Software)|Tesseract]] direkt erzeugt werden.&lt;br /&gt;
&lt;br /&gt;
Die hocr-tools sind ein Paket von Werkzeugen zur Verarbeitung (Zusammenfügen, Aufteilen, Einfügen von Metadaten) und Analyse von hOCR-Daten.&lt;br /&gt;
Mit hocr2pdf&amp;lt;ref&amp;gt;[http://exactcode.de/site/open_source/exactimage/hocr2pdf/ exactcode.de/site/open_source/exactimage/hocr2pdf]&amp;lt;/ref&amp;gt; existiert ein [[Kommandozeile]]nwerkzeug zur Erzeugung von maschinell durchsuchbaren Bilder-[[Portable Document Format|PDF]]-Dateien anhand von hOCR-Daten.&lt;br /&gt;
&lt;br /&gt;
== Weblinks ==&lt;br /&gt;
* [https://github.com/kba/hocr-spec Spezifikation des Formates]&lt;br /&gt;
* [https://github.com/tmbdev/hocr-tools Projektübersicht zu hocr-tools] bei [[GitHub]]&lt;br /&gt;
&lt;br /&gt;
== Einzelnachweise ==&lt;br /&gt;
&amp;lt;references /&amp;gt;&lt;br /&gt;
&lt;br /&gt;
{{SORTIERUNG:Hocr}}&lt;br /&gt;
[[Kategorie:XML-basierte Sprache]]&lt;br /&gt;
[[Kategorie:Offenes Format]]&lt;br /&gt;
[[Kategorie:Optische Zeichenerkennung]]&lt;/div&gt;</summary>
		<author><name>imported&gt;Stefan Weil</name></author>
	</entry>
</feed>