Zum Inhalt springen

Julius (Software)

aus Wikipedia, der freien Enzyklopädie
Dies ist die aktuelle Version dieser Seite, zuletzt bearbeitet am 12. Juli 2023 um 17:25 Uhr durch imported>Siegbert v2 (Artikel Sprachmodell verlinkt (nach LD vom 5. Juli 2023) / Link auf HTK-BKS macht keinen Sinn (ist dort auch nicht enthalten) => Abkürzungen ausgeschrieben (siehe: https://htk.eng.cam.ac.uk/ und http://dev.cs.ovgu.de/misc/CMU-Cam_Toolkit/toolkit_documentation.html)).
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)
Julius

[[Datei:Lua-Fehler in Modul:Wikidata, Zeile 1686: attempt to index field 'wikibase' (a nil value)|150px]]
Basisdaten

Hauptentwickler Lee Akinobu (Nagoya Institute of Technology)
Entwickler Lua-Fehler in Modul:Wikidata, Zeile 1686: attempt to index field 'wikibase' (a nil value)
Erscheinungsjahr Lua-Fehler in Modul:Wikidata, Zeile 1686: attempt to index field 'wikibase' (a nil value)
Aktuelle Version Lua-Fehler in Modul:Wikidata, Zeile 1686: attempt to index field 'wikibase' (a nil value)
(Lua-Fehler in Modul:Wikidata, Zeile 1686: attempt to index field 'wikibase' (a nil value))
Aktuelle Vorabversion Lua-Fehler in Modul:Wikidata, Zeile 1686: attempt to index field 'wikibase' (a nil value)
(Lua-Fehler in Modul:Wikidata, Zeile 1686: attempt to index field 'wikibase' (a nil value))
Betriebssystem Unix-artige (GNU/Linux, BSD etc.), Windows (über Cygwin)
Programmier­sprache Lua-Fehler in Modul:Wikidata, Zeile 1686: attempt to index field 'wikibase' (a nil value)
Kategorie Spracherkennung
Lizenz eigene Lizenz<ref name="Lizenz">Lizenz von Julius</ref>
deutschsprachig ja
julius.sourceforge.jp

Julius ist eine Spracherkennungs-Engine, die als freie Software realisiert wurde. Sie gehört zur Gattung der LVCSR (Large Vocabulary Continuous Speech Recognition), die ununterbrochene Sprachflüsse versteht und mit großen Wortschätzen umgehen kann. Das Programm ist kommandozeilenbasiert, es existiert jedoch auch ein grafisches Frontend namens Simon.

Technischer Hintergrund

Julius basiert auf Hidden Markov Models und der N-Gramm-Technologie, die das eingehende Signal in Gruppen von mehreren Wörtern (im Fall von Julius zwei oder drei, also Bigramme und Trigramme) aufteilt, deren Wahrscheinlichkeit auf der Basis statistischer Daten berechnet wird. Um vom verwendeten Sprachmodell unabhängig zu sein, ist das Programm modular aufgebaut, es unterstützt unter anderem das Hidden Markov Model Toolkit (HTK) und das Carnegie Mellon University - Cambridge Statistical Language Modeling Toolkit (CMU-Cam SLM). Das Programm läuft auf modernen PCs nahezu in Echtzeit. Die Wortakkuratheit hängt dabei vom verwendeten Sprachmodell ab.

Entwicklungsgeschichte

Das Projekt wurde im Jahr 1997 in Japan begonnen, wo es an verschiedenen Universitäten und Instituten zur Forschung in der Computerlinguistik verwendet wird. Das IPA Japanese dictation toolkit project führte die Arbeit bis 2000 fort, als es vom Continuous Speech Recognition Consortium (CSRC) und ab 2003 vom Interactive Speech Technology Consortium (ISTC) übernommen wurde. Zunächst wurde nur die japanische Sprache unterstützt, dank des modularen Aufbaus der Software wurden jedoch bald auch englische Sprachmodelle entwickelt.

Ab der Version 3.4 wurde ein auf einem endlichen Automaten basierendes Grammatikmodul namens Julian in das System integriert, das für die Entwicklung einfacherer Sprachsteuerungs- und Dialogsysteme ausgelegt ist. Seit 2006 ist auch eine Embedded-Variante für schwächere Prozessoren verfügbar.<ref>Embedded Julius: Continuous Speech Recognition Software for Microprocessor, IEEE.org</ref>

Verwandte Projekte

Simon

Das grafische Frontend Simon befindet sich derzeit im Beta-Stadium. Es wurde besonders auf die Benutzung durch Personen mit körperlichen Behinderungen optimiert. Die Entwicklung von Simon wird vom Verein Simon Listens, der 2007 in Österreich gegründet wurde, vorangetrieben.

Das Frontend Simon benutzt ein eigenes Sprachmodell und ist daher auch mit Hilfe der deutschen Sprache bedienbar. Das bei Simon genutzte Modell ist dabei sprecherabhängig und muss durch den jeweiligen Nutzer trainiert werden, um eine hohe Erkennungsquote zu erreichen.<ref>Simon 0.2 geht in den Endspurt, Pro-Linux.de, 13. Januar 2009</ref> Nach Ende der Förderungszeitraum hat Peter Grasch Simon bis zur Version 0.4 weiterentwickelt und als Open-Source-Spracherkennungssoftware in die Linux Desktoberfläche KDE überführt<ref>KDE Application Simon (2015). Abgerufen am 5. Februar 2021.</ref>.

VoxForge

Das Projekt VoxForge treibt die Entwicklung von freien Sprachmodellen für Julius und ähnliche Plattformen (wie CMU Sphinx) voran.

Lizenzbedingungen

Julius wird unter einer eigenen Lizenz vertrieben, die die üblichen liberalen Nutzungsrechte freier Software gewährt (freie Verbreitung und Modifizierung, Verfügbarkeit des Quellcodes). Sie besitzt eine Copyleft-Klausel; auch Weiterentwicklungen des Programms dürfen nur unter derselben, unmodifizierten Lizenz veröffentlicht werden. Im Unterschied zur GPL legt die Lizenz fest, dass der Name des Programms bei mit seiner Hilfe erbrachten neuen Entwicklungen genannt werden muss.<ref name="Lizenz" />

Weblinks

Einzelnachweise

<references />