Zum Inhalt springen

Whitespace (Programmiersprache)

aus Wikipedia, der freien Enzyklopädie
Dies ist die aktuelle Version dieser Seite, zuletzt bearbeitet am 8. Dezember 2024 um 11:12 Uhr durch imported>Siegbert v2 (Fast alle Quellen / Weblinks waren inzwischen offline => Archivversion oder alt. URL / Quellen formatiert und bib. Angaben ergänzt).
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)
Datei:Whitespace in vim2.png
Whitespace-Quellcode mit Syntax-Highlighting
  • Tabulatorzeichen
  • Leerzeichen
  • Whitespace ist eine im Jahr 2002 entwickelte esoterische Programmiersprache. Die Befehle und Steueranweisungen bestehen im Gegensatz zu üblichen Programmiersprachen aus definierten Folgen von Leerzeichen, Tabs und Zeilenumbrüchen (engl. Whitespaces). Neben dieser offensichtlichen Eigenart verwendet Whitespace das übliche Dualsystem nur für Daten; der Programmcode wird in einem dreiwertigen Stellensystem („l“, „t“, „u“ oder engl. “s”, “t”, “l”) abgebildet.

    Syntax

    Die Befehle und Steueranweisungen bestehen aus definierten Folgen von Leerzeichen (l), Horizontal-Tabulatorzeichen (t) und Zeilenumbrüchen (u).

    Es gibt kein Syntaxelement zur Kennzeichnung von Kommentaren. Stattdessen können Kommentare, die selbst keine Whitespaces enthalten dürfen, an beliebigen Stellen im Quellcode eingegeben werden. Der Interpreter ignoriert alle Zeichen, die für ihn keine Bedeutung haben.

    Befehle

    Die Befehle lassen sich grob in fünf Bereiche einteilen:

    Zeichen Bedeutung
    l Stack-Zugriff
    tl Rechenfunktionen
    tt Heap-Speicher-Zugriff
    u Schleifen, Sprünge, Bedingungen
    tu Ein-/Ausgabe von Werten

    Eine genaue Beschreibung der einzelnen Befehle inklusive erwarteter Parameter befindet sich auf der unten genannten Webseite.

    Daten

    Während die Befehle ein dreiwertiges Stellensystem verwenden, werden die Daten im dualen System abgebildet: An der ersten Stelle von links steht ein t für eine negative Zahl; ein l für eine positive. Im weiteren Verlauf steht t für 1 und l für 0. Die Spezifikation besagt, dass Zahlen eine beliebige Bitlänge haben können, allerdings können Compiler und Interpreter hier eine sinnvolle Obergrenze festlegen. Abgeschlossen wird ein Datum durch einen Zeilenumbruch.

    Sprache

    Whitespace ist eine imperative, stackbasierte Programmiersprache, die den Programmierern einen Stack und Heap zur Verfügung stellt.

    Alle Operationen arbeiten intern auf Ganzzahlen beliebiger Bit-Länge. Es besteht allerdings die Möglichkeit, ein Zeichen auszugeben, das durch seinen ASCII-Code-Wert identifiziert wird (outchar).

    Geschichte und Hintergrund

    Whitespace wurde Ende 2002 von Edwin Brady und Chris Morris entwickelt. Slashdot berichtete am 1. April 2003 über diese Programmiersprache.<ref name="slashdot">New Whitespace-Only Programming Language. In: developers.slashdot.org. 1. April 2003, abgerufen am 19. Mai 2008 (Lua-Fehler in Modul:Multilingual, Zeile 153: attempt to index field 'data' (a nil value)).</ref> Mitte 2003, mit der Fertigstellung eines Whitespace-Interpreters in Whitespace, hat die Sprache die Kinderstube verlassen. Bereits fünf Jahre zuvor hatte Bjarne Stroustrup die Idee in einem Entwurf für C++2000 erwähnt. Seine Grundidee war, dass Mathematiker üblicherweise statt des Malzeichens ein Leerzeichen notieren. Diesem Leerzeichen könnte man also in C++2000 die Bedeutung der Multiplikation zuordnen.<ref name="Stroustrup">Bjarne Stroustrup: Generalizing Overloading for C++2000. (PDF; 33 kB) In: stroustrup.com. AT&T Labs, 1998, abgerufen am 21. Oktober 2007 (Lua-Fehler in Modul:Multilingual, Zeile 153: attempt to index field 'data' (a nil value)).</ref>

    Whitespace zeigt eine gewisse Ähnlichkeit mit Python-Programmen und make-Dateien, denn dort steuern Tabulatorzeichen am Zeilenanfang den Programmablauf. Die meisten anderen Programmiersprachen ignorieren Whitespaces. Für den menschlichen Betrachter dienen sie jedoch einer nützlichen Strukturierung, die den Programmcode besser lesbar machen kann.

    Vorteile seien laut den Erfindern, dass massenhafte Ausdrucke von Quelltexten Tinte sparen und dass Spione, die Code entwendet haben, diesen nicht entschlüsseln können. Allerdings bleiben noch Probleme bestehen, wenn man den Code nach dem Ausdrucken wieder eingeben möchte.

    Whitespace eignet sich besonders gut zum Verbergen von Programmcode in normalem Text ähnlich der Steganographie. Ein Beispiel dafür findet sich in einem Beitrag des International Obfuscated C Code Contest.

    Hello World

    Das unten dargestellte „Hello, world!“-Programm: <syntaxhighlight lang="text">

    lllullltlltllluttlllltulllttlltltuttlllltlulllttlttlluttllllttulllttlttlluttllll
    tllulllttlttttuttlllltltullltlttlluttllllttlullltllllluttlllltttullltttltttuttll
    lltlllulllttlttttuttlllltlltullltttlltluttlllltltlulllttlttlluttlllltlttulllttll
    tlluttllllttllullltlllltuttllllttltulllttltuttlllltttlullltltluttllllttttullllut
    tllllluulllltulultttlulutlltlutullllltutlllululltuullltluuuu
    

    </syntaxhighlight>

    Entwicklungsumgebungen

    Der Editor Vim bietet von Haus aus ein Syntax-Highlighting für Whitespace an, wodurch die Programmierung deutlich vereinfacht wird. Dies läuft allerdings einem Designziel der Sprache, beim Ausdruck möglichst wenig Tinte zu verbrauchen, entgegen. Einen Mode für Emacs gibt es bei den Weblinks.

    Das oben und unten dargestellte "Hello, world!" kann mit einem der folgenden Skripts in richtiges Whitespace konvertiert werden: <syntaxhighlight lang="bash">

    #!/bin/sh
    sed "s/ //g;s|//.*||g;s/\\n//g" $1 | tr -d '\n' | sed "s/l/ /g;s/t/\t/g;s/u/\n/g"
    
    #!/bin/sh
    sed "s|//.*||g" < $1 | tr -d " \t\n" | tr ltu " \t\n"
    

    </syntaxhighlight> sed ist ein Unix-Werkzeug zur Bearbeitung von Text.

    Whitespace-Assembler

    Da der Umgang mit trinär kodierten Maschinenbefehlen relativ mühsam ist, wird häufig ein äquivalenter Assembler-Dialekt verwendet: <syntaxhighlight lang="text">

    // "Hello, world!" in den Speicher schreiben
    lllu          // push 0   // Speicherstelle 0
    llltlltlllu   // push 'H' // Zeichen 'H'
    ttl           // store    // in den Speicher
    llltu         // push 1   // ...
    lllttlltltu   // push 'e'
    ttl           // store
    llltlu        // push 2
    lllttlttllu   // push 'l'
    ttl           // store
    

    […]

    lllttllu      // push 12
    llltlllltu    // push '!'
    ttl           // store
    lllttltu      // push 13
    lllttltu      // push \r
    ttl           // store
    llltttlu      // push 14
    llltltlu      // push \n
    ttl           // store
    lllttttu      // push 15
    llllu         // push 0
    ttl           // store
    
    // Ausgabe-Schleife:
    llllu         // push 0
    ulllltu       // 1:          // /Schleife
       lul           // dup      // | --.
       ttt           // pop      // |   --- Spitze des Stacks untersuchen
       lul           // dup      // | --'
       utlltlu       // jz 2     // | ----> bei 0 sind wir fertig
       tull          // outchar  // | ----> Ausgabe
       llltu         // push 1   // | --._. Speicherstelle hochzaehlen
       tlll          // add      // | --'
    ululltu       // jmp 1       //  \naechster Durchlauf
    ullltlu       // 2:          //
    uuu           // halt        // ende
    

    </syntaxhighlight>

    Literatur

    Weblinks

    • The Whitespace Homepage. In: compsoc.dur.ac.uk. Archiviert vom Vorlage:IconExternal am 26. April 2015; (Lua-Fehler in Modul:Multilingual, Zeile 153: attempt to index field 'data' (a nil value)).
    • Tutorial. In: compsoc.dur.ac.uk. Archiviert vom Vorlage:IconExternal am 5. April 2003; (Lua-Fehler in Modul:Multilingual, Zeile 153: attempt to index field 'data' (a nil value)).
    • Emacs-Mode. In: compsoc.dur.ac.uk. Archiviert vom Vorlage:IconExternal am 14. Juni 2004; (Lua-Fehler in Modul:Multilingual, Zeile 153: attempt to index field 'data' (a nil value)).
    • Whitespace-Interpreter. In: kryptografie.de..

    Einzelnachweise

    <references />