Wikipedia:WikiReader/Laub- und Nadelbäume Mitteleuropas/wiki2latex

Diese Seite gehört zum Wikipedia-Archiv.

Ich möchte an dieser Stelle an Dokutexit weiterverweisen, das auf php basiert und gute Arbeit in der Konvertierung von Wikicode in LaTeX-Code leistet.

wiki2latex (ehem. wiki2tex) soll es ermöglichen, Wikipedia-Quelltext ins LaTeX-Markup zu konvertieren. Derzeit liegt es als Wordmakro vor.

Nur Text und Formatierungen sollen übertragen werden. Der Konverter soll das Erstellen von WikiReadern erleichtern, da die konvertierten Artikel nur mehr in eine LaTeX-Hauptdatei eingebunden werden müssen (\input), ausgewählte Bilder werden nachträglich hinzugefügt.

Wordmakro und Quelltext

To Do

Aufzählungen mit hängendem Einzug formatieren, Aufzählungen 2.Ord.

Konvertierungsablauf

---> WICHTIG: in Word "Autoformat während Eingabe":
     typograf. Anführungszechen deaktivieren

KONVERTIERUNG PER MS WORD - MAKRO

WIKICAPTION:
Finde erstes '''Wort''' und setze als \subsection

FORMATIERUNGEN

Strg+H, normal:
1) Allgem. Ersetzen:
   löschen
 <i> und </i> zu '' 
   zu \, (*)
 alle ''''' zu '''
 % zu \%
 ~ zu - (*)
 Bindestriche zu -- (*)

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2) Kursive u. fette Auszeichnungen umwandeln
Strg+H, Platzhalter
 '''*''' zu ^092textbf{^&}
 ''' löschen
 ''*'' ersetzen durch ^092emph{^&} 
 '' löschen

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
3) Überschriften


Strg+H, Platzhalter:
 ====*==== ersetzen durch ^092minisec{^&}
 ==== löschen
 ===*=== ersetzen durch ^092subsubsection{^&}
 === löschen
 ==*== ersetzen durch ^092subsection{^&} 

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
4) Anführungszeichen
Strg+H, Platzhalter: 
 "*" zu "`^&"'

Strg+H, normal
 `" zu `
 "" zu "
 „ ersetzen durch "` und “ durch "'

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
AUFZÄHLUNGEN / SONST:
Strg+H, normal: SUCHRICHTUNG NACH UNTEN
 "Absatz-Stern" ersetzen durch 2 Absätze und \textbf{*}

 <br /> zu \\
 <br/> zu \\
 <br> zu \\
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
LINKS

Bilder entfernen,
Linkziele entfernen

Strg+H, normal:
 [[ durch §§ ersetzen
 ]] durch $$
 $$^p durch zxx

Str+H, Platzhalter:
 §§Bild:*zxx löschen
 §§Image:*zxx löschen 

Suchrichtung nach OBEN!
 §§*| löschen
Suchrichtung wieder "GESAMT"

 $$ und §§ entfernen.
 zxx ersetzen durch ^p^p
 
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
BEREINIGEN / SONST
<!-- bis -->(Kommentare) / galleries / Formeln löschen:

 <!-- zu zzyy / -->^p zu yyzz
 zzyy*yyzz löschen

 gallery*gallery -es bleibt <>


Strg+H, normal:
alle <> löschen
 
² durch $^^2$ ersetzen
"{ " durch "{" ersetzen (Leerzeichen entfernen)
" }" durch "}" ersetzen

<ref> und <math> entfernen.

Nach Zahlen geschütztes Leerzeichen:
0-9 und Leerzeichen --> 0-9 und ~ (Tilde)
"Arten-gekreuzt"-x durch normales x ersetzen
Gedankenstrich zu '--'

LaTeX

Hauptdatei

Zweispaltiger Satz mit Bildern

Hierarchie:

chapter:      Laubbäume/Nadelbäume
section:      Gattung (zB Buchen)
subsection    Art (zB Rotbuche)
subsubsection ==
minisec       ===
paragraph     ====

\documentclass[a4paper,DIV16,10pt,twocolumn]{scrreprt} 
\usepackage[toc]{multitoc} %zweispaltiges Inhaltsverzeichnis
\columnsep.8cm %Spaltenabstand
\renewcommand{\baselinestretch}{1.1} %Zeilenabstand
\renewcommand{\floatpagefraction}{.9}
\usepackage [ngerman] {babel} 
\usepackage[latin1]{inputenc} 
\usepackage[T1]{fontenc} 
\usepackage{lmodern} %Schriftart
\usepackage{microtype} %Mikrotypografie/Schriftskalierung
\usepackage{graphicx} %Grafikmodul
\usepackage{picins}  %Grafikmodul
\usepackage[font={small,sf}]{caption} %Label/Bildbeschriftung serifenlos

\setkomafont{sectioning}{\normalcolor\bfseries} %Serifenüberschriften
\addto\captionsngerman{
  \renewcommand{\figurename}{\sffamily\bfseries Abb.} %Abbildung -> Abb.
}

%~~~~~~~ Kopf- und Fußzeile ~~~~~~~
\usepackage{fancyhdr}
\pagestyle{fancy}
\fancyhf{} % Alle Felder löschen
\fancyhead[L]{\scshape\nouppercase{\leftmark}} % Linke Kopfzeile: section
\fancyhead[R]{\scshape\nouppercase{\rightmark}}  % Rechte Kopfzeile: subsection
\fancyfoot[C]{\thepage} %Seitennummer
\fancyfoot[R]{\sffamily\tiny\today} %Datum der Kompilierung
  \renewcommand{\sectionmark}[1]{
    \markboth{\thesection{} #1}{}
     }
    \renewcommand{\subsectionmark}[1]{
    \markright{\thesubsection{} #1}
    }
  \renewcommand{\subsectionmark}[1]{\markright{#1}}
%\renewcommand{\headrulewidth}{0.4pt} %obere Trennlinie
%\renewcommand{\footrulewidth}{0.4pt} %untere Trennlinie

%~~~~~~~ PDF-Info ~~~~~~~
\pdfinfo{            
          /Title      (Laub- und Nadelbäume Mitteleuropas)
          /Subject    (Botanik -- WikiReader)           
          /Author     (Wikipedia / Wikipeditor: Michael Gasperl)
          /Keywords   (Laubbäume,Nadelbäume,Europa)          
}


\begin{document}
\tableofcontents 

%\chapter{Allgemein}
%\section{Der Baum}
%\input{0000Baum}

%\chapter{Laubbäume}
%\section{Buchen}
%\input{0100Buchen.tex}
%\subsection{Rotbuche}
%\input{0101Rotbuche.tex}

\end{document}

Bilder werden in die einzelnen Subdateien eingebunden:

Normales Bild/Spaltenbreite:

\begin{figure} [tbp] 
  \includegraphics[width=1\linewidth]{Bild}  
  \caption{Beschriftung} 
\end{figure}

Kleines Absatzbild:

\parpic[r]{\includegraphics [width=3.5cm]{Bild}}

Dateien