Wikipedia:WikiReader/Laub- und Nadelbäume Mitteleuropas/wiki2latex
Erscheinungsbild
Ich möchte an dieser Stelle an Dokutexit weiterverweisen, das auf php basiert und gute Arbeit in der Konvertierung von Wikicode in LaTeX-Code leistet.
wiki2latex (ehem. wiki2tex) soll es ermöglichen, Wikipedia-Quelltext ins LaTeX-Markup zu konvertieren. Derzeit liegt es als Wordmakro vor.
Nur Text und Formatierungen sollen übertragen werden. Der Konverter soll das Erstellen von WikiReadern erleichtern, da die konvertierten Artikel nur mehr in eine LaTeX-Hauptdatei eingebunden werden müssen (\input), ausgewählte Bilder werden nachträglich hinzugefügt.
To Do
- Aufzählungen mit hängendem Einzug formatieren, Aufzählungen 2.Ord.
Konvertierungsablauf
---> WICHTIG: in Word "Autoformat während Eingabe":
typograf. Anführungszechen deaktivieren
KONVERTIERUNG PER MS WORD - MAKRO
WIKICAPTION:
Finde erstes '''Wort''' und setze als \subsection
FORMATIERUNGEN
Strg+H, normal:
1) Allgem. Ersetzen:
löschen
<i> und </i> zu ''
zu \, (*)
alle ''''' zu '''
% zu \%
~ zu - (*)
Bindestriche zu -- (*)
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
2) Kursive u. fette Auszeichnungen umwandeln
Strg+H, Platzhalter
'''*''' zu ^092textbf{^&}
''' löschen
''*'' ersetzen durch ^092emph{^&}
'' löschen
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
3) Überschriften
Strg+H, Platzhalter:
====*==== ersetzen durch ^092minisec{^&}
==== löschen
===*=== ersetzen durch ^092subsubsection{^&}
=== löschen
==*== ersetzen durch ^092subsection{^&}
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
4) Anführungszeichen
Strg+H, Platzhalter:
"*" zu "`^&"'
Strg+H, normal
`" zu `
"" zu "
„ ersetzen durch "` und “ durch "'
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
AUFZÄHLUNGEN / SONST:
Strg+H, normal: SUCHRICHTUNG NACH UNTEN
"Absatz-Stern" ersetzen durch 2 Absätze und \textbf{*}
<br /> zu \\
<br/> zu \\
<br> zu \\
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
LINKS
Bilder entfernen,
Linkziele entfernen
Strg+H, normal:
[[ durch §§ ersetzen
]] durch $$
$$^p durch zxx
Str+H, Platzhalter:
§§Bild:*zxx löschen
§§Image:*zxx löschen
Suchrichtung nach OBEN!
§§*| löschen
Suchrichtung wieder "GESAMT"
$$ und §§ entfernen.
zxx ersetzen durch ^p^p
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
BEREINIGEN / SONST
<!-- bis -->(Kommentare) / galleries / Formeln löschen:
<!-- zu zzyy / -->^p zu yyzz
zzyy*yyzz löschen
gallery*gallery -es bleibt <>
Strg+H, normal:
alle <> löschen
² durch $^^2$ ersetzen
"{ " durch "{" ersetzen (Leerzeichen entfernen)
" }" durch "}" ersetzen
<ref> und <math> entfernen.
Nach Zahlen geschütztes Leerzeichen:
0-9 und Leerzeichen --> 0-9 und ~ (Tilde)
"Arten-gekreuzt"-x durch normales x ersetzen
Gedankenstrich zu '--'
LaTeX
Hauptdatei
Zweispaltiger Satz mit Bildern
Hierarchie:
chapter: Laubbäume/Nadelbäume section: Gattung (zB Buchen) subsection Art (zB Rotbuche) subsubsection == minisec === paragraph ====
\documentclass[a4paper,DIV16,10pt,twocolumn]{scrreprt}
\usepackage[toc]{multitoc} %zweispaltiges Inhaltsverzeichnis
\columnsep.8cm %Spaltenabstand
\renewcommand{\baselinestretch}{1.1} %Zeilenabstand
\renewcommand{\floatpagefraction}{.9}
\usepackage [ngerman] {babel}
\usepackage[latin1]{inputenc}
\usepackage[T1]{fontenc}
\usepackage{lmodern} %Schriftart
\usepackage{microtype} %Mikrotypografie/Schriftskalierung
\usepackage{graphicx} %Grafikmodul
\usepackage{picins} %Grafikmodul
\usepackage[font={small,sf}]{caption} %Label/Bildbeschriftung serifenlos
\setkomafont{sectioning}{\normalcolor\bfseries} %Serifenüberschriften
\addto\captionsngerman{
\renewcommand{\figurename}{\sffamily\bfseries Abb.} %Abbildung -> Abb.
}
%~~~~~~~ Kopf- und Fußzeile ~~~~~~~
\usepackage{fancyhdr}
\pagestyle{fancy}
\fancyhf{} % Alle Felder löschen
\fancyhead[L]{\scshape\nouppercase{\leftmark}} % Linke Kopfzeile: section
\fancyhead[R]{\scshape\nouppercase{\rightmark}} % Rechte Kopfzeile: subsection
\fancyfoot[C]{\thepage} %Seitennummer
\fancyfoot[R]{\sffamily\tiny\today} %Datum der Kompilierung
\renewcommand{\sectionmark}[1]{
\markboth{\thesection{} #1}{}
}
\renewcommand{\subsectionmark}[1]{
\markright{\thesubsection{} #1}
}
\renewcommand{\subsectionmark}[1]{\markright{#1}}
%\renewcommand{\headrulewidth}{0.4pt} %obere Trennlinie
%\renewcommand{\footrulewidth}{0.4pt} %untere Trennlinie
%~~~~~~~ PDF-Info ~~~~~~~
\pdfinfo{
/Title (Laub- und Nadelbäume Mitteleuropas)
/Subject (Botanik -- WikiReader)
/Author (Wikipedia / Wikipeditor: Michael Gasperl)
/Keywords (Laubbäume,Nadelbäume,Europa)
}
\begin{document}
\tableofcontents
%\chapter{Allgemein}
%\section{Der Baum}
%\input{0000Baum}
%\chapter{Laubbäume}
%\section{Buchen}
%\input{0100Buchen.tex}
%\subsection{Rotbuche}
%\input{0101Rotbuche.tex}
\end{document}
Bilder werden in die einzelnen Subdateien eingebunden:
Normales Bild/Spaltenbreite:
\begin{figure} [tbp]
\includegraphics[width=1\linewidth]{Bild}
\caption{Beschriftung}
\end{figure}
Kleines Absatzbild:
\parpic[r]{\includegraphics [width=3.5cm]{Bild}}