Wikisource:RE-Werkstatt/Anleitung

Realencyclopädie der classischen Altertumswissenschaft
[[Bild:|220px|Realencyclopädie der classischen Altertumswissenschaft]]
Anleitung zur Mitarbeit und zur Nutzung
Commons-logo.svg Bilder und Medien bei Commons
Wikiquote-logo.svg [[q:{{{WIKIQUOTE}}}|Zitate bei Wikiquote]]
Eintrag in der GND: {{{GND}}}
Weitere Angebote

RE EditionsrichtlinienBearbeiten

Ergänzend zu den übergordneten von Wikisource:Editionsrichtlinien gilt für Paulys RE:

  • Es werden Artikel von RE-Autoren aufgenommen, die vor mindestens 70 Jahren verstorben sind oder vor 1873 geboren sind, wenn deren Sterbedatum nicht ermittelbar sein sollte, oder wenn kurze Artikel keine Schöpfungshöhe aufweisen.
  • Für Scans gilt
    • eine Namenskonvention Pauly-Wissowa [Halbband], [Spalte vierstellig].jpg, der Halbband ist wie im Register „VI A,1“ anzugeben, die Spalte ist vierstellig mit führenden Nullen.
    • dass nur Gemeinfreies auf Wiki hochgeladen werden darf. Größere Artikel nicht gemeinfreier Autoren müssen im Scan unleserlich gemacht werden (geweißt oder überblendet).
  • Ansetzung
  • Formales Gerüst der Artikel
    • Jeder Artikel beginnt mit der ausgefüllten REDaten-Vorlage, die Parameter sind in der Vorlage erklärt.
    • Das Autorenkürzel am Ende des Artikels wird mit {{REAutor|Autorenkürzel.}} in einer neuen Zeile angefügt
    • Bloße Verweisungen gehören in die Kategorie:RE:Verweisung.
  • Textformatierung
    • Gesperrte Wörter (meist Namen von Forschern und Altphilogogen) werden mit der Vorlage:SperrSchrift wiedergegeben: „{{SperrSchrift|Gesperrt}}“ ergibt Gesperrt.
    • Geviertstriche (—) werden als Halbgeviertstriche (–) wiedergegeben.
    • sonstige Schriftauszeichnungen wie fett ('''fett''') und kursiv (''kursiv'') werden entsprechend wiedergegeben.
    • Griechische Schrift wird zwecks besserer Lesbarkeit mit der Vorlage:Polytonisch eingebunden. Auch wenn die Typen des Originals kursiv wirken, wird die griechische Schrift hier nicht kursiv formatiert, siehe RE:Ἀβάλας λιμήν.
    • Hebräische Schrift wird zwecks besserer Lesbarkeit mit der Vorlage:Hebräisch eingebunden, siehe RE:Biene.
  • Sortierung
    • Die RE arbeitet mit dem lateinischen Alphabet der Antike: ABCDEFGHIKLMNOPQRSTUXYZ. Es gilt I = J, U = V = W. Die Sortierung erfolgt nach I bzw. V.
    • Getrennt geschriebene Lemmata werden getrennt sortiert (RE:Libri Sibyllini vor RE:Libria), allerdings immer mit Großschreibung (RE:Libri haruspicini wird sortiert „Libri Haruspicini“).
    • Die Lemmata stehen bisweilen im Griechischen Alphabet: ΑΒΓΔΕΖΗΘΙΚΛΜΝΞΟΠΡΣΤΥΦΧΨΩ. Die Transliteration ins lateinische Alphabet ist regelmäßig (ABGDEZEThIKLMNXOPRSTYPhChPsO), abgesehen von dem als U übertragenen Diphthong ου. Vor Velar (γ, κ, χ) wird γ mit n umgeschrieben (und sortiert).
    • Bei Lemmata, die mehr als neun Unterkapitel (= Nummern) haben (siehe z. B. RE:Alexandros …), wird die Sortierung mit vorangehender Null vorgenommen. Als Beispiel siehe RE:Alexandros 1 (dreistellig) und RE:Abas 1 (zweistellig).
    • Im Zweifel gilt die Reihenfolge im gedruckten Original.
  • Umgang mit den Supplementen
    • Einzuschiebende Artikel werden ganz normal eingestellt (Beispiele: RE:Aba 1a, RE:Acutius a).
    • Nachträge und Berichtigungen werden wie im jeweiligen Artikel eingefügt, RE:Adoniastai, RE:Barcae).
    • Nachträge und Berichtigungen der ersten Bände, die in einem Supplementband wiederholt sind, werden aus dem Hauptalphabet eingefügt (Beispiel: RE:Batis 2).
  • Zwischentitel
    • Im Original gedruckte Zwischentitel können als Inhaltsverzeichnis mit __TOC__ und {{Überschrift|...}} formatiert werden.
    • Im Artikel enthaltene Aufzählungen und Gliederungen können formatiert werden, z. B. Jahrzahlen im Lebenslauf, »weniger ist mehr«.
  • Verweise
    • Ein Verweis in der RE ist ein ganz kurzer Artikel der Redaktion zu einem Stichwort, das auf ein anderen Artikel hinweist, ohne Angabe eines Autors und oft mit nur drei Worten, z. B. "Lemma s. Artikel." Wenn ein Artikel inhaltliche Informationen enthält, dann ist es kein Verweis. Beispiele:
    • 'siehe die Nachträge' oder 'siehe die Supplemente' sind gültige Verweise, auch ohne Link.
    • 'Hund des Aktaion' ist kein Verweis.

RE RegisterBearbeiten

In der zentralen RE-Datenbank werden die Metadaten aller Artikel verwaltet, sowohl für die geplanten Artikel wie auch für die bereits erfassten. Ein nächtlich ablaufendes Programm (= Bot) sorgt für Ordnung. Jeweils ab 04:00 Uhr wird das Register aktualisiert.

Die Register sind je Band organisiert, die alphabetischen Listen und die Register je Autor sind Zusammenfassungen. Unstimmigkeiten bei den Lemmata oder bei den Nachträgen sind auf der Ebene Band zu korrigieren. Dabei kann das Register über die Metadaten je Artikel aktualisiert werden. In den meisten Fällen kann der Fehler im Block {{REDaten|... }} behoben werden.

KurzbeschreibungBearbeiten

Die Kurzbeschreibung für jeden Artikel hat zum Ziel:

  • eine prägnante Zusammenfassung des Artikels, das Wichtige zuerst
  • kurze und eindeutige Beschreibung, die allgemein verständlich ist
  • maximal zwei Zeilen in der Info-Box, ohne Abkürzungen, rund 80 Zeichen.

Die Kurzbeschreibung hat folgende Eigenschaften:

  • Einordnung und Präzisierung: »athenischer Feldherr, gefallen 430/29 v. Chr.«
  • statt »Ort« besser »Stadt in Kreta«, statt »Person« besser »Mutter des Iason«
  • statt »Hundename« besser »einer der Hunde, die Aktaion zerrissen«
  • statt »im J. 430« besser »430 n. Chr.«
  • statt »lyd.« oder »lydischer« besser »in Lydien«
  • statt »nach einem Kultverein des Dionysos genannte Quelle« besser »Quelle, benannt nach Kultverein des Dionysos«
  • statt »Aegypten, Aigypten« besser »Ägypten«

Speziell:

  • Die Kurzbeschreibungen werden gelesen als: LEMMA, »grosse Stadt«. Das erste Wort wird ‚klein‘ geschrieben
  • nur Text, ohne Formatierung, das Komma (,) zur Gliederung und als Lesehilfe
  • Abkürzungen höchtens für eindeutige Worte:
    • Jahrzahlen in der Regel am Schluss mit „v. Chr.“ oder „n. Chr.“
    • Jh. = Jahrhundert, * = geboren, † = gestorben, ? = unsicher
    • cos. = Konsul und andere Konventionen auf Inschriften
    • Alexander d. Gr., westl. = westlich, Nr. = Nummer, vgl., etc.
  • griechischen Buchstaben vermeiden, allenfalls eine Transkription des Lemmas
  • ohne Quellen oder Belegstellen, höchstens Cicero, Ovid, Homer ...

RE SchöpfungshöheBearbeiten

Das Allgemeine zur Schöpfungshöhe von Artikeln ist in der Wikipedia unter w:Schöpfungshöhe dargelegt. Eine Diskussion für die RE wurde 2011 geführt, sie ist mittlerweile überholt. Siehe die Argumente unter Diskussion:Paulys Realencyclopädie der classischen Altertumswissenschaft/Archiv#Vorösterliche Löschwut.

Artikel ohne Schöpfungshöhe sind genauso gemeinfrei wie Artikel, deren Autor seit mindestens 70 Jahren tot ist. Daher können RE-Artikel mit einem Umfang von bis zu zwei Sätzen editiert werden, auch wenn der Autor noch keine 70 Jahre verstorben ist. Diese Artikel sind zu versehen mit den Parametern

|KEINE_SCHÖPFUNGSHÖHE=ON
|TODESJAHR=19xx

oder

|KEINE_SCHÖPFUNGSHÖHE=ON
|GEBURTSJAHR=18xx

Titel und Zitate sowie Stellen- und Literaturangaben zählen nicht zum genannten Umfang von ‚bis zu zwei Sätzen‘. Bei auflistenden Artikeln ist es gut möglich, dass umfangreichere Texte keine Schöpfungshöhe haben. Umgekehrt können Artikel, deren Umfang weniger als drei Sätze beträgt, durchaus eine Schöpfungshöhe haben, wenn sich eine eigene Positionierung des Autors findet, z. B. in der Abwägung von Forschungsmeinungen.

BeispieleBearbeiten

  1. Die Faustregel ‚4 Druckzeilen im Original der RE‘ hilft zur ersten Beurteilung, ob der Artikel gemeinfrei ist. Diese Regel ist auf der sicheren Seite.
  2. Balbus 4 und Rufinus 8 sind gemeinfreie Aufzählungen ohne Schöpfungshöhe.
  3. Atargatis ist auch mit Nachtrag gemeinfrei, denn ohne Stellen- und Literaturangaben besteht er nur aus dem Titel »Semitische Göttin, welche im Abendlande gewöhnlich unter dem Namen Dea syra bekannt wurde.« Ein inhaltlicher Satz ist nicht erkennbar.
  4. Asteria 9 und Volumnius 21 sind gemeinfrei, da sie nur zwei Sätze umfassen.
  5. Asterios 14 ist gemeinfrei, weil der Autor vor mehr als 70 Jahren gestorben ist (Gustav Adolf Jülicher, † 2. August 1938). Aber er hat eine Schöpungshöhe:
    1. Titel: Asterius Urbanus, bekannt nur durch Euseb. hist. eccl. V 16, 17,
    2. Zitat: »wo ein Citat ... τὸ διὰ Μαξιμίλλης πνεῦμα
    3. Drei Sätze zum montanistischen Schriftsteller mit Forschungsmeinungen.

Neue RE:ArtikelBearbeiten

Diese Anleitung zu Paulys Realencyclopädie der classischen Altertumswissenschaft zeigt, wie neue RE:Artikel anzulegen sind, sie ist Teil der RE-Werkstatt. Die ersten Schritte können durch einen Artikelwunsch ersetzt werden, die Profis unterstützen gerne bis zum Status "Artikel eröffnet, OCR vollständig, Text vorverarbeitet, unkorrigiert". Diese Arbeiten umfassen also:

  1. Gehe im pasenden Register auf zum gewünschten Artikel und vergewissere Dich, dass er gemeinfrei ist, d. h. dass der Verfasser vor mehr als 70 Jahren gestorben ist. Rufe den fetten, roten Link durch Anklicken auf → eine Blanko-Maske erscheint, Erstellen von „RE:xyz“ für das gewählte Lemma.
  2. Suche den Volltext als Scan.
  3. Nutze ein passendes Programm für die OCR-Verarbeitung, z. B. ABBYY-Fine-Reader, und konvertiere den Scan zu Text. → Speichere den gewonnenen Text in der Blanko-Maske.
  4. Pflege die '''{{REDaten''' ganz am Anfang:
Parameter und Metadaten Beispiel Legende

{{REDaten
|BAND=
|SPALTE_START=
|SPALTE_END=
|VORGÄNGER=
|NACHFOLGER=
|SORTIERUNG=
|KORREKTURSTAND=
|KURZTEXT=
|WIKIPEDIA=
|WIKISOURCE=
|GND=
|KEINE_SCHÖPFUNGSHÖHE=
|TODESJAHR=
|GEBURTSJAHR=
|NACHTRAG=OFF
|ÜBERSCHRIFT=OFF
|VERWEIS=OFF
}}
Text aus Pauly RE
{{REAutor|xyz.}}

leer
IV,2
1946
OFF
Daai
Dabana 2
leer
korrigiert
Ort in Killikien



OFF


OFF
OFF
OFF
leer
Scanner
Keune.

Der Blockanfang
zwingend
zwingend
bedeutet eine (1) Spalte
zwingend
zwingend
Τρανσκριπτιον δερ Λέμμα
zwingend
kurze Beschreibung
wenn bekannt
wenn bekannt
wenn bekannt
ON = gemeinfrei
zu Schöpfungshöhe ON
zu Schöpfungshöhe ON
ON für alle Nachträge
ON für den 1. Nachrag
in der Regel
Das Blockende
dem Original folgend
zwingend mit .

Legende:

  • NACHTRAG=OFF steht einzig beim Haupteintrag je Lemma. Dies ist der Normalfall, wenn das Lemma zum ersten Mal aufgeführt wird. Dabei spielt es keine Rolle, ob dieser Eintrag im regulären Band an der richtigen Stelle steht, oder in einem Supplement folgt, oder ganz am Schluss eines Bandes unter dem Seitentitel »Nachträge und Korrekturen« kommt, weil der Text zu spät an die Druckerei geliefert wurde, oder gar dort unters Eis geriet.
  • NACHTRAG=ON wird bei allen inhaltlichen oder formalen Ergänzungen zu Lemmata gesetzt. Die Nachträge können mehrfach folgen und in verschiedenen Bänden eingereiht sein, beispielsweise im Registerband. Meistens handelt es sich um (L) = Literaturnachträge, (K) = Korrekturen oder (P) = Parallelstellen, die irrtümlich doppelt gedruckt sind. Manchmal wird ein Artikel auch (E) = ersetzt. In den Metadaten {{REDaten|...}} beziehungsweise mit der Infoboxen der rechten Spalte sind Nachträge für die Leser erkennbar. Vorsicht, je nach Arbeitstechnik kann ein Nachtrag auch vor dem Hauptteil des Lemma in der RE erfasst werden! Die Wirkung von NACHTRAG=ON ist ein fetter, blauer Link [Abschnitt korrekturlesen], der zum richtigen Scan führt.
  • ÜBERSCHRIFT=OFF ist der Normalfall.
  • ÜBERSCHRIFT=ON veranlasst einen Zwischentitel im Layout zwischen dem Haupteintrag und den Nachträgen. Dieser Parameter ist pro Artikel beim ersten Nachtrag auf ON gesetzt, also höchstens einmal. Bei den folgenden Nachträgen wird diese Überschrift nicht mehr gesetzt. Die Wirkung ist eine unterstrichene Titelzeile »Nachträge und Berichtigungen«.
  • VERWEIS=ON ist vorgesehen für minimale Artikel, die nur aus einem Verweis auf einen anderen Artikel bestehen, siehe dort.
  • {{REAutor|OFF.}} wird bei Verweisen notiert, wenn kein Autor erkennbar ist.

Der Inhalt folgt dem Original, so wie bei allen Artikeln in Wikisource.

  • Ergänze temporär den Link zur Anfangsseite, um den Scan eingeblendet zu bekommen, bspw. {{Seite|124||{{REIA|III,1|123}}}}. STR + a, dann STR + c und ENTER.
  • Klicke gemäss vorigem Beispiel auf Button [124]. Es erscheint der Scan, die gesamten eingegebenen Parameter sind verschwunden, sie werden dann mittels STR + v wieder eingefügt, der OCR-Text ebenfalls.
  • Beim Autor den Punkt hinter dem Namen nicht vergessen, z. B. „Keune.“
  • Geht der Artikel über mehrere Spalten, wird der Scan für die weitere Seite mit {{Seite|125||{{REIA|III,1|125}}}} aufgerufen, der bisherige Text, wie zuvor beschrieben, zwischengespeichert und eingefügt.

Beste PraxisBearbeiten

In der RE:Werkstatt sind unter Download und Ergebnisse hilfreiche Dateien hinterlegt, beispielsweise:

  1. zip-Datei RE-all-Scan, mit 9 GB sehr gross für alle 27'000 Scan.
  2. Datei RE-7_Neuland ist relativ einfach, sie enthält für alle 100'000 RE-Artikel die ausgefüllten Paramter der Metadaten {{REDaten|...}}. Die richtige Stelle suchen – in den geplanten Artikel kopieren – fertig!
  3. RE-8_Alle-Links enthält [[Links]] für alle RE-Artikel und wichtige Stichworte der RE als Textauszeichnung. Dazu gehören:
  • Stichwort => [[RE:Stichwort|Stichwort]] für 56'000 existierende Lemma
  • Stichwort => {{RE siehe|Stichwort}} für 40'000 geplante Lemma
  • Philolog => [[Philolog mit ganzem Namen|{{SperrSchrift|Philolog}}]] für Philologen mit eigenem Artikel in Wikisource oder Wikipedia
  • Philolog => {{SperrSchrift|Philolog}} für Philologen ohne Artikel
  • Kaiser => [[RE:Kaiser 13|Kaiser]] bzw. {{RE siehe|Kaiser 13|Kaiser}} für allgemein und namentlich bekannte Kaiser, Götter, Provinzen oder Personen des klassischen Altertums.
  • Diod. => [[RE:Diodoros 38|Diod.]] zur Auflösung von Abkürzungen bei antiken Autoren und Stellenangaben.

VerlinkungBearbeiten

Eine massgeschneiderte Software nutzt die Liste RE-8_Alle-Links und übersetzt das HTML aus dem OCR in das WIKI-Format nut Suchen/Ersetzen. Sie könnte auf dem Server eLexikon.ch allgemein implementiert werden. Die Vorteile in Zeit und Qualität sind offensichtlich. Für Artikel mit mehr als einer Spalte ist das Programm eine Erleichterung, wenn griechische Worte bereits mit {{Polytonisch|αβγδ}} maskiert sind, <i>kursiver Text</i> aus dem OCR auch ''kursiv'' ist und <b>Fettschrift</b> zu {{SperrSchrift|gesperrt}} wird. Der Seitenumbruch {{Seite|1234}} wird über den Schlüssel $$$ eingefügt. Systematische Schwächen des OCR werden in der Wikisource:RE-Werkstatt/Pipeline identifiziert und korrigiert. Im Detail:

In der OCR Software (ABBY FineReader 15) wird der Rohtext grob gelesen und gemäss den Meldungen korrigiert und als HTML gespeichert. Im zweiten Schritt liest Software das HTML und ergänzt nicht nur die Links, sondern korrigiert auch typische Fehler (a. a. 0. => a. a. O. oder VH => VII oder 2056d => 2056 d). Neugriechisch wird gemäss Grammatik auf Altgriechisch umgesetzt, unter Anwendung von Akzentregeln, Diphthongen etc. Dazu existieren Automatismen mit Links für "CIL I² 577" oder "Bd. S III S. 432ff.", welche die manuelle Arbeit erleichtern. Am Beispiel Iulius:

  • Iulius => "RE:Iulius Patrizisches Geschlecht" wird so eingesetzt
  • Julier => "RE:Iulius Patrizisches Geschlecht" wird so eingesetzt gemäss Infobox und Link nach Wikipedia
  • RE:Iulius 5, der grammatische Lehrer, kann nicht eingesetzt werden, es sei denn ‚Iulius Nr. 5‘ ist im Text.
  • ‚Gaius Iulius Iullus‘ wird als RE:Iulius 13 eingesetzt, wenn alles richtig läuft und im Text genau diese drei Wörter stehen.

Kommentare 2015Bearbeiten

Seit Kurzem gibt es ALLE RE-Bände in 9 nicht gerade handlichen GB-Happen bei Internet Archive. Vielleicht hat jemand die technischen Möglichkeiten (Bandbreite!), einzelne ältere Bände daraus zu extrahieren und vernünftig auf IA zur Verfügung zu stellen? Oder ist das die angesprochene Sammlung mit geringer Qualität? Benutzer:WaldiWuff

Persönlich finde ich sowohl die obige Projektbeschreibung wie Pfaerrichs Anleitung reif für „Publizieren“ unter Wikisource:RE-Werkstatt oder wo es am besten ist. Benutzer:S8w4

Es freut mich, dass Leben in die Bude kommt, was meinen Wunsch angeht, mit einer Handreichung Neueinsteigern die ersten Schritte zu erleichtern und auch Altgedienten ein Nachschlagewerk zur Verfügung zu stellen, aus dem sie sich bedienen können. Meine vorerwähnte Baustelle ist noch sehr unvollkommen. Aber sie zeigt zumindest schon mal auf, woran ich in den letzten Wochen „gelitten“ habe, und wie ich diesem Mangel beikommen will. Sicher hat Jeder von Euch irgendwo seine eigene Werkzeugkiste stehen, die ihm gute Dienste leistet. Warum nicht die RE-relevanten Teile davon in diese Baustelle kopieren, damit wir daraus ein brauchbares Instrument erzeugen können, das auch den gestrengen Anforderungen der „Großmeister“ genügt, um „amtlich“ werden zu können. Nicht jeder Anfänger wird so dreist sein, gleich mit RE:Alphabet anfangen zu wollen, an dem ich mir derzeit noch alle Zähne ausbeißen würde. Ich werde mich dort darauf beschränken, das OCR einzustellen. Mögen Kompetentere sich den Spass leisten, daraus ein brauchbares Lemma zu gestalten. Benutzer:Pfaerrich.