Kürzel: WS:LBC

Allgemein

Bearbeiten
  • Scans, PDFs, DJVUs usw. bitte nur noch auf Commons ablegen. Die Verfahren dazu wurden mit den Administratoren von Commons abgestimmt.
  • Beim Hochladen von Büchern bevorzugen wir für Quellen das seitenweise Einstellen der Scans auf Commons. PDF-Files eignen sich (noch) nicht so gut zum Korrekturlesen. Da das automatisierte Herunterladen ganzer, aus Einzelseiten bestehnder, Bücher bei Commons so gut wie unmöglich ist, ist ein zusätzliches Einstellen als DJVU- oder PDF-File jedoch erwünscht.

1. DjVu, Pdf, Einzelblattschriften auf Commons ablegen

Bearbeiten

Diese werden ganz normal auf commons hochgeladen und dabei mit der Commons-Vorlage Information, den Lizenzangaben (meistens {{PD-old}}) versehen und in die zugehörige Kategorie

  • Category:De Wikisource book PDF
  • Category:De Wikisource book djvu

eingeordnet, weitergehende Kategorisierung nach den Commons-Kategorien ist erwünscht, sowie ein Vermerk auf der Seite des Autors, falls diese vorhanden ist.

Für Einblatt-Drucke und Flugschriften bitte die folgende

  • Category:De Wikisource book leaflet

verwenden.

Weitere Schritte sind nicht erforderlich.

2. Einzelseitenscans bis hin zu ganzen Büchern auf Commons ablegen

Bearbeiten

Die folgende Aufstellung wird in den nächsten Abschnitten Punkt für Punkt näher erläutert und zielt auf den Einsatz des Programms Commonist zum automatisierten Hochladen der Scans auf Commons ab (wobei bei einem Hochladen von Hand die Abarbeitung der ersten drei Schritte trotzdem beachtet werden müsste):

  1. Einscannen des Materials
  2. Definition einer Vorlage („Template“) auf Commons
  3. Einrichtung einer zusätzlichen Erklärungsseite auf Commons.
  4. Hochladen der Scans auf Commons mit dem Java-Programm „Commonist for books“

2.1. Einscannen des Materials

Bearbeiten
  • Bei der Benennung der Dateien sollte man intuitive, griffige, einheitliche Namen verwenden und weitere unten genannte Regeln, vor allem bezüglich der Nummerierung, befolgen. Das erleichtert einerseits anderen den Umgang damit und zielt vor allem auf das automatisierte Hochladen mit Commonist ab.
  • Sämtliche gescannten Seiten die Hochgeladen werden sollen (und nur diese) sind in ein eigenständiges Verzeichnis abzulegen. Außerdem müssen alle Dateien von gleichem Dateityp sein. Also besipielsweise nicht .png und .jpg mischen.
  • Jede Seite wird dabei mit den Namen Namen_xxx versehen. Der Name muss für jede Scanseite gleich bleiben und der erste Buchstabe des Dateinamens muss groß geschrieben werden. Hier bietet sich das Format Autor_Buchtitel, wobei der Name allerdings nicht zu lang und deshalb sinnvoll gekürzt werden sollte. xxx steht für die Seitennummer, wobei mehrstellige Seitenzählungen mit führenden Nullen versehen werden müssen. D.h. Name_01.jpg, Name_02.jpg… bei Büchern bis 99 Scans, Name_001.jpg, Name_002.jpg… bei Büchern mit bis zu 999 Scans usw. Die führenden Nullen bewirken die korrekte Sortierung innerhalb des Verzeichnisses.
  • Es ist darauf zu achten, dass die Seitenzahl vom Dateinamen durch einen „_“ abgetrennt ist und sich unmittelbar vor der Dateiendung, die mit einem „.“ abgetrennt ist, befindet.
  • Alle Leerzeichen (Blanks) sollten durch _ (Unterstrich) ersetzt werden, da Commons manchmal Dateien mit Leerzeichen nicht annimmt.
  • Weiterhin ist es sinnvoll dafür zu sorgen, dass die Nummer die man an Stelle von xxx setzt mit der Seitennummer übereinstimmt. Für Vorsatz- und Anhangseiten sowie Bildern vom Einband bietet sich eine eigene Zählung wie v_01… bzw. a_01… an.
  • Da Commons bei den Extension (.jpg, .png, …) Groß- Kleinschreibung unterscheidet, sollte die Extension immer kleingeschrieben werden.

Beispiele:

  • Zulässig:
Karajan_Geschichte_Österreichs_56.jpg
  • Unzulässig:
karajan_Geschichte_Österreichs_56.jpg
Karajan_Geschichte_Österreichs56.jpg
Karajan_Geschichte_Österreichs-56.jpg
Karajan_Geschichte_Österreichs_56.verso.jpg
Karajan_Geschichte_Österreichs_56a.jpg
Karajan_Geschichte_Österreichs_56_a.jpg
  • möglicherweise unzulässig, besser vermeiden
Karajan Geschichte Österreichs_56.jpg

2.2. Definition einer Vorlage auf Commons

Bearbeiten

Ein Template (Vorlage) legt das allgemeine Erscheinungsbild einer Wiki-Seite fest. Ist ein solches Template einmal definiert, braucht es auf der entsprechenden Wiki-Seite nur noch angegeben zu werden um es zu aktivieren. Dies ist in unserem Fall aus zwei Gründen hilfreich. Zum einen brauchen wir nur einmal, innerhalb des Templates, die für jede Scanseite gleichbleibenden Informationen wie Buchtitel, Autor, Beschreibungen und Kategorierungen festzulegen. Sie erscheinen bei Einsatz des Templates dann automatisch unter jedem Bild. Zum anderen wirken sich nachträgliche Änderungen innerhalb des Templates sofort auf jede Seite aus die dieses Template einsetzen, so dass eine solche Korrektur nur einmal zentral durchgeführt werden muss.

Ein solches Template ist vor dem Hochladen der Einzelscans auf Wikimedia Commons anzulegen. Gib dazu in das Commons-Suchfeld Template:Templatename ein, wobei der Templatename durch eine sinnvolle Bezeichnung ersetzt werden muss. Wenn Du dann „Search“ anklickst musst Du den roten Link mit deinem Templatenamen anklicken. Auf dieser Seite legst Du dann das Template, welches wie nachfolgend beschrieben erstellt werden sollte, ab.

Am besten verwendst Du die unten angegebene Template-Vorlage und füllst es entsprechend deines Projekts aus. Das Beispiel darunter zeigt wie die einzelnen Felder ausgefüllt werden müssen.

Innerhalb dieses Templates kommen übrigens auch wieder Templates vor, so dass Du nicht alles von Grund auf definieren mussst.

So zuerst das Template:BookNaviBar mit 4 Parametern, welches bewirkt, dass man sich beim Aufruf der einzelnen Scan-Seiten auf Commons einfach von Seite zu Seite hangeln kann. Der erste Parameter enthält den Namen der gescannten Seiten mit dem Unterstrich aber ohne die Seitenzählung. Mit dem zweiten Parameter wird das Bildformat angegeben. Die letzten zwei Parameter nehmen die Verweise zum vorherigen und nächsten Bild auf. Sie bleiben zunächst unverändert. Ihr Inhalt wird erst zusammen mit den Aufruf des Gesamttemplates festgelegt, da ja die Verweise für jedes Bild unterschiedlich sind. Diese Angaben werden dann von Commonist automatisch generiert. Weiteres dazu erfährt man im Abschnitt 2.4.

Weiterhin das Commons Template:De Wikisource Book, welches die generellen Daten zu den gescannten Seiten aufnimmt. Fülle dessen Parameter analog des gezeigten Beispiels aus.

Zum Schluß wird eine spezielle Kategorie für dieses Buch definiert. Hier bietet sich der Name an, den Du auch deinem Template verliehen hast. Z. B.: [[Category:Beispielautor_Beispielbuchtitel]]

Weitere Informationen und Copy & Paste Beispiele: Siehe Definition Book-Templates

Auszufüllende Copy&Paste-Vorlage:

Die in Sternchen gefassten Felder müssen entsprechend ausgefüllt werden.

<!-- Parameter:
1: previous page
2: next page
-->
{{BookNaviBar|*Name der Scans ohne Seitenzahl*_|*Bildformat wie jpg oder png*|{{{1}}}|{{{2}}}}}
{{DE Wikisource Book|
|Title= '''[[:s:de:*Titel des Buches*|*Titel des Buches*]]'''
|Source= Der Scan wurde anhand einer originalen Buchvorlage vorgenommen
|Date= '''*Erscheinungsjahr*'''
|Author='''[[:s:de:*Name des Autors*|*Name des Autors*]]''' (evtl. Angabe der Lebensdaten)
|Image=Name des Bildes der Titelseite
|Publisher=
|City= Erscheinungsort
|Language=german
|Category=Name der Kategorie
}}

Beispiel:

<!-- Parameter:
1: previous page
2: next page
-->
{{BookNaviBar|De Der Werwolf (Hertz W)_|jpg|{{{1}}}|{{{2}}}}}
{{DE Wikisource Book|
|Title= [[:s:de:Der Werwolf (Hertz W)|Der Werwolf]] 
|Source= books.google.com
|Date= '''1862'''
|Author='''[[:s:de:Wilhelm Hertz|Wilhelm Hertz]]'''
|Image=De Der Werwolf (Hertz W) 004.jpg
|Publisher=A. Kröner
|City=Stuttgart
|Language=german
|Category=De Der Werwolf (Hertz W)
}}

Hast Du das Template erstellt kannst Du die Kategorie für dieses Buch, den Du innerhalb des Templates angegeben hast, erstellen, indem Du den unten entstandenen roten Link (mit dieser Kategorie-Bezeichnung) anklickt und folgende Eintragungen macht: Zunächst [[Category:de Wikisource book]]. Dann alle existieren Kategorien, in die das Buch sinnvoll passt (z. B. lokale Kategorien oder geschichtliche Kategorien).

2.3. Einrichten einer zusätzlichen Erklärungsseite auf Commons

Bearbeiten

Auf den Commons wird auch ein Artikel für das Buch angelegt. In diesem wird das Buch kurz beschrieben, wobei der Inhalt der Info ausreicht und eine Gallery mit allen Scans angelelegt. Wird mit Commonist geladen, so braucht Du die Gallery nur von der automatisch unter deinem Namen generierten Benutzerunterseite auf die Erklärungsseite zu kopieren.

Diese Erklärungsseite sollte in die Buchkategorie folgendermaßen eingebunden werden: [[Category:Beispielautor_Beisspielbuchtitel|!]] – Das „!“ erreicht, dass der Artikel auch bei großen Kategorien ganz am Anfang auftaucht.

Weitere Beispiele sind hier zu finden: Scanned/uploaded_Books

2.4. Hochladen der Scans auf Commons mittels des Java-Programms „Commonist“

Bearbeiten

Mit Commonist lassen sich sämtliche Scans auf einen Rutsch hochladen.

Vorbedingungen

Bearbeiten
  • Stelle zunächst sicher, dass Java auf deinem Rechner installiert ist. Das Programm gibt es kostenfrei unter http://java.sun.com/javase/downloads (Derzeit tut es z. B. Java Runtime Environment (JRE) 6 Update 2 - 13,86 MB)
  • Dann wird der modifizierte Commonist für Bücher benötigt. Dies ist ein Java-Programm, welches derzeit die Version 3.1 besitzt. Das Programm findet Du hier: WikiSource Dateiaustausch . Probleme und Fehler bitte an mich melden -- Jörgens.Mi Diskussion 19:05, 3. Jul 2006 (UTC)
  • Die Bedienungsanleitung für den normalen Commonisten (zu finden unter http://djini.de/software/commonist/index.html) gilt weiterhin in vollem Umfang. Dies ist nur eine Erweiterung, um das Hochladen vieler gleicher Seiten. (Im Grunde sollte man aber mit dieser Beschreibung hier auskommen.)
  • Die in Punkt 2.1 genannten Bedingungen an die Namensvergabe der einzelnen Dateien müssen erfüllt sein.
  • Das spezielle Template für dieses Projekt muss entsprechend Punkt 2.2 angelegt sein.
  • Die Dateien müssen kleiner als 4 MByte sein
  • png Dateien sollten kleiner 2500 * 3000 Pixel sein da sonst die Vorschaubilder und das skalieren nicht funktioniert (Diese Datei erzeugt einen Fehler in der Vorschau obwohl sie nur 466kb groß ist (3648 × 4992 Pixel, Dateigröße: 466 KB, MIME-Typ: image/png) genaue Grenzen sind derzeit leider nicht bekannt).

Kurzfassung Schritt für Schritt mit einem Beispiel

Bearbeiten
 
Screenshot.
  • Zunächst ist das spezielle Verzeichnis mit den hochzuladenden Bildern auszuwählen.
  • user: Hier bitte deinen Usernamen auf Commons eintragen Der Text im Bild ist test, dies ist ein Beispiel, den nicht benutzen
  • password: Hier trägst Du dein Passwort für deinen Usernamen auf Commons ein.
  • wiki: Hier Commons auswählen.
  • Template: Hier bitte den Name des Templates, den Du, wie im Abschnitt 2.2 beschrieben, für dieses Projekt erstellt hast, eintragen. Der Text im Bild ist test.
  • Number of digits: Hier die Anzahl der Dezimalstellen für die Bildnummern eintragen, die im Bild zu sehende 5 ist ein Beispiel.
    • 1 Wenn die Seitennummern 1 .. 9 sind
    • 2 Wenn die Seitennummern 01 .. 99 sind
    • 3 Wenn die Seitennummern 001 .. 999 sind
    • 4 Wenn die Seitennummern 0001 .. 9999 sind
  • Update Template Dieser Knopf muss bedient werden, wenn die Anzahl der Stellen (Number of digits) oder der Name des Templates geändert wurde. Der Knopf muss daher zumindest einmal gedrückt werden, bevor der Knopf upload betätigt wird.
  • In den Feldern mit den Bildern muss nichts geändert werden.
  • Aus der in dem Dateinamen angegeben Zahl, die entsprechend den unter 2.1 genannten Konvention wie die Seitenzahl lauten sollte, ermittelt Commonist die beiden Parameter previous und next item, welches die spätere Navigation zu dem vorherigen und nächsten Bild festlegt. Zusätzlich mit den angegeben Templatenamen wird damit automatisch von Commonist der vollständige Templateaufruf für jedes einzelne Bild erzeugt. Commonist trägt diese Daten beim tatsächlichen Hochladen auf der jeweiligen Bildseite ein.
  • Wurden mittels v_ oder a_ Vor- oder Nachseiten benannt, muss bei diesen Seiten das v_ und a_ jeweils vor die vorgegeben Zahlen eingefügt werden, da Commonist dies leider nicht automatisch erkennt. Bei der letzten Vorseite muss als „next item“ dann „001“ (die Anzahl der Nullen variiert wie gehabt) angegeben werden, so das von der letzten Vorseite auf die erste Hauptseite verwiesen wird. Die erste Hauptseite muss dementsprechend unter „previous“ auf die Seitenzahl (mit v_) der letzten Vorseite verweisen. Bei der Nachseite muss analog auf der ersten Nachseite ein „previous“-Verweis auf die letzte Hauptseite und auf der letzten Hauptseite bei „next item“ ein Verweis auf die erste Nachseite erzeugt werden.
Beispiel:
Letzte Vorseite mit der Nummer _v_10: {{test|v_09|001}}
Erste Hauptseite mit der Nummer _001: {{test|v_10|002}}.
Nach 125 Seiten folgen noch 110 Anhangsseiten:
Letzte Hauptseite mit der Nummer _125: {{test|124|a_001}}
Erste Nachseite mit der Nummer _a_001: {{test|125|a_002}}.
  • Da das Programm aus der aktuellen Seitennummer die Seitennummer für die Seite davor und danach berechnet, wird bei der ersten Seite der Link auf die vorherige Seite (Pfeil links) und bei der letzten Seite der Link auf die nächste Seite falsch errechnet. Dies muss von Hand korrigiert werden. Bei der ersten Seite muss das Feld previous und bei der letzen Seite muss das Feld next item geleert werden. Bei leeren Feldern fallen dann die nicht benötigten Links zur vorhergehenden bzw. nachfolgenden Seite weg.
  • Achtung! Drückst Du den Knopf „update Template“, musst Du die Link-Korrekturen wiederholen. Verlinkungsprobleme lassen sich notfalls auch nach dem Hochladen jeweils durch „Seite bearbeiten“ korrigieren.
  • select all drücken damit alle Bilder ausgewählt werden
  • Überprüfen, bevor man upload drückt:
    • Bevor Du den Upload startet, kontrolliere in der rechten Spalte, ob bei allen Bildern die richtige Vorlage eingetragen ist.
    • Die Zahl der Dezimalstellen der Seitennummern in der rechten Spalte sollte mit der Zahl der Dezimalstellen im Dateinamen der Bilder identisch sein. Dieser ist unter dem Feld name einzusehen.
    • Wenn die Kontrollen negativ ausfallen, korrigiere ggf. die Eintragungen in den Feldern Template und Number of digits und drücke Update template.
  • Wenn der Upload fehlerhaft verläuft, solltest Du die Eingaben erneut prüfen. Auch Dateigrößen über 4 MB, die bei Commons eine Warnmeldung auslösen, sind zu vermeiden. Technisch ist es möglich, als gewöhnlicher User bis zu 20 MB große Dateien hochzuladen, allerdings bis jetzt nur „von Hand“.

Abschließende Beschreibung der Funktionsweise des Programms

Bearbeiten

Das Programm versieht die unter Template benannte Vorlage mit den Verweisen auf die vorige und nächste Datei und setzt das so komplettierte Template bei jedem Bild automatisch in das Feld description ein. Ändert man die Anzahl der Stellen (Number of digits) in der Seitennummerierung oder den Namen der Vorlage, so werden die description-Felder aller einzelnen Dateien über den Update Template Button auf den neuen Stand gebracht. Es ist empfehlenswert den Button Update Template einmal anzuklicken, nachdem alle Bilder in den Commonisten geladen wurden, damit bei allen Bildern der Template-Name und die Nummerierung stimmt. Von Hand sollte man beim ersten Bild den Inhalt des Verweises auf das vorige Bild (previous) loeschen. Beim letzten Bild sollte der Inhalt des nächstes (next) Verweis geloescht werden. Es werden nur Scans in die Liste aufgenommen die der Dateinamensgebung genügen. Die individuellen Description Felder können nachträglich immer noch bearbeitet werden, bei einem Update Template sind diese Änderungen allerdings weg.

Commonist funktioniert nicht

Bearbeiten

Frage commonist-0.1.18.book_v3.1 funktioniert bei mir nicht. commonist-0.1.18 funktioniert. Aber bei commonist-0.1.18.book_v3.1 bleibt die rechte Hälfte, in der die Bilder angezeigt werden sollten, vollkommen leer.

Antwort Das kann daran liegen, dass die Dateien nicht das richtige Format haben. BeliebigerText_001.beliebigeEndung. Wichtig ist die mit Unterstrich abgetrennte Seitennummerierung _01 unmittelbar vor dem Punkt. Ist der Dateiname nicht so aufgebaut erfolgt keine Anzeige. Bei der Seitennummer ist die Anzahl der Nullen vor der ersten Ziffer egal. Commons erlaubt für Bilder die Dateiformate GIF, JPEG, PND, SVG, SXD und XCF. Vergleiche Commons:Dateitypen.

Man sollte die Dateinamen so wählen, dass alle Seitenzahlen gleich lang sind. So dass bei

  • von 1..9 Seiten keine Null (Number length = 1)
  • von 01..99 Seiten eine zum auffüllen auf 2 Stellen (Number length = 2)
  • von 001..999 Seiten zwei zum auffüllen auf 3 Stellen (Number length = 3)
  • von 0001.9999 Seiten drei zum auffüllen auf 4 Stellen (Number length = 4)

vor dem Einer vorhanden ist.

Vorsatzseiten /Anhänge

Bearbeiten

Frage Wenn du den Vorsatzseiten oder dem Anhang ein z.B. v_01.jpg gibst, dann ändert sich der Name der Dateien und deren Sortierung - d.h. deine Vorsatzseite steht dann zuletzt weil sie mit v anfängt - wie kriegst du die dann in das Template in der richtigen Reihenfolge?

Antwort Bei den Vorseiten, Nachseiten, der ersten und letzten Hauptseite muss von Hand eingegriffen werden. Siehe hierzu auch Abschnitt 2.4 Punkt 10.

Bearbeiten

Frage Wieso ist jeweils ein Link bei der ersten und letzten Seite nach einem Upload rot?

Antwort Da das Programm aus der aktuellen Seitennummer die Seitennummer für die Seite davor und danach berechnet, wird bei der ersten Seite der Link auf die vorherige Seite (Pfeil links) und bei der letzten Seite der Link auf die nächste Seite falsch errechnet. Dies muss von Hand korrigiert werden. Bei der ersten Seite muss das linke Feld in dem typischerweise 0 steht und bei der letzen Seite muss das rechte Feld geleert werden. Bei leeren Felder fallen dann die entsprechenden nicht benötigten Links zur vorhergehenden bzw. nachfolgenden Seite weg. Dazu im Commonisten im rechten Fenster zur ersten Seite gehen und dort in Description, die linke der beiden Nummern leeren und bei der letzten Seite die rechte Nummer leeren. Achtung! Wird danach der Knopf update Template gedrückt, muss man diese Arbeit wiederholen. Verlinkungsprobleme lassen sich notfalls auch nach dem upload jeweils durch „Seite bearbeiten“ korrigieren.

DjVu-Probleme in Commons

Bearbeiten

Manche DjVu-Files lassen sich mit dem Commons-internen Viewer nicht richtig anzeigen. Woran das liegt, ist bisher unklar. Heruntergeladen lassen sie sich aber durchaus mit dem Browser-Plugin oder externen Viewern verwenden. Siehe auch Bugzilla Bug 9327.

Extrahieren aus PDF-Dateien

Bearbeiten

Unnötige Ziffernfolgen sind zu vermeiden. Der Acrobat 7.0 hängt hinter die Seitennummer immmer noch eine 4 stellige Bildnummer an. Die ist immer 0001 und unnötig. Zum Umbenennen eignen sich sehr gut der Total-Commander (freeware). Ab 7.x mit der Option STRG-M und renamer. Extrahieren aus PDF's geht sehr gut mit PDF-Xchange Viewer

Hochladen got warning

Bearbeiten

Ich versuche mit dem commonisten hochzuladen, habe aber nur Dateien mit got warning in der gallery auf commons.

Die letzte Zeit sind bei commons folgende Auffaelligkeiten.

  1. Die login-Verifizierung mit Captcha schlägt häufiger zu und ist penetrant
  2. commons nimmt mal Dateien mit Blanks drinnen mal nicht, bisher noch kein Muster feststellbar
  • Zu 1. Einfach eine Stunde später versuchen, dann geht es meistens
  • Zu 2. Einfach alle Blanks durch Unterstriche ersetzen und das erste Zeichen des Bildnamens groß schreiben (Total Commander und rename helfen dabei)