Vorlage Diskussion:GBSIA
Dokumentation zu Vorlage:GBSIA
BearbeitenDie Vorlage verlinkt zu einem über die ID eindeutig identifizierbaren digitalisierten Text der Google Buchsuche. Der zusätzlich hochgestellte Link ermöglicht gleichzeitig eine Google-ID-Suche im Internet Archive, um dort schon vorhandene Kopien des Google-Digitalisats zu finden. Zusätzlich kann das Ergebnis der letzten Suche im IA signalisiert werden.
- Parameter 1 : ID des Google-Digitalisat, das ist alles zwischen "id=" und dem nächsten "&" der Google-URL
- Parameter 2 : Ist der Titel in Deutschland vollständig abrufbar, kann hier direkt eine Seitenzahlangabe vermerkt werden, anderenfalls (das betrifft die meisten Werke nach 1867) muss US angegeben werden
- Parameter 3 : Ist der Titel nur über einen US-Proxy erreichbar, kann hier optional die Seitenzahlangabe vermerkt werden
- Parameter 4 : Ein optionales Sonderzeichen (Standardwert: ?) gibt an, ob zusätzlich eine Suche im Internet Archive nach der Google Book ID durchgeführt werden soll (?, Standardwert bei fehlender Angabe) bzw. signalisiert mit dem Sonderzeichen, ob eine frühere Suche mit dem IA-Suchlink erfolgreich war (+) oder nicht (-). Das Sonderzeichen # unterdrückt die IA-Suche komplett (Kompatibilität zur alten Vorlage GBS), @ ermöglicht, wenn das Digitalisat im (engl.: at) Internet Archive gespiegelt vorliegt, die Angabe des IA-Identifiers im unmittelbar folgenden Parameter zur direkten Verlinkung auf ein dort vorhandenes Digitalisat.
- Parameter 5 : Eindeutige und dauerhafte Identifikations-Zeichenkette für ein Medium im Internet Archive.
- Parameter 6 : Typ des IA-Links: Wert FB bewirkt den direkten Aufruf des Flip Books bzw. DL die Anzeige der Download-Liste anstelle der Standard-Anzeige der Titel-Detailangaben (Standardwert bei fehlender Angabe).
Anmerkung: Die Parameter 5 und 6 werden nur dann ausgewertet, wenn das Sonderzeichen @ als Wert des Parameters 4 eine direkte Verlinkung mit dem gespiegelten Titel im Internet Archive erzwingt. Da andere Werte des Parameters 4 bewirken, dass die als Parameter 5 und gegebenenfalls 6 hinterlegten Werte einfach ignoriert werden, brauchen diese nicht entfernt zu werden.
Ein Link zur Google Buchsuche sieht beispielsweise folgendermaßen aus:
http://books.google.com/books?id=cBgPAAAAIAAJ&printsec=titlepage&hl=de#PRA13-PA105,M1
Die ID (hier: cBgPAAAAIAAJ) lässt sich leicht ermitteln, da sie immer zwischen dem ersten Gleichheitszeichen (=) und dem ersten Kaufmännischen Und-Zeichen (&) oder dem Ende der URL steht. Aus technischen Gründen muss die URL für die Verwendung in Vorlagen in ihre Teile zerlegt werden. Insbesondere können in unbenannten Parametern keine Gleich-Zeichen (=) verwendet werden. Soll direkt auf eine Seite verlinkt werden, kann dem obigen Beispiel die Seitenzahl PA105 entnommen werden, genaugenommen RA13-PA105 (die Seite in einem Bereich mit eigenständiger Numerierung.
Der Zugriff auf bestimmte Jahrgänge in der Google Buchsuche ist für Nicht-US-Bürger beschränkt. Ein Zugriff ist dennoch über einen sogenannten Proxy-Server in den USA möglich.
Zur Angabe zur Ermittlung der Google Buch ID bzw. zur Kürzung der Seitenzahl siehe Wikisource:Google Book Search.
Hilfe zum Proxy: Wikisource:Google Book Search
Eingebürgert hat sich die Konvention, die gewünschten einzelnen Parameter nach einer definierten Reihenfolge aneinanderzureihen, wobei nicht benötigte einfach weggelassen werden.
Google-Buch-ID | US | Seite Google-Buch-ID | Seite Google-Buch-ID
Genaugenommen müssten in Vorlagen, nicht belegte Parameter wie US durch eine Auslassung gekennzeichnet werden. Obiges zweite Beispiel wäre folgendermaßen abzubilden:
{{ Google-Buch-ID | | Seite }}
Mit einem zusätzlichen Parameter soll die Suche im Internet Archive gesteuert werden. Sollen alle verwendeten Parameterwerte unabhängig von ihrer Maximalzahl einfach hintereinander angegeben werden, so lässt sich dies nur durch Programmlogik bewerkstelligen. Da nur die eingebauten Parser-Funktionen für Zeichenketten verwendet werden konnten, ist keine komfortable Fehlerbehandlung möglich.
Die Vorlage macht sich die unterschiedliche Länge der Parameterwerte zu nutze: Eine Google ID besteht nur aus Groß-/Kleinbuchstaben und Ziffern sowie den Sonderzeichen Bindestrich-Minus sowie Unterstrich und ist immer zwölf Zeichen lang. Die Kennzeichnung US für den Proxy-Server hat zwei Buchstaben, der Operator für die Steuerung der IA-Suche besteht aus nur einem Sonderzeichen (?, +, -, @, #}. Die Seitenangabe hat keine feste Länge, ebenso wie der zusätzlich aufgenommene Identifier des Digitalisats im Internet Archive, der nur aus Buchstaben, Ziffern sowie dem Unterstrich besteht und vorzugsweise 5 bis 80 Zeichen lang ist. Zur Steuerung des IA-Zugriff ist darüber hinaus noch ein optionaler zweistelliger Parameterwert vorgesehen (Buchstaben: FB, DL, ST).
Während bei den IDs und der Seitenangabe unbedingt auf Groß-/Kleinschreibung zu achten ist, können die zweistelligen Steuer-Operatoren wie US oder DL auch als Kleinbuchstaben (us oder dl) oder in gemischter Schreibweise (Us bzw. dL) angegeben werden, was einige Umschalt-Tasten-Betätigung erspart.
In Deutschland abrufbar:
{{GBSIA|cBgPAAAAIAAJ}} (ohne Angabe der Seitenzahl mit dem Ergebnis: Google IA?) {{GBSIA|cBgPAAAAIAAJ|PA105}} (mit Angabe der Seitenzahl mit dem Ergebnis: Google IA?)
Google-Digitalisat nur über US-Proxy abrufbar:
{{GBSIA|rRwPBED3CloC|US}} (ohne Angabe der Seitenzahl mit dem Ergebnis: Google-USA* IA?) {{GBSIA|rRwPBED3CloC|US|PA105}} (mit Angabe der Seitenzahl mit dem Ergebnis: Google-USA* IA?)
Der angehängte Stern nach Google-USA* IA? dient als Link auf die Erläuterung zur Benutzung eines US-Proxys. Auf den Link zum digitalisierten Text in der Google Buchsuche folgt optional ein mit dem hochgestellten Text IA? bzw. @IA bezeichneter Link zur Suche nach der Google Book ID bzw. dem IA Identifier im Internet Archive. Die für Links sonst üblichen Pfeilsymbole werden unterdrückt, das Layout der Quelltexte wird nicht durch ungewollte Zeilenumbrüche gestört.
Operator # unterdrückt alles, was nicht zum Google Link gehört:
{{GBSIA|rRwPBED3CloC|#}} mit dem Ergebnis: Google IA?
Angabe der Google-Seitenzahl sowie IA-Link mit Signalisierung des letzten Such-Ergebnisses: {{GBSIA|rRwPBED3CloC|US|PA105|+}} mit positivem Ergebnis: Google-USA* IA+ {{GBSIA|rRwPBED3CloC|Us|PA105|-}} mit negativem Ergebnis: Google-USA* IA-
Operator @ verlinkt mit dem gespiegelten Google-Digitalisat im Internet Archive: {{GBSIA|rRwPBED3CloC|@|goethesbriefwec00grimgoog}} mit dem Ergebnis: Google @IA Mit Angabe des für Google notwendigen US-Proxies sowie dem Link zur Download-Liste des gespiegelten Digitalisats im IA: {{GBSIA|rRwPBED3CloC|us|@|goethesbriefwec00grimgoog|dl}} mit dem Ergebnis: Google-USA* @IA Mit Ersetzung des Operators @ durch # kann der IA-Teil auch unterdrückt werden, ohne die Zuordnung der beiden IDs entfernen zu müssen: {{GBSIA|rRwPBED3CloC|us|#|goethesbriefwec00grimgoog|dl}} mit dem Ergebnis: Google-USA* IA?
Der etwas umständlichere Aufruf mit numerischen Parameter-Namen funktioniert auch. Im Gegensatz zu unbenannten Parametern sind hier jeweils die Nummern 1–6 als Parameter-Namen gefolgt von einem Gleichheitszeichen (=) vor dem Parameterwert anzugeben. Ein nicht genutzter Vorteil ist, dass die Parameterwerte dann selbst Gleichheits-Zeichen enthalten können. Nur so wäre für den Parameter 1 ein zusammenhängender Link wie der eingangs genannte möglich:
1=cBgPAAAAIAAJ&printsec=titlepage&hl=de#PRA13-PA105,M1
Für die Suche im Internet Archive werden nur die ersten zwölf Zeichen als Google Book ID interpretiert, so dass selbst bei solchen künftig zu vermeidenden Angaben noch eine IA-Suche möglich bleibt. Das Überschreiten der maximalen Länge für den ersten Parameterwert löst aber folgende tiefergestellte Fehlermeldung aus: „Formal ungültige Google Book ID … (exakt 12 Zeichen erforderlich!).“
Die Parameterwerte werden dabei zwar in der definierten Parameter-Reihenfolge angegeben, aber die fortlaufende Numerierung als Parameter-Namen berücksichtigt nur die tatsächlich verwendeten Parameterwerte. Ein Mischen mit unbenannten Parameterwerten ist zu vermeiden.
In Deutschland abrufbar:
{{GBSIA|1=css1AAAAMAAJ|2=RA1-PA645})
Der ID wird "1=", der Seitenzahl "2=" und nicht "3=" vorangestellt
(der nicht angegebene zweite Parameter für den US Proxy für wird
bei der fortlaufenden Zählung nicht berücksichtigt!)
Ergebnis: Google IA?
Nur über US-Proxy abrufbar:
{{GBSIA|1=r2NKAAAAMAAJ|2=US|3=PA216}}
Hier steht "2=" vor dem oben ausgelassenen US, "3=" vor der Seite
(nach der definierten Parameter-Folge)
Ergebnis: Google-USA* IA?
{{GBSIA|1=r2NKAAAAMAAJ|2=@|3=goethesbriefwec00grimgoog}}
Ergebnis: Google @IA
{{GBSIA|1=r2NKAAAAMAAJ|2=PA216|3=@|4=goethesbriefwec00grimgoog}}
Ergebnis: Google @IA
Falsche Treffer:
Momentan kann leider bei der IA-Suche keine Berücksichtigung der Groß-/Kleinschreibung erzwungen werden, weil das Internet Archive bei der Speicherung den Index in Großbuchstaben anlegt.
So werden auch Google-IDs gefunden, die sich nur in der Groß-/Kleinschreibung der Buchstaben unterscheiden. Somit können ein oder mehrere falsche Treffer angezeigt werden. Dies lässt sich leicht nachvollziehen, wenn man rechts unten mit 'Options' Show Source Field die Anzeige des Feldes eingeschaltet hat, wo üblicherweise die Google ID enthalten ist. Das gesuchte Dokument kann — falls vorhanden — aber leicht anhand der Trefferliste identifiziert werden. Sollte die Trefferliste nicht mehr überschaubar bleiben, kann das daran liegen, dass die Google-ID nicht vollständig angegeben wurde oder überhaupt fehlt. Die Vorlage gibt in diesem Fall eine tiefergestellte Fehlermeldung aus: „Formal ungültige Google Book ID … (exakt 12 Zeichen erforderlich!).“
Der Zugriff auf das Internet Archive (IA) ist ohne US-Proxy möglich. Wurde ein Text dorthin hochgeladen, so ist er von dort in verschiedenen Formaten abrufbar. Insbesondere der anonyme Benutzer tbp lädt systematisch Google-Digitalisate von US-amerikanischen und europäischen Bibliotheken ins Internet Archive hoch unter Angabe des Original-Links auf das jeweilige Digitalisat der Google Buchsuche.
Vorausgesetzt der Benutzer hat irgendwo in den Meta-Daten zu der hochgeladenen Datei die Google-ID angegeben, so sind dort vorhandene Google-Texte frei und ohne Verwendung eines Proxys abrufbar.
Die IA-Suchmaschine verwendet die Lucene-Abfragesprache des Apache-Servers. Aus Performance-Gründen wird die Suche beschränkt auf mediatype 'texts', um andere Medientypen wie Audio, Video usw. auszuschließen. Verzichtet wird auf eine weitere Einschränkung auf ein bestimmtes Feld (z. B. 'source'), welches üblicherweise die vollständige Google URL als Quelle enthält.
Ein IA-Suchlink nach der Google Book ID sieht aufgelöst etwa wie folgt aus:
http://www.archive.org/search.php?query="EzgqAAAAMAAJ" AND mediatype:texts
Tipp: Wer das PDF-Format herunterladen möchte, für das bei Google sonst ein US-Proxy erforderlich wäre, darf bei der Standard-Anzeige der Titel-Details im Internet Archive nicht unter View the Book PDF wählen, sondern vielmehr All Files HTTP, wo aus der Liste aller Download-Möglichkeiten, die PDF-Datei ausgewählt werden kann. Alternativ kann auch aus dem Flip Book heraus rechts auf Print geklickt und Download PDF gewählt werden. Für den alternativem direkten Zugriff auf das Flip Book oder die Download-Liste dient Parameter 6 als optionaler zusätzlicher Steuer-Operator.
Ein IA-Suchlink nach dem IA Identifier sieht abgesehen von der Hochstellung aus wie bei der Vorlage:IA und ergibt als URL aufgelöst http://www.archive.org/details/diemusikingeschi006338mbp.
Der Identifier entspricht dabei der Zeichenkette nach dem letzten Schrägstrich (/).
Der Internet Archive Identifier besteht aus einer eindeutigen alphanumerischen Zeichenfolge variabler Länge (vorzugsweise 5 bis 80 Zeichen). Um ihn URL-sicher zu machen, sind nur Buchstaben und Ziffern sowie der Unterstrich (_) erlaubt.
Ein gängiges Format (in Klammern die Zeichenzahl) wird durch Aneinanderreihen folgender das Werk kennzeichnender Angaben gebildet: Titel (8-16 Kleinbuchstaben), Band-Nr. (2-stellig mit führender Null aufgefüllt, 00 bei fehlender Bandzählung), Autor (4 Kleinbuchstaben), Scan-Herkunft (0-4 Kleinbuchstaben).
goethe02heingoog wäre dementsprechend ein korrekt gebildeter Identifier für das Werk Goethe (2. Band) von Karl HEINEMANN (Leipzig: Seemann, 1895), gescannt durch Google bzw. einer seiner Partnerbibliotheken. Offensichtlich wird diese Format-Regel nicht konsequent eingehalten (der Band hat tatsächlich den Identifier goethe00heingoog), so dass die Bandzählungsangaben mit Vorsicht zu genießen sind.
Alte Vorlage:GBS: Diese Vorlage verlinkt zu einem über die ID eindeutig identifizierbaren digitalisierten Text der Google Buchsuche.
Vorlage:IA Diese Vorlage verlinkt auf gespeicherte digitale Medien im Internet Archive.