Vorlage Diskussion:GBIA
Dokumentation zu Vorlage:GBIA
BearbeitenDie Vorlage verlinkt zu einem über die ID eindeutig identifizierbaren digitalisierten Text der Google Buchsuche. Der zusätzlich hochgestellte Link ermöglicht gleichzeitig eine Google-ID-Suche im Internet Archive, um dort schon vorhandene Kopien des Google-Digitalisats zu finden.
- Parameter 1 : ID des Google-Digitalisat, das ist alles zwischen "id=" und dem nächsten "&" der Google-URL
- Parameter 2 : Ist der Titel in Deutschland vollständig abrufbar, kann hier direkt eine Seitenzahlangabe vermerkt werden, anderenfalls (das betrifft die meisten Werke nach 1867) muss US angegeben werden
- Parameter 3 : Ist der Titel nur über einen US-Proxy erreichbar, kann hier optional die Seitenzahlangabe vermerkt werden
- Parameter 4 : Das optionale Sonderzeichen # als letzter Parameter erlaubt das Unterdrücken des IA-Such-Links.
In Deutschland abrufbar:
Bei https://books.google.com/books?id=cBgPAAAAIAAJ&printsec=titlepage&hl=de#PRA13-PA105,M1 entspricht die ID folgender Zeichenkette: cBgPAAAAIAAJ
{{GBIA|cBgPAAAAIAAJ}} (ohne Angabe der Seitenzahl mit dem Ergebnis: Google IA?) {{GBIA|cBgPAAAAIAAJ|PA105}} (mit Angabe der Seitenzahl mit dem Ergebnis: Google IA?)
Zur Angabe bzw. Kürzung der Seitenzahl siehe Wikisource:Google Book Search
Nur über US-Proxy abrufbar:
Bei https://books.google.com/books?id=rRwPBED3CloC&printsec=titlepage&hl=de#PRA13-PA105,M1 entspricht die ID folgender Zeichenkette: rRwPBED3CloC
{{GBIA|rRwPBED3CloC|US}} (ohne Angabe der Seitenzahl mit dem Ergebnis: Google-USA* IA?) {{GBIA|rRwPBED3CloC|US|PA105}} (mit Angabe der Seitenzahl mit dem Ergebnis: Google-USA* IA?)
Hilfe zum Proxy: Wikisource:Google Book Search
Unterdrücken des IA-Suchlinks:
Der hochgestellte IA-Suchlink kann durch Eingabe des Sonderzeichens # als letzter Parameterwert komplett unterdrückt werden.
{{GBIA|cBgPAAAAIAAJ|#}} (ohne Angabe der Seitenzahl mit dem Ergebnis: Google) {{GBIA|cBgPAAAAIAAJ|PA105|#}} (mit Angabe der Seitenzahl mit dem Ergebnis: Google)
{{GBIA|rRwPBED3CloC|US|#}} (ohne Angabe der Seitenzahl mit dem Ergebnis: Google-USA*) {{GBIA|rRwPBED3CloC|US|PA105|#}} (mit Angabe der Seitenzahl mit dem Ergebnis: Google-USA*)
Alternative zur Parameterübergabe bei Angabe der Seitenzahl (frühere Fassung):
In Deutschland abrufbar:
{{GBIA|1=css1AAAAMAAJ|2=RA1-PA645})
Der ID wird "1=", der Seitenzahl "2=" vorangestellt.
Ergebnis: Google IA?
Nur über US-Proxy abrufbar:
{{GBIA|1=r2NKAAAAMAAJ|2=US|3=PA216}}
Hier zusätzlich "2=" vor US, dafür "3=" vor der Seite.
Ergebnis: Google-USA* IA?
Mit unterdrücktem IA-Suchlink:
{{GBIA|1=css1AAAAMAAJ|2=RA1-PA645|3=#})
Der ID wird "1=", der Seitenzahl "2=", dem Operator "3" vorangestellt
Ergebnis: Google
{{GBIA|1=r2NKAAAAMAAJ|2=US|3=PA216|4=#}}
Ergebnis: Google-USA*
Der angehängte Stern nach Google-USA* IA? dient als Link auf die Erläuterung zur Benutzung eines US-Proxys. Auf den Link zum digitalisierten Text in der Google Buchsuche folgt optional ein mit dem hochgestellten Text IA? zur Suche nach der Google Book ID im Internet Archive. Die für Links sonst üblichen Pfeilsymbole werden unterdrückt, das Layout der Quelltexte wird nicht durch ungewollte Zeilenumbrüche gestört.
Der Zugriff auf das Internet Archive (IA) ist ohne US-Proxy möglich. Wurde ein Text dorthin hochgeladen, so ist er von dort in verschiedenen Formaten abrufbar. Insbesondere der anonyme Benutzer tbp lädt systematisch Google-Digitalisate von US-amerikanischen und europäischen Bibliotheken ins Internet Archive hoch unter Angabe des Original-Links auf das jeweilige Digitalisat der Google Buchsuche.
Vorausgesetzt der Benutzer hat irgendwo in den Meta-Daten zu der hochgeladenen Datei die Google-ID angegeben, so sind dort vorhandene Google-Texte frei und ohne Verwendung eines Proxys abrufbar.
Die IA-Suchmaschine verwendet die Lucene-Abfragesprache des Apache-Servers. Aus Performance-Gründen wird die Suche beschränkt auf mediatype 'texts', um andere Medientypen wie Audio, Video usw. auszuschließen.
Ein IA-Link sieht aufgelöst etwa wie folgt aus:
https://www.archive.org/search.php?query="EzgqAAAAMAAJ" AND mediatype:texts
Da die IA-Suche bei der Google ID nicht Groß- und Kleinschreibung unterscheidet, kann es vorkommen, dass ein oder mehrere falsche Treffer angezeigt werden. Dies lässt sich leicht nachvollziehen, wenn man rechts unten mit 'Options' Show Source Field die Anzeige des Feldes mit der Google ID eingeschaltet hat. Das gesuchte Dokument kann — falls vorhanden — aber leicht anhand der Trefferliste identifiziert werden.
Tipp:
Wer das PDF-Format herunterladen möchte, für das bei Google sonst ein US-Proxy erforderlich wäre, darf nicht unter View the Book PDF wählen, sondern vielmehr All Files HTTP, wo aus der Liste aller Download-Möglichkeiten, die PDF-Datei ausgewählt werden kann. Alternativ kann auch aus dem Flip Book heraus rechts auf Print geklickt und Download PDF gewählt werden.
Die Vorlage wird beispielsweise in der Themenseite Buchhandel oder der Zeitschriften-Liste Pädagogik verwendet.
Vorlage:GBS Diese Vorlage verlinkt zu einem über die ID eindeutig identifizierbaren digitalisierten Text der Google Buchsuche.
Vorlage:IA Diese Vorlage verlinkt auf gespeicherte digitale Medien im Internet Archive. Als erster Parameter wird der sog. Identifier als eindeutiger und dauerhafter Identifikator verwendet. Ein fakultativer zweiter Parameter spezifiziert den Typ des Links näher. Dessen Wert FB bewirkt den direkten Aufruf des Flip Books bzw. DL die Anzeige der Download-Liste anstelle der Standard-Anzeige der Titel-Detailangaben.
Diskussion
BearbeitenErsetzung von GBIA durch GBS
BearbeitenWäre es nicht angebracht, statt überall GBIA durch GBS zu ersetzen, dies hier mal zu diskutieren? --Gorup 12:06, 18. Sep. 2010 (CEST)
- Jo, war schon dabei. Also da der Internet-Archiv Mitarbeiter/Benutzer „tpb“ bereits langem keine Googlekopien mehr einstellt (und weitere Titel wegen der Captcha-Sperre nicht mehr massenhaft im automatisierten Verfahren abzusaugen sind), bleiben für alle Bücher, die jetzt nicht bereits im Internet Archive vorh. sind (und die wir dann gleich direkt verlinken), alle negativen Suchanfragen über den Suchlink auch auf Dauer ergebnislos, da von Millionen denkbaren Titeln höchstens noch eine Handvoll von privaten Uploader eingestellt werden und dann meist ohne Angabe der dazu nötigen Google-ID. Ich habe daher schon vor längerer Zeit begonnen, alle Titel, die noch aus der der Zeit der ständigen Uploads im IA über GBIA verlinkt waren, nachzuprüfen und entsprechend zu ändern. --88.67.123.247 12:59, 18. Sep. 2010 (CEST)
- Die meisten Bücher, die ich in Wikisource eingestellt habe, habe ich mit GBS gefunden, weil der Suchstring drin vorkommt. Es ist dann aber einfacher, die Seite unter Verwendung von GBIA einzustellen und nach eventuellen Kopien im IA über den IA?-Link zu suchen, als die Google-ID händisch ins Suchfeld bei IA zu kopieren. Ich sehe eigentlich keine Notwendigkeit, "gleich direkt zu verlinken" und verstehe nicht recht, warum der GBIA-Link, der ja dieselbe Funktionalität, wie der GBS-Link und darüberhinaus den Abgleich mit IA bietet, irgendwie stören könnte. Wenn ich nicht irre, hast Du ja euch bei meinen GBIA-Links noch eine Entsprechung im IA gefunden.
- Darüber hinaus steht ja nicht fest, ob „tpb“ oder sonst jemand vielleicht wieder fleißig ins IA lädt, doch dann ist die bequeme Handhabung dahin. --Gorup 13:21, 18. Sep. 2010 (CEST)
- Nachtrag: Habe Betreff in "Ersetzung von GBIA durch GBS" geändert. Da hab' ich mich vertan. --Gorup 13:38, 18. Sep. 2010 (CEST)
- Ich fange mal mit dem letzten Punkt an: Weder der User „tpb“ oder sonst jemand fängt wieder an, fleissig Google-Kopien einzustellen, weil es wie gesagt einfach nicht mehr möglich ist, nennenswerte Mengen bei Google abzuziehen. Nur dann würde die Vorlage noch Sinn machen, nicht aber bei den jetzt wenigen einzelnen händischen Uploads. Nennenswert wären mindestens einige hundert Titel pro Monat, und dass auf Dauer, nicht vielleicht ein paar Bände in mehreren Monaten. Da liegt dann bei einem Titel die Chance, dass es einen von uns verlinkten treffen würde, so geschätzt bei 1:100.000, viel zu wenig um in Zukunft Klickorgien auf unseren Listen rechtfertigen zu können, was auch den IA-Server nur unnötig belastet.
- User „tpb“ ist das IA selbst, ich verfolge das schon von Anfang an. Der Hinweis “uploaded to the Internet Archive by user tpb.“ sollte das offenbar nur verschleiern und das IA selbst macht keine Einzeluploads, das kannst du mir glauben. Die hatten damals Okt. 08, als der erste Block von 500.000 Titel auf einen Schlag (probiere das mal als angemeldeter Normaluser!) eingestellt wurde, nur die Gelegenheit genutzt, die Anzahl der Bücher zu verdoppeln. Gegrabbt wurde alles samt den Metaseiten aber schon vor dem April 08, danach und bis heute nichts mehr. Die restlichen 400.000 Googlekopien wurden dann über (mit Pausen) mehrere Monate, täglich ein paar hundert eingestellt, oder sagen wir eingeschlichen. (Das war der Punkt, wo die GBIA Vorlage Sinn machte und erstellt wurde.) Vorher bekamen sie übrigens noch von Microsoft alle Bücher von deren aufgegebenen Scanprogramm geschenkt und davor sah es echt mau aus im Bereich Texte, deutsches Fehlanzeige, außer den unvermeidlichen Nazischinken.
- Zum Thema „Einfacher“: Ich benutze die Vorlage GBIA auch bei der Pflege von längeren Listen, die neu erstellt werden oder bei den alten, die offensichtlich noch nicht oder nicht ausreichend auf IA-Kopien überprüft wurden (Wie bei Rosegger, auf den du mich durch deine Erg. aufmerksam gemacht hast) Dazu kopiere ich die komplette Seite in den kostenlosen PSPad-Editor, ersetze mit einem Klick gleich alle GBS mit GBIA, kopiere die Liste zurück ins Editfenster, schaue nach, was da ist im IA und verlinke diese gleich, danach setze ich die Vorlage auf gleichem Wege wieder global zurück und speichere die Seite auf WS ab, weil hier so etwas wie eine stille Übereinkunft besteht, zumindest unter den häufigeren Beiträgern, dass wir bei Google-US immer auch im IA nachschauen und falls vorhanden, direkt verlinken. Bei Frei-Google vor 1869 suchen wir nicht zwingend nach Alternativen, aber weil bei denen immer wieder auch Bände verschwinden, besonders bei Reihen, machen es manche auch da.
- Hinter Gelegenheitsbeiträgern rennen wir aber nicht winkend mit einem Regelwerk her, das so genau ohnehin noch nicht niedergeschrieben ist, sondern ändern es stillschweigend (Manche nennen es Stalking), weil uns zunächst der Hinweis immer wichtiger ist als die Regelkonformität.
- Die Notwendigkeit, gleich direkt zu verlinken, sehen wir dagegen schon, besonders wegen der Nachpflege und der Übersichtlichkeit, was denn nun alles schon ohne Hürden zugänglich ist und was nicht. Nehmen wir mal die Carinthia-Seite, da wird jeder interessierte Benutzer vor lauter Klicken schlicht närrisch, bis er weiss, das kein Band beim IA ohne Proxy einsehbar ist und dort wo es dazwischen doch ein paar Bände gibt, hat am Ende hat er schon vergessen, welche es denn oben waren.
- Daher gilt bei uns ein Google-US Buch ohne IA-Link als überprüft mit negativem Ergebnis, bzw. wird ein Google-US Buch, das noch den GBIA-Suchlink hat, überprüft und die Vorlage geändert. Alles andere würde uns die Arbeit nur erschweren, weil dann keiner mehr weiss, was nun Sache ist. Aber über die Verwendung der versch. Vorlagen (oder einer einzigen für alles) für GBS/IA ist noch nicht das letzte Wort gesprochen. Da fehlt es noch an Empfehlungen, ggf. an Tests. --92.75.107.137 21:50, 19. Sep. 2010 (CEST)
- Vielen Dank für die ausführliche Erklärung, die einleuchtet. Es ist halt schade, dass das Edit-Fenster keine "suche und ersetze"-Funktion hat. Den PSPad-Editor werde ich mir mal anschauen, es bleibt aber wohl das Raus- und Reinkopieren (das ich auch öfter benutze wegen der Verwechslungsgefahr on "1" und 'l" etc.).
- Vielleicht sollte man den Abgleich mit IA in Intervallen vollautomatisch machen (egal ob GBS oder GBIA, da Gelegenheitsbeiträger nicht unbedingt drauf kommen, im IA nachzusehen) und darüber Protokoll führen, damit man weiß, "was Sache ist". --Gorup 11:27, 20. Sep. 2010 (CEST)