Index Diskussion:Sylvicultura oeconomica.pdf

Letzter Kommentar: vor 6 Jahren von 88.78.31.80 in Abschnitt Einrücken?

Ein paar Fragen

Bearbeiten

Hallo Pfaerrich, hallo Maasikaru, ich habe mal ein paar Seiten ab Seite:Sylvicultura oeconomica.pdf/6 korrigiert. Ich denke, dass es auf Grund der Kompliziertheit des Textes sinnvoll wäre, wenn nach mir noch zwei Korrekturschritte folgen. Deshalb habe ich die Seiten auf unkorrigiert gelassen. Oder findet ihr das unnötig?

Zu den ERs: Ich würde gern möglichst zeilengenau korrigieren, um das Korrekturlesen einfacher zu machen. Dazu müssten wir allerdings mit mehrzeiligen Formatierungen etwas aufpassen. Außerdem habe ich im Originaltext gesehen, dass die Antiqua immer nur auf den Kern eines (lateinischen) Wortes angewendet wird, z. B. veneriren. Der Einfachheit halber würde ich in der Übertragung immer das gesamte Wort in <tt> setzen. Was meint ihr?

Was machen wir mit verzierenden Bildern wie z. B. Seite:Sylvicultura oeconomica.pdf/9? --Arnd 11:21, 4. Feb. 2017 (CET)Beantworten

ja, der Text hat es in sich und verleitet schnell zu Korrekturfehlern, da gelegentlich auch Druckerschwärze oder abgestumpfte Lettern für Unsicherheit sorgen, so dass die erste Grobkorrektur wie in genannter Seite exerziert, besser erst mal als unkorrigiert stehen bleibt. Auch dem Zweikorrektor bleibt dann noch genügend Anlass zu großer Aufmerksamkeit. Die zeilengleiche Korrektur ist da sicherlich vorteilhaft. Und die buchstabengleiche Befolgung der Vorlage in puncto tt bringt eigentlich keinen wirklichen Nutzen, sondern stört den Lesefluss.
Was die Ornamente angeht sehe ich deren Übernahme als zweitrangig an. Sie könnten zwar die Bleiwüste etwas auflockern, doch deren Ausschneiden und Hochladen bringt verhältnismäßig wenig Nutzen im Vergleich zum Aufwand. Vielleicht bequemen wir uns zu einem späteren Zeitpunkt zur Nachornamentierung. Pfaerrich (Diskussion) 19:26, 4. Feb. 2017 (CET)Beantworten

fehlt da was?

Bearbeiten

zwischen pdf 11 und 12 scheint ein Bruch zu sein. zumindest passt das Ende von pdf 11 und der Anfang von pdf 12 nicht wirklich zusammen.Pfaerrich (Diskussion) 22:35, 4. Feb. 2017 (CET)Beantworten

Hallo Pfaerrich, ich hatte das auch bemerkt. In https://books.google.de/books?id=_nFDAAAAcAAJ sind die fehlenden zwei Seiten enthalten. Allerdings fehlt bei dieser Version das Vorwort (Aller Durchlauchtigster / Großmächtigster König / Allergnädigster Herr!). Sollte wir die Version trotzdem austauschen oder soll ich die fehlenden Seiten in das vorhandene PDF einfügen? Interessant ist auch, dass in diesem Digitalisat https://books.google.de/books?id=4exeAAAAcAAJ sogar noch eine Widmung am Anfang dabei ist. --Arnd 14:34, 5. Feb. 2017 (CET)Beantworten
Also zumindest die beiden fehlenden Seiten gehören unbedingt rein. Ich habe jetzt nicht geprüft, ob sie passgenau in das Puzzle passen. Die zusätzliche Widmung ist aus meiner Sicht eher nebensächlich.--Pfaerrich (Diskussion) 16:57, 5. Feb. 2017 (CET)Beantworten
Habe die zwei Seiten eingebaut und muss nun die Verschiebung der Seitenzahlen / OCRs korrigieren. Das kann etwas dauern. Melde mich, wenn ich soweit bin. --Arnd 18:37, 5. Feb. 2017 (CET)Beantworten
Komisch übrigens, dass es von PDF Seite 446 auf 447 einen Rücksprung in der Seitennummerierung gibt. --Arnd 18:45, 5. Feb. 2017 (CET)Beantworten

Textverlust auf den Seiten-Scans: Seite:Sylvicultura oeconomica.pdf/253, Seite:Sylvicultura oeconomica.pdf/377, Seite:Sylvicultura oeconomica.pdf/405 und Seite:Sylvicultura oeconomica.pdf/407.--93.131.236.95 15:30, 30. Mai 2017 (CEST)Beantworten

zu den ER

Bearbeiten

ich rege an:

  • Wörter mit gemischt lateinischen <tt></tt> und deutschen Buchstaben komplett in lateinische Schrift zu transkribieren
  • Tab-Sprünge innerhalb des Textes durch neuen Absatz zu ersetzen
  • gesperrte Worte durch {{SperrSchrift| |0.1}} wiederzugeben
  • Leerzeichen vor und nach Schrägstrichen zu setzen
  • total veraltete und heute nicht mehr verständliche Worte bei ihrem ersten Vorkommen zu referenzieren.

Sperrschrift ist zwischenzeitlich durch Anpassung des Formats deutlich lesefreundlicher als kursiver Text und entspricht so auch deutlich besser der Vorlage. --Pfaerrich (Diskussion) 12:08, 6. Feb. 2017 (CET)Beantworten

ok für mich. Habe die Sache mit den falschen OCRs jetzt auch im Griff. Könnten also loslegen. --Arnd 12:19, 12. Feb. 2017 (CET)Beantworten
ist aber mit ‚SperrSchrift wird kursiv (SperrSchrift) durch SperrSchrift formatiert‘. nicht umgesetzt. Auch die gemischt-antiqua-Wörter sind jetzt nicht erwähnt. --Pfaerrich (Diskussion) 12:45, 12. Feb. 2017 (CET)Beantworten
Die Unterscheidung von Fraktur und Antiqua sollte man entweder so, wie im Original - oder eben gar nicht - umsetzen. Der Lesefluß wird doch so oder so „beeinträchtigt“ - und der Quellentext „verfälscht“. Bei der Korrektur bedarf es nur einer relativ kurzen Umgewöhnungszeit. Leerzeichen vor Virgeln halte ich - gerade bei diesem Text - für nicht hilfreich, weil in dieser Zeit des Umbruchs von Virgeln zu Kommata eben schon die Verwendung in heutiger Mode sich durchsetzte (manchmal sind Schrägstriche, manchmal Kommata gesetzt; bei Schrägstrichen finde ich aber relativ häufig das Satzzeichen direkt an das Wort angeschlossen). Die Vereinzelung der Schrägstriche durch Leerzeichen wäre in meinen Augen hier ein Atavismus, und ebenso eine Verfälschung der Quelle. Grüße --Hvs50 (Diskussion) 14:40, 12. Feb. 2017 (CET)Beantworten

Ich selbst bin zu wenig Fachmann, um das inhaltlich bewerten zu können. Für mich ist es wichtig, dass der Text möglichst buchstabengetreu erfasst ist und im wesentlichen die Struktur abbildet. Details spiele für mich keine große Rolle. Wichtig wäre mir ein Konsens - wie auch immer das aussieht. Dann würde ich loslegen. --Arnd 17:12, 25. Mär. 2017 (CET)Beantworten

Habe die ER von Pfaerrich übernommen. Wollen wir damit starten? Wenn ja, könnte uns untere IP die OCR einspielen. Wenn nein, bitte ich noch einmal um Diskussion, ob die Punkte von Hvs50 noch rein sollen. --Arnd 15:09, 17. Mai 2017 (CEST)Beantworten

Ein abweichender Entwurf als Anregung für weitere Diskussionen:
  • Wörter mit gemischt lateinischen <tt></tt> und deutschen Buchstaben werden vorlagengetreu transkribiert
  • Tab-Sprünge innerhalb des Textes werden durch {{idt2|25}} nachgebildet (dies bewahrt den Zeilenumbruch der Vorlage)
  • gesperrte Worte werden durch {{SperrSchrift| |0.1}} wiedergegeben
  • Satzzeichen schließen direkt an, daß gilt insbesondere für Virgeln
  • nur in Kapitelüberschriften und Titelseiten wird die Schriftgröße berücksichtigt (wichtige Begriffe sind in der Vorlage ohnehin durch Fettdruck kenntlich und diesen Text optisch nachzubilden ist illusorisch und für den Leser traumatisch)
Die Grundidee ist: einserseits mit anderen Projekten wie DTA zu konvergieren und andererseits die Arbeit nicht ausufern zu lassen.--93.131.234.59 14:35, 18. Mai 2017 (CEST)Beantworten
Da keine weitere Diskussion stattfindet, beginne ich nun nach und nach die OCR einzuspielen. Als PostOCR-Maßnahme habe ich noch ein Wörterbuch erstellt und damit halbautomatisch korrigiert.--93.131.237.66 06:58, 27. Mai 2017 (CEST)Beantworten
Danke IP, wenn wir gemeinsam den Text vollständig bearbeiten (ich die erste Runde und du die zweite), können wir gerne mit deinen ERs starten. --Arnd 14:08, 27. Mai 2017 (CEST)Beantworten
Mit dem Einspielen hatte ich die aktuell gültige ER akzeptiert und entsprechend Leerzeichen vor Virgeln gesetzt. Mehr als gelegentliche Mitarbeit kann ich eh nicht zusagen.--93.131.240.162 17:06, 29. Mai 2017 (CEST)Beantworten

Da haben wir uns auf etwas eingelassen!

Bearbeiten

Ich gestehe, ich habe noch nie ein Werk dieser Art transkribiert, und die Ornamentik diverser Anfangsbuchstaben in Verbindung mit einem suboptimalen Scan lässt mich gelegentlich minutenlang grübeln, was es denn damit wieder auf sich haben könnte. Manchmal hilft dann die Erinnerung an die Landeskunde weiter, oder der Griff zu Uraltlexika, aber nicht immer führt das Ganze zur sicheren Erkenntnis. Vielleicht müssen wir doch noch einen Spickzettel machen, der es uns erlaubt, von eindeutig identifizierten Ornamentbuchstaben Muster abzulegen, um mit deren Hilfe weniger eindeutige zu erkennen.

Auch dürfte es vorteilhaft sein, ungewöhnliche, längst ausgestorbene oder nur noch Fachleuten bekannte Worte dem Durchschnittsleser und dem Durchschnittsmitarbeiter hier zu erläutern. Solches Glossar hatte ich bei Württembergische Oberamtsbeschreibungen gegen gräflichen Widerstand durchgesetzt. Denn wer kann sich bspw. unter Tangelholz heutzutage noch etwas vorstellen? Der Duden und der Brockhaus helfen da nicht mehr weiter. Und wir alle, wenn denn sich überhaupt genügend MitarbeiterInnen finden und bei der Stange halten lassen, werden noch mehrere Jahre an diesem Werk knabbern. --Pfaerrich (Diskussion) 23:37, 3. Apr. 2017 (CEST)Beantworten

Es muß nicht Jahre dauern. Sobald die ER feststehen, bin ich gerne bereit meine OCR zur Verfügung zu stellen. Abbyy ist hier überfordert. Die Virgel- und Leerzeichenerkennung ist schwach. Das verwendete moderne Wörterbuch geht zudem zu forsch ans Werk. Auf einer Testseite habe ich bei Abbyy 310 (12.535%) und bei OCRopus nach entsprechendem Training 34 (1.375 %) Fehler gemessen. Mit etwas regex drücke ich die Fehlerquote gerne noch etwas. Falls gewünscht, ziehe ich getrennte Wörter auf die nächste Zeile. Aber ohne ER bringt es das Projekt auch nicht voran.--93.131.249.60 11:43, 30. Apr. 2017 (CEST)Beantworten
Der OCR-Import ist nun abgeschlossen. Zu dem Problem der Identifizierung von Schmuckinitialen: Im Register dienen sie als Überschriften und man kann man sie dort nachschlagen. Ansonsten empfehle ich generell zum Korrekturlesen die Verwendenung der MDZ- oder SLUB-Scans. Schwache Virgelabdrucke, heruntergefallene Spatien u. ä. lassen sich dort besser erkennen.--93.131.250.192 13:32, 2. Jun. 2017 (CEST)Beantworten
Nachdem ich nun auf etwa 60 Seiten einen erneuten Blick geworfen habe und auf korrigiert gestellt habe, stelle ich fest, daß ich zu wenig Fehler finde, als daß sich der Zeitaufwand lohnt. Es sollte nun lieber jemand mit einem frischen Blick weitermachen. Der Stand des Textes sollte weitgehend dem entsprechen, was man auch bei einer rein manuellen Erfassung erwarten würde.--93.131.230.124 17:55, 12. Jul. 2017 (CEST)Beantworten
bei brauchbarer OCR kannst Du durchaus auch gleich die erste Korrektur mitliefern. Dann beschleunigt sich der Prozess ungemein. --Pfaerrich (Diskussion) 20:18, 12. Jul. 2017 (CEST)Beantworten
Danke für den Hinweis. Ich setze eine Woche Frist. Findet sich bis dahin niemand, der den Text als nicht qualitätskonform begutachtet, erhöhe ich auf erstkorrigiert.--93.131.233.236 12:04, 13. Jul. 2017 (CEST)Beantworten
Für die Registerseiten greife ich den Vorschlag wieder auf. Nur die Neugier hatte mich zu einer weiteren händischen Durchsicht angetrieben, ertragreich war es nicht. Immerhin bestätigt es aber die Tauglichkeit des Transkriptionsverfahrens. Damit steht das Projekt dann insgesamt auf erstkorrigiert und ich wünsche fröhliche Zweitkorrektur.--93.131.248.115 16:09, 3. Sep. 2017 (CEST)Beantworten

Hallo zusammen, ich wünsche allen Fleißigen hier ein gesundes neues Jahr. Ich würde das Projekt möglichst abschließen. Spricht etwas dagegen, wenn wir das Register (Seite:Sylvicultura oeconomica.pdf/449 ff.) auslassen? --Arnd 16:39, 3. Jan. 2018 (CET)Beantworten

Ich bin für Behalten: 1. Es ist Teil des Werkes. 2. Es erfüllt auch nach 300 Jahren noch seinen Zweck als Hilfsmittel zur Erschließung des Textes. --93.131.246.52 12:04, 11. Jan. 2018 (CET)Beantworten
+ 1 wer A sagt, muss auch rsch ergänzen. Und sobald ich genesen, werde ich auch wieder verstärkt in die 2. Korrektur einsteigen--Pfaerrich (Diskussion) 15:47, 11. Jan. 2018 (CET)Beantworten

Merckwürdigkeiten und Seltzsamkeiten

Bearbeiten
  • Paginierungsfehler: Auf S. 57 folgt S. 62. Wie bereits oben festgestellt wurde, sind die beiden letzten paginierten Seiten ebenfalls falsch paginiert. Auf S. 430 folgt S. 413 und S. 414.
  • Fehler im Textfluß: Die 1. Zeile von S. 92 ist die auf S. 94 fehlende 1. Zeile.
  • Es gibt wenigstens zwei unterschiedliche Ausgaben mit Druckjahr 1713. Sie unterscheiden sich dadurch, daß auf S. 59 im 1. Satz von §. 13. in der einen Ausgabe "Ungeziefrr" und in der anderen "Ungeziefer" zu lesen ist (Google = MDZ: Ungeziefrr, e-rara.ch: Ungeziefrr, Google = British Library: Ungeziefer, SLUB Dresden: Ungeziefer, UB Augsburg: Ungeziefer). Als Vorlage dient uns hier eine "Ungeziefer"-Ausgabe ergänzt um zwei Seiten einer "Ungeziefrr"-Ausgabe.--93.131.232.139 15:52, 29. Aug. 2017 (CEST)Beantworten

Einrücken?

Bearbeiten

Einklich ist die Wiedergabe des Registers, so wie es jetzt sich ergibt, ein toller ungegliederter Buchstabensalat. Auch wenn es zusätzliche Arbeit bedeutet, schlage ich vor, nach einem Stichwort wie „Zeit“ die Folgezeilen mit einem Doppelpunkt beginnen zu lassen. --Pfaerrich (Diskussion) 15:14, 6. Mär. 2018 (CET)Beantworten

PS: diverse Registerseiten tauchen im Index überhaupt nicht auf.
Ich bin dafür. Insbesondere finde ich die </br> nicht so doll. --Arnd 16:57, 6. Mär. 2018 (CET)Beantworten
ich hab mal die Seite:Sylvicultura oeconomica.pdf/450 neu gestaltet. Mit Doppelpunkt zu arbeiten gibt ein unmögliches Bild, daher statt dessen idt verwendet. Ergebnis sieht in meinen Augen deutlich brauchbarer aus. Eure Meinung dazu? --Pfaerrich (Diskussion) 22:39, 8. Mär. 2018 (CET)Beantworten
+ 1 Die Darstellung ist nun gefälliger. Entschuldigt den Buchstabensalat, aber mir ist nichts passendes eingefallen. Stichwörter am Anfang der Zeilen wie „Ausheben, Ausputzen, Aussaat, Ausstattung, Austern“ usw. sind in der Vorlage etwas größer gesetzt. Das mag man vernachlässigen können. Die nicht in Fraktur gesetzten Abkürzungen sollte man allerdings wohl mit Antiqua auszeichnen, oder? Nur der Neugier halber: Welche Registerseiten fehlen denn? --88.78.31.80 18:57, 27. Mär. 2018 (CEST)Beantworten
Zurück zur Seite „Sylvicultura oeconomica.pdf“.