Wikisource:Skriptorium/Archiv/2022/August

Archiv Diese Seite ist ein Archiv abgeschlossener Diskussionen. Ihr Inhalt sollte daher nicht mehr verändert werden. Benutze bitte die aktuelle Diskussionsseite.

Um einen Abschnitt dieser Seite zu verlinken, klicke im Inhaltsverzeichnis auf den Abschnitt und kopiere dann Seitenname und Abschnittsüberschrift aus der URL-Zeile deines Browsers (Beispiel: [[Wikisource:Skriptorium/Archiv/2022/August#Abschnittsüberschrift]]).

Invitation to join the fifth Wikisource Triage meeting (18th August 2022)

Hello fellow Wikisource enthusiasts!

We are the hosting the fifth Wikisource Triage meeting on 18th August 2022 at 4 PM UTC / 9:30 PM IST (check your local time) according to the wudele poll and also based on the previous feedback to have a Europe-Americas friendly meeting.

As always, you don't have to be a developer to participate in these meetings but the focus of these meetings is to improve the Wikisource infrastructure.

If you are interested in joining the meeting, kindly leave a message on sgill@wikimedia.org and we will add you to the calendar invite.

Meanwhile, feel free to check out the page on Meta-wiki and suggest any other topics for the agenda.

Regards

Sam Wilson (WMF) and Satdeep Gill (WMF)

Sent using MediaWiki message delivery (Diskussion) 17:05, 15. Aug. 2022 (CEST)[Beantworten]

Archivierung dieses Abschnittes wurde gewünscht von: Dominic Z. (Diskussion) 10:07, 4. Sep. 2022 (CEST)[Beantworten]

Im Feld Geburt sollte nicht * 1400 stehen. Danke --Historiograf (Diskussion) 15:03, 3. Aug. 2022 (CEST)[Beantworten]

Hallo Historiograf, habe im Wikidata-Objekt das Geburtsdatum gelöscht, es wird nun "unbekannt" als Geburtsdatum angezeigt. Gruß --Mapmarks (Diskussion) 19:23, 5. Aug. 2022 (CEST)[Beantworten]
Danke --Historiograf (Diskussion) 17:57, 8. Aug. 2022 (CEST)[Beantworten]
Archivierung dieses Abschnittes wurde gewünscht von: Mapmarks (Diskussion) 21:23, 5. Sep. 2022 (CEST)[Beantworten]

Offensichtliche Irrtümer des Setzers

Ist das Vorgehen, wie von mir in Seite Diskussion:De Kunstdenkmäler Baden 6 327.jpg ‎ skizziert, in Ordnung? --Matthiasb (Diskussion) 02:32, 31. Aug. 2022 (CEST)[Beantworten]

Archivierung dieses Abschnittes wurde gewünscht von: Mapmarks (Diskussion) 01:16, 23. Sep. 2022 (CEST)[Beantworten]

Neues von Movement Strategy und Governance - Ausgabe 7

Neues von Movement Strategy und Governance
Ausgabe 7 – Juli - September 2022Vollständigen Newsletter lesen


Willkommen zur 7. Ausgabe der Movement Strategy and Governance News! Der Newsletter informiert über relevante Neuigkeiten und Veranstaltungen zur Umsetzung der Strategieempfehlungen der Wikimedia Foundation für das Movement, über andere relevante Themen im Zusammenhang mit der Governance des Movements sowie über verschiedene Projekte und Aktivitäten, die vom Movement Strategy and Governance (MSG) Team der Wikimedia Foundation unterstützt werden.

Der MSG Newsletter wird vierteljährlich versandt, während der häufiger erscheinende Movement Strategy Weekly wöchentlich erscheint. Bitte vergiss nicht, dich hier anzumelden, wenn du zukünftige Ausgaben des Newsletters erhalten möchtest.

  • Nachhaltigkeit im Movement: Der jährliche Nachhaltigkeitsbericht der Wikimedia Foundation wurde veröffentlicht. (Weiterlesen)
  • Verbesserung der Benutzerfreundlichkeit: Aktuelle Verbesserungen der Desktop-Oberfläche für Wikimediaprojekte. (Weiterlesen)
  • Sicherheit und Inklusion: Aktuelles zum Überarbeitungsprozess der Leitlinien zur Durchsetzung des Universal Code of Conduct. (Weiterlesen)
  • Gleichberechtigung in der Entscheidungsfindung: Berichte aus den Gesprächsrunden der Hubs, die jüngsten Fortschritte des Entwurfskomitees der Movement Charter und ein neues Weißbuch für die Zukunft der Beteiligung in der Wikimedia-Bewegung. (Weiterlesen)
  • Koordination der Stakeholder: Einführung eines Helpdesks für Affiliates und freiwillige Communities, die an der Partnerschaft für Inhalte arbeiten. (Weiterlesen)
  • Entwicklung der Führungsqualität: Updates zu den Führungsqualitäten der Organisatoren des Wikimedia Movements in Brasilien und Kap Verde. (Weiterlesen)
  • Internes Wissensmanagement: Start eines neuen Portals für technische Dokumentation und Community-Ressourcen. (Weiterlesen)
  • Erneuerung im Freien Wissen: hochwertige audiovisuelle Ressourcen für wissenschaftliche Experimente und ein neues Toolkit zur Aufzeichnung mündlicher Mitschriften. (Weiterlesen)
  • Evaluieren, iterieren und anpassen: Ergebnisse aus dem Pilotprojekt Equity Landscape (Weiterlesen)
  • Weitere Neuigkeiten und Aktualisierungen: ein neues Forum zur Diskussion über die Umsetzung der Movement Strategy, die bevorstehende Wahl zum Board of Trustees der Wikimedia Foundation, ein neuer Podcast zur Diskussion über die Movement Strategy und eine personelle Veränderung im Movement Strategy and Governance Team der Foundation. (Weiterlesen)

MNadzikiewicz (WMF) (Diskussion) 15:44, 3. Aug. 2022 (CEST)[Beantworten]

Archivierung dieses Abschnittes wurde gewünscht von: Mapmarks (Diskussion) 00:31, 1. Okt. 2022 (CEST)[Beantworten]

Macht es Sinn, bei Stubs auf Gemeinfreiheit hinzuweisen?

Beispiel: RE:Danaïs 2 von Otto Waser, gest. 1952. Der ganze Artikel besteht aus einem einzigen Satz, ist auf fertig gestellt, trägt aber noch den Passus "Gemeinfreiheit 2023". Mehrere ähnlich gelagerte Lemmata sind vorhanden. Ich halte das für überflüssig. Eure Meinung? Pfaerrich (Diskussion) 12:23, 8. Aug. 2022 (CEST)[Beantworten]

Ich denke, dass muss je nach Einzelfall beurteilt werden. --Bodhi-Baum (Diskussion) 10:33, 10. Aug. 2022 (CEST)[Beantworten]
Hallo Pfaerrich. Sinn macht es kaum, nötig ist es auch nicht. Andererseits ist es, wie hier, sicher einer von mehreren Artikeln des Autoren, die man dann, hier 2023, en bloc von der Notiz befreit. --Maasikaru (Diskussion) 10:40, 10. Aug. 2022 (CEST)[Beantworten]
Also im Einzelfall entbehrlich. Wenn wir es also im Einzelfall unterlassen, brauchen wir diese Stubs nach Eintritt der Gemeinfreiheit auch nicht mehr vom Hinweis zu entbinden. Pfaerrich (Diskussion) 21:29, 15. Aug. 2022 (CEST)[Beantworten]
Zustimmung, diese Artikel sind gemeinfrei, denn sie haben keine w:Schöpfungshöhe. Bei der RE steht: Artikel können ediert werden, wenn der inhaltliche Umfang »zwei Sätze« nicht übersteigt, wobei Titel, Zitate sowie Stellen- und Literaturangaben nicht mitgezählt werden. Voraussetzung ist, dass sich keine eigene Positionierung des Autors findet, z. B. in der Abwägung von Forschungsmeinungen. Konkrete Beispiele sind unter RE Schöpfungshöhe. ELexikon (Diskussion) 22:19, 15. Aug. 2022 (CEST)[Beantworten]
Archivierung dieses Abschnittes wurde gewünscht von: Mapmarks (Diskussion) 20:21, 17. Apr. 2023 (CEST)[Beantworten]

Automatisiert erzeugte Volltexte für Tübinger Sammlungen

Momentan generiere ich Volltexte (OCR) für Bücher und Zeitschriften aus Tübinger Sammlungen (DigiTheo, DigiTue), siehe bisherige Ergebnisse. Diese können als Ausgangsbasis für die Erfassung in Wikisource dienen, demonstrieren aber auch, welche (je nach Vorlage mehr oder weniger gute) Qualität von automatisierten Transkriptionen inzwischen mit relativ einfachen Mitteln (dokumentiert unter dem gleichen Link) möglich ist. --Stefan Weil (Diskussion) 15:17, 5. Aug. 2022 (CEST)[Beantworten]

Dieses OCR-Projekt für Tübinger Sammlungen ist inzwischen mit mehr als 650000 Seiten abgeschlossen. --Stefan Weil (Diskussion) 08:13, 12. Mär. 2023 (CET)[Beantworten]

Für Paulys RE erzeuge ich die Volltexte je Scan bzw. Doppelseite mit ABBYY FineReader 15. Das Resultat wird als HTML gespeichert und mit einer massgeschneiderten Software in das WIKI Format umgewandelt. Automatisch werden die nötigen RE-Links im Text nach den Regeln der Kunst ergänzt. Am Schluss des Textes folgen zudem die auflösbaren Abkürzungen aus dem Artikel. Der Artikel RE:Rhenus 3 sei ein Beispiel, am Ende des Rohtextes ist die erwähnte Liste.--ELexikon (Diskussion) 13:17, 17. Aug. 2022 (CEST)[Beantworten]

Im Spannungsfeld zwischen Quantität und Qualität gab für die Paulys Realencyclopädie (RE) seit 2020 mehrere Ansätze.

  1. Einen ganzen Halbband à 370 Doppelseiten mit je vier Spalten als grosse (Bild-)Datei erstellen, inklusive Scan (total 240 MB), ausgeführt mit dem Programm PDF X V 1.3. Die Genauigkeit ist unbefriedigend, einsehbar unter RE-0_P_13.
  2. wurden kurze, gemeinfreie Artikel als JPG Schnipsel mit ABBYY transkribiert. Dieser Ansatz war sehr erfolgreich, kann aber nicht die Anforderungen erfüllen, die ab ca. fünf Textzeilen gelten: Die Vollständigkeit ist über mehrere Spalten zu erreichen, das x-fache Copy-Paste ist zu vermeiden und die sich wiederholenden Links sind effizient für jeden Artikel einzubauen.
  3. Das Optimum für die RE wird aktuell erreicht mit dem Ansatz "automatische Links", der oben beschrieben ist.

--ELexikon (Diskussion) 12:40, 18. Aug. 2022 (CEST)[Beantworten]

Wie war denn die Qualität der ABBYY OCR-Ergebnisse? Musste viel nachkorrigiert werden? Soweit ich bisher gesehen habe, waren die Seiten der Realenzyklopädie in Antiqua gedruckt (also keine Fraktur), womit ABBYY Finereader in der Regel wenig Probleme haben sollte.
Und gibt es die maßgeschneiderte Software zum Konvertieren von HTML ins Wiki-Format irgendwo, so dass man sie nachnutzen kann? Stefan Weil (Diskussion) 09:45, 12. Mär. 2023 (CET)[Beantworten]
Archivierung dieses Abschnittes wurde gewünscht von: 9xl (Diskussion) 16:55, 28. Mär. 2024 (CET)[Beantworten]