Benutzer Diskussion:THE IT/Archiv/2021

Letzter Kommentar: vor 1 Jahr von THE IT in Abschnitt Gartenlaubenstatistik
Archiv Diese Seite ist ein Archiv abgeschlossener Diskussionen. Ihr Inhalt sollte daher nicht mehr verändert werden. Benutze bitte die aktuelle Diskussionsseite.

Um einen Abschnitt dieser Seite zu verlinken, klicke im Inhaltsverzeichnis auf den Abschnitt und kopiere dann Seitenname und Abschnittsüberschrift aus der URL-Zeile deines Browsers (Beispiel: [[Benutzer Diskussion:THE IT/Archiv/2021#Abschnittsüberschrift]]).

Seite:Die Gartenlaube (1899) 0322.jpg:

bei obiger Seite hattest Du wegen fehlender Gemeinfreiheit einige Seiten gelöscht. Sollen die wieder aufleben, nachdem 2021 die Sperre abgelaufen ist? --Pfaerrich (Diskussion) 14:59, 7. Jan. 2021 (CET)Beantworten

danke für den Hinweis, habe die beiden Seiten in die Freiheit entlassen
Archivierung dieses Abschnittes wurde gewünscht von: THE IT (Diskussion) 18:42, 7. Jan. 2021 (CET)Beantworten

Boak

Hi The IT, frohes Neues! Eine Winzigkeit: Das Autorenregister Paulys Realencyclopädie der classischen Altertumswissenschaft/Register/Arthur Edward Romilly Boak taucht nicht in der Autorenregisterübersicht auf. Viele Grüße, --Tolanor 18:16, 10. Jan. 2021 (CET)Beantworten

...schau ich mir an. --THE IT (Diskussion) 18:20, 10. Jan. 2021 (CET)Beantworten
kleine Datenschieflage, dass Problem wird sich in Bälde beheben --THE IT (Diskussion) 18:36, 10. Jan. 2021 (CET)Beantworten
Super, danke! Schönen Sonntag noch! --Tolanor 18:44, 10. Jan. 2021 (CET)Beantworten
Archivierung dieses Abschnittes wurde gewünscht von: THE IT (Diskussion) 14:36, 15. Jan. 2021 (CET)Beantworten

Hilfe bei Vorlagen für Josephus

S8w4 kommt zur Zeit nicht dazu, zwei Anfragen zu bearbeiten. Es geht um Verlinkungen zu Jüdische Altertümer (noch keine Vorlage vorhanden) und Gegen Apion (diese Vorlage braucht eine Anpassung). Alle Infos dazu findest du hier: Benutzer_Diskussion:S8w4#Vorlage_Josephus_Apion. Kannst du da ohne viel Arbeit aushelfen? Die Hilfeseiten würde ich erstellen. Vgl. Vorlage Diskussion:JVita. Vielen Dank, Batchheizer (Diskussion) 17:00, 17. Jan. 2021 (CET)Beantworten

ich kann mal schauen ob ich die Zeit finde ... kurz einlesen muss man sich ja schon ;-) --THE IT (Diskussion) 20:50, 18. Jan. 2021 (CET)Beantworten
Archivierung dieses Abschnittes wurde gewünscht von: THE IT (Diskussion) 09:14, 20. Jan. 2021 (CET)Beantworten

Gartenlauben-Monatsstatistik

Hallo, THE IT. Könntest Du bitte den bot mal stupsen? Besten Dank. --Maasikaru (Diskussion) 11:28, 3. Apr. 2021 (CEST)Beantworten

Dankeschön. --Maasikaru (Diskussion) 18:34, 3. Apr. 2021 (CEST)Beantworten
Hatte das mal händisch angestoßen ... das dauert ja mittlerweile ewig (über eine Stunde)Krass --THE IT (Diskussion) 12:13, 4. Apr. 2021 (CEST) 8-|.Beantworten
Archivierung dieses Abschnittes wurde gewünscht von: THE IT (Diskussion) 18:03, 12. Apr. 2021 (CEST)Beantworten

Ρ. Wuilleumier

Hi, hast Du eine Ahnung, warum RE:Vellaunus 2 nicht per Modul:RE/Autoren aufgenommen wird? --Tolanor 20:22, 29. Nov. 2021 (CET)Beantworten

das P vom Autor im Artikel war irgendwie strange ... aus irgendeinem Grund war es ein anderer Codepoint im Unicode-Satz. --THE IT (Diskussion) 16:57, 2. Dez. 2021 (CET)Beantworten
Ah, super, das hatte ich nicht erkannt. --Tolanor 21:02, 2. Dez. 2021 (CET)Beantworten
Archivierung dieses Abschnittes wurde gewünscht von: --Tolanor 21:02, 2. Dez. 2021 (CET)Beantworten

Paul Stengel

Hi THE IT, Dein Bot hat den Artikel RE:Ἑλένεια aus dem Autorenregister von Paul Stengel herausgenommen, und ich kann grad nicht ganz nachvollziehen, warum. Du? Viele Grüße, --Tolanor 19:27, 22. Nov. 2021 (CET)Beantworten

ich denke ich wurde fündig [1]
gruß THE IT (Diskussion) 22:53, 22. Nov. 2021 (CET)Beantworten
Wurde jetzt in der Tat wieder eingesetzt. --Tolanor 13:56, 29. Nov. 2021 (CET)Beantworten
Archivierung dieses Abschnittes wurde gewünscht von: THE IT (Diskussion) 14:01, 3. Dez. 2021 (CET)Beantworten

Gemeinfrei 2021

Hallo THE IT, Endlich ist der Zeitpunkt gekommen, Arthur Stein, Edward Capps, August Hug und Hugo Willrich aus der Gefangenschaft in „Platzhalter“ zu lösen. Abgesehen von einigen Wenigen, die ich vielleicht übersehen haben könnte, dürfte sich kein Problem ergeben, alle noch mit gemeinfrei 2021 ausgeschilderten Lemmata per BOT in Standard zu überführen. Kannst Du das bitte übernehmen? mfG --Pfaerrich (Diskussion) 10:56, 3. Jan. 2021 (CET)Beantworten

Das kann ich erledigen. Werde einfach Jahreszahlen der angesprochenen Autoren entfernen. Würde das nur bei den Lemma machen die keine Schöpfungshöhe haben, oder soll ich das für alle tun? --THE IT (Diskussion) 11:20, 3. Jan. 2021 (CET)Beantworten

ja, das passt. Da habe ich mir selbst ein Bein gestellt, denn Platzhalter 2021 dürften, wenn meine Vorarbeit korrekt gelaufen ist, nicht mehr vorhanden sein. --Pfaerrich (Diskussion) 12:02, 3. Jan. 2021 (CET)Beantworten

sollten ab náchster Nacht Stück für Stück verschwinden. Gruß --THE IT (Diskussion) 20:03, 6. Jan. 2021 (CET)Beantworten
Danke, gerne die bisherigen Veränderungen wahrgenommen. Einklich dürfte dann RE-seitig nichts mehr vorhanden sein. Es war nicht ganz leicht, die rund 500 Platzhalter noch vor Jahresende zu wandeln, aber es war Spitz auf Knopf in der Silversternacht gelungen. 2022 wird dagegen ein Katzenspiel. Und wenn es im derzeitigen Tempo weitergeht, werden wir wohl Ende des Jahres bei 40tsd bearbeiteten Lemmata landen, dank immenser Unterstützung durch Elexicon. Vielleicht gelingt es uns ja, zusätzliche Mitarbeiter zu gewinnen. eod --Pfaerrich (Diskussion) 21:24, 6. Jan. 2021 (CET)Beantworten

doch nochmals nachgefasst: habe Deine nächtliche Umstellung kurz gecheckt. Wäre es nicht angebracht, auch |KEINE_SCHÖPFUNGSHÖHE=ON auf |KEINE_SCHÖPFUNGSHÖHE=OFF umzustellen?--Pfaerrich (Diskussion) 08:31, 7. Jan. 2021 (CET)Beantworten

Änderung erledigt. Das war in der Tat eine klasse Endspurt den du da hingelegt hast. Die 40.000 korrigiert + fertig haben wir ja bereits. Ich habe gestern mit Elexikon telefoniert und mag tatsächlich auch sehr den frischen Wind der hierdurch reinkommt, im Speziellen seine Bemühungen um vermehrte Dokumentation. Ich werde versuchen mir das als Vorbild zu nehmen ;-). Das könnte dann vielleicht auch helfen vermehrt Mitarbeiter anzuwerben. --THE IT (Diskussion) 09:04, 7. Jan. 2021 (CET)Beantworten
@Pfaerrich:, habe noch ein paar Autoren dazu genommen, warte mal noch ein paar Tage, dann sollte die Kategorie fast leer sein und dann beräume ich die Reste. --THE IT (Diskussion) 21:15, 18. Jan. 2021 (CET)Beantworten
Archivierung dieses Abschnittes wurde gewünscht von: THE IT (Diskussion) 20:37, 21. Apr. 2022 (CEST)Beantworten

RE:Ilias

Hallo THE IT, ich habe zwar den Artikel so weit auf Gelb gebracht, aber ich musste einige Seiten fremdbesorgen, z.B. S. 1011 oder 1013. Die Scans habe ich dann auch in Commons hochgeladen, brachte sic aber nicht dazu, bei der Korrektur eingeblendet zu werden. So konnte ich nur dank zweier Bildschirme diese Seiten dennoch korrigieren. Was machte ich da falsch beim Hochladen bzw. beim Verlinken? Das Thema stellte sich für mich schon mehrmals, wenn ich scans von der Uni Jena besorgte. Daher die Frage an den Experten. --Pfaerrich (Diskussion) 14:45, 7. Jan. 2021 (CET)Beantworten

Archivierung dieses Abschnittes wurde gewünscht von: THE IT (Diskussion) 20:37, 21. Apr. 2022 (CEST)Beantworten

RE: Stammdaten für das Register

Hallo THE IT, wünsche Dir ein happy weekend! Systematisch möchte ich die Stammdaten von fehlenden Artikeln mit dem Datenblock {{REDaten|...}} als unkorrigierte Lemma erfassen, um später das RE:Register pflegen zu können, wenn es nötig ist. Aus dem bestehenden Register und aus dem „Herkules“ von Pfaerrich kopiere ich die Angaben gemäss der EXCEL-Datei RE-7_Neuland bzw. aus der Text-Vorlage RE-7_Neuland in Version „_V1“. Wenn Du bitte einen Kontrollblick darauf wirfst, können wir die Stossrichtung wenn nötig korrigieren. Besten Dank im Voraus! --ELexikon (Diskussion) 19:16, 9. Jan. 2021 (CET)Beantworten

... in Version „_V1a“ --ELexikon (Diskussion) 21:02, 9. Jan. 2021 (CET)Beantworten
das klingt gut ich mag die Idee. Das wird mir dann auch einiges zu tun geben die Stammdaten einigermaßen clean zu halten. Auf der anderen Seite kann man das dann auch JETZT machen und nicht erst in sonst wie vielen Jahren, wenn dann mal der letzte Artikeln angelegt wurde.
Gerade wenn du das Ganze bandweise anlegst schau ruhig immer parallel in die Scans, denn die sind ja die eigentliche Wahrheit.
Ich habe gerade nochmal die die verlinkte Zip geschaut. Bitte versuche die Vorlage REWL nicht zu nutzen, nimm stattdessen REIA, der ersteren muss sich dereinst ein Bot entledigen, da es die Daten dahinter einfach nicht mehr gibt.
Die Setzung der Autoren finde sich so schwierig, da die Klarnamen so selten unter den Artikeln stehen werden. Häufig wird ja nur der Nachname verwendet. Das würde uns dann sehr viele unbekannte Autoren reinspülen und dann müssten wir viele Mappings erstellen für Autorenkürzel, die so in der RE gar nicht vorkommen. --THE IT (Diskussion) 18:20, 10. Jan. 2021 (CET)Beantworten

Danke für die Hinweise zu Autoren, die ich gerne beachte. Meine Experimente mit neuen Artikeln zeigen Handlungsbedarf bei der Texterkennung. PDF-XChange kann aus *.tif Dateien ganze RE-Bände.pdf erstellen und mit OCR ergänzen. Damit wird der wiederkehrende Aufwand je Lemma gesenkt, einmalige Verarbeitungen genügen. Nach Qualitätskontrollen könnten 2x 84 grosse pdf erstellt werden. Links gehören auf die RE-Seiten „Bände“ und „Register“ plus Hinweise in der RE-Werkstatt zur best practice. Elegant möchte ich über 27'000 neue Dateien *.pdf/OCR die Scan *.tif ergänzen. Gleichzeitig sollen fünf Bände P11_–P15_ (= VI,1–VIII,1) neu P_11–P_15 heissen, P361–P363 neu P_36, P_3A, P_3B, vielleicht Teile von P_01 / P_09 abgespalten neu P_02 / P_10. Hast Du ergänzende Ideen, Erfahrungen oder allgemeine Bemerkungen zu meinem Plan? --ELexikon (Diskussion) 12:57, 15. Jan. 2021 (CET)Beantworten

PS: Nochmals herzlichen Dank für den JSON-Link zu geänderten RE-Artikeln, er funktioniert super gut! Immerhin ist er komplexer als zuerst vermutet, Neues hab ich gelernt. Diese Herausforderung stabilisiert dennoch meine Grundlagen. In kommenden Umbauphasen soll er konsequent eingesetzt werden. Gibt es eine Dokumentation zu den Parametern?
Ich verstehe den Plan ehrlich gesagt noch nicht ganz. Wenn du mit Reduzierung wiederkehrender Aufwände meinst, dass nur noch ein Bearbeiter auf Fertig setzen muss, dann wird der Plan nicht aufgehen, da wir momentan schon nur den minimalen Korrekturaufwand hier machen ... theoretisch sind 3 Korrekturvorgänge vorgesehen :-(. Prinzipiell finde ich aber deine Ideen sehr lohnenswert. Weitere Anmerkungen habe ich erstmal nicht. --THE IT (Diskussion) 20:12, 16. Jan. 2021 (CET) PS: zum JSON Link: eine richtige Dokumentation der Parameter gibt es wohl nicht. Ich gehe dort immer so vor mir die Query zusammenzuschustern und dann schaue ich welche Parameter raus kommen ... meine gesammelten Erkenntnisse lassen sich höchstens an meinem Code ablesen [2]Beantworten

Sorry für das Durcheinander! Was hab ich nur getextet? Also nochmals die Gedanken im Einzelnen.

  • Die .tif möchte ich durch .pdf ersetzen, welche OCR Text haben. Die finale Qualität kann ich noch nicht sicher abschätzen, wir werden sehen.
  • Dazu werden die 27'500 Dateinamen - wo nötig - nochmals gezielt angepasst, damit eine konsequente Logik entsteht. Dies betrifft die Bände P11_ etc. wie oben angetönt. Und innerhalb von P_06 etc. werden die Seiten um +/- 1 verschoben ...
  • Das Programm "PDF-XChange", das die SBB im Einsatz hat, braucht für das OCR pro Seite etwa 1 Minute, das sind pro Band 6 Stunden. Mit drei Schichten pro Tag könnte ich Anfang Februar '21 fertig sein.
  • Keine Angst: Jeden Artikel werde ich gewissenhaft korrekturlesen, wenn etwas in die RE geht. Die Texte sind interessant. Das 4- oder 6-Augenprinzip ist ganz wesentlich.
  • Die Fehlerlisten betreffend Register werden systematisch kleiner - es funktioniert. Und gleichzeitig werden meine Arbeitsinstrumente besser.
  • Auch die Dokumentation in der RE-Werkstatt kommt voran. --ELexikon (Diskussion) 20:18, 18. Jan. 2021 (CET)Beantworten
Alles gut, jetzt klingt das Ganze doch viel klarer :-D ... und sehr cool.
  • TIF vs. PDF ... da habe ich tatsächlich keine starke Meinung und Recht hast du, da kann man die OCR gleich unterbringen.
  • wenn die Dateinamen relativ final sind bastel ich die Berechnungsformel gerne in die Register und die Vorlagen ein ... dann würde das Wikiversium auf die von dir gehosteten Dateien zeigen.
  • dein Elan zieht mich ein ganz gut mit ... ich bin gerade dabei die Erkenntniss aus unseren Telefonaten für mich ein wenig zu ordnen. Den ein oder anderen Bug habe ich schon behoben und die restlich Tasks trage ich mir gerade ein, damit ich sie nicht verdränge und dann schau ich mal, dass ich mir pro Tag dafür ein wenig was abknapse. ... man hat ja momentan leider auch wenig anderes zu tun :-(.
--THE IT (Diskussion) 21:06, 18. Jan. 2021 (CET)Beantworten
Archivierung dieses Abschnittes wurde gewünscht von: THE IT (Diskussion) 20:38, 21. Apr. 2022 (CEST)Beantworten

Autorenübersicht

Hallo THE IT, für mich die Übersicht aller Autorenregister schwer lesbar. Einfacher wäre, wenn alle Zellen rechtsbündig ausgerichtet sind, beispielsweise mit

{|class ="wikitable sortable" style="text-align:right;".

Alle Zahlen wären korrekt dargestellt und der Nachname des Autors wäre besser ersichtlich. Was meinst Du? --ELexikon (Diskussion) 17:36, 31. Jan. 2021 (CET)Beantworten

gute Idee, dass lässt sich doch schnell machen. --THE IT (Diskussion) 16:10, 2. Feb. 2021 (CET)Beantworten
Archivierung dieses Abschnittes wurde gewünscht von: THE IT (Diskussion) 20:38, 21. Apr. 2022 (CEST)Beantworten

Wikisource:DTA-Werkstatt

Hallo THE IT, sehe ich das richtig, dass das o. g. Vorhaben damals im Sande verlaufen ist? --Arnd 20:22, 12. Mär. 2021 (CET) Hallo Arnd,Beantworten

das ist leider korrekt. —THE IT (Diskussion) 23:19, 12. Mär. 2021 (CET)Beantworten

das betrifft auch das Python-Skript zum Importieren, oder? --Arnd 10:09, 13. Mär. 2021 (CET)Beantworten

Das betraf vor allem das Skript. Hättest du Interesse das fortzusetzen? —THE IT (Diskussion) 18:46, 14. Mär. 2021 (CET)Beantworten

Habe jetzt gerade für die SF-Werkstatt ein kleines Skript auf Basis des Textexports von DTA erstellt, das den Text in die Seiten splittet und zwei, drei Ersetzungen durchführt. Ich denke, das reicht für den Moment. Sollten weitere Projekte mit Übernahme aus dem DTA kommen, könnte es sein, dass ich das weiter entwickle. Gruß, --Arnd 19:12, 14. Mär. 2021 (CET)Beantworten

Hallo Arnd, die Zielstellung die wir damals hatten ist irgendwann ein wenig ausgeufert und dann wohl schlicht an meinem Zeitmangel gescheitert. Irgendwann schlichen sich bei mir tatsächlich auch Zweifel ein, ob das ganze sinnvoll ist, wenn der Text ja schon an einem Ort digitalisiert ist. Mit den heutigen wissen über die Erschließung in Wikidata ware die Antwort vielleicht eine andere. In welcher Sprache hast du denn das Splitting gemacht? —THE IT (Diskussion) 22:36, 14. Mär. 2021 (CET)Beantworten

Hi, ich habe einige Skripte in PHP, die ich einmal für die Erstellung der OCR und Weiterverarbeitung bis hin zum Upload geschrieben habe. Die habe ich erweitert für die DTA-Zwecke. Allerdings versuche ich schon seit Jahren auf Python umzusteigen, schaffe es aber nicht wegen den schon vorhandenen und noch funktionierenden PHP-Skripten. Gruß, --Arnd 10:44, 15. Mär. 2021 (CET)Beantworten

Das mit dem Umstieg kann ich verstehen ;-) ... willst du Hilfe dabei. Ich mach Python seit ein paar Jahren und jemand ein paar Tricks zeigen, der eh schon programmieren kann sollte recht leicht sein in Python. --THE IT (Diskussion) 17:14, 17. Mär. 2021 (CET)Beantworten

Mit dem Python bekomme ich schon hin, wenn ich es brauche. Aber es gibt eine andere Sache. Gerade baue ich ein paar Funktionen in meine common.js und ich weiß nicht wie damit effizienter entwickeln kann als: (1) Datei ändern und speichern, (2) Testlauf auf der Zielseite, (3) Auswertung von extra eingefügten Logmeldungen oder Exceptions auf der Webconsole. (4) zurück nach (1). Das ist echt langsam, wie du dir vorstellen kannst. Hast du eine Idee, wie man das besser machen könnte? Ich würde gern mein Skript testen können ohne zu Speichern. Mit der Vorschau bei Bearbeitung der common.js würde das prinzipiell gehen, aber ich rufe die entwicklten Funktionen üblicherweise auf anderen Seiten auf und ändere teilweise den Wikitext, was ja dann auch in der common.js gemacht würde. Wie gesagt, vielleicht hast du ja eine Idee. Schönen Abend, --Arnd 20:18, 21. Mär. 2021 (CET)Beantworten

He du, ich habe mir das etwas angeschaut. Da habe ich leider keine guten Nachrichten für dich ... es gibt auch Gründe warum ich eher Backend-Sachen mag ;-). Man kann sich ja in den Developer-Tools, da wo auch die Konsole ist, ja die ausgeführten Java-Script-Files anschauen (im Firefox der Reiter Debugger). Leider ist Mediawiki aber ja so gestrickt: Du gibst deine Änderungen in der common.js ein, dann dreht Mediawiki das durch jede Menge php und dann landet es in minifizierten JS-Files. Lange Rede kurze Erkenntnis, ich sehe leider keine Möglichkeit deinen Workflow zu vereinfachen und ich habe wieder begriffen, warum ich Frontend nicht mag ;-). --THE IT (Diskussion) 14:20, 4. Apr. 2021 (CEST)Beantworten
Archivierung dieses Abschnittes wurde gewünscht von: THE IT (Diskussion) 20:39, 21. Apr. 2022 (CEST)Beantworten

Gartenlaubenstatistik

Hallo, THE IT. Es fiel mir im Laufe des Jahres schon auf, jetzt wird's noch deutlicher. Die Statusanzeige für 1858 stimmt nicht, selbiges habe ich nämlich vor Kurzem fertig gestellt. Genausowenig kann 1868 stimmen, das nur angeblich fertig ist. Sind die am Ende vertauscht? Nicht lebensnotwendig, aber nice to have. Ein besseres neues Jahr wünscht --Maasikaru (Diskussion) 10:32, 1. Jan. 2021 (CET)Beantworten

das sieht mir auch fast wie ein Dreher aus ... irgendwo, ich versuch den Fehler zu finden. --THE IT (Diskussion) 18:50, 1. Jan. 2021 (CET)Beantworten
Archivierung dieses Abschnittes wurde gewünscht von: THE IT (Diskussion) 15:49, 2. Sep. 2022 (CEST)Beantworten
Zurück zur Benutzerseite von „THE IT/Archiv/2021“.