Wikisource Diskussion:Statistik/Seitenaufrufe

Letzter Kommentar: vor 13 Jahren von 9xl in Abschnitt 2010-10

Seitenaufrufe 2010-06 Bearbeiten

Das ist ein erster Versuch, eine solche Statistik monatlich zu erstellen.

Log:

Für diese Auswertung wurden 688 Dateien mit 35.991.575.302 Bytes von http://dammit.lt/wikistats/archive/2010/06/ heruntergeladen; in diesen wurden 161.032.684 Zeilen durchsucht. Es wurden 396.073 verschiedene Seiten auf de.wikisource aufgerufen. Insgesamt wurden in diesem Monat 1.250.278 Seitenaufrufe registriert.

Probleme:
  1. Es hätten eigentlich 24*30=720 Dateien mit ca. 42 GByte sein müssen.
  2. 396.073 verschiedene Seiten? Wir haben heute (2010-09-18) nur knapp 210.000.
  3. 1.250.278 Seitenaufrufe? Laut Wikimedia waren es 2,2M.

Es ist also noch Einiges zu sortieren, bevor man das vorzeigen kann. --9xl 18:17, 18. Sep. 2010 (CEST)Beantworten


Zu 1: Im Juni gab es Probleme mit der Aufzeichnung. Im Archiv finden sich eine Anzahl Dateien die unverhältnismäßig klein bis ganz leer sind. Da ich aus Platzgründen jede Datei sofort nach der Auswertung gelöscht habe, kann ich nachträglich nicht kontrollieren, was ausgewertet wurde und was nicht.

Ich werde das Skript teilen in a: download und b: auswerten sowie ein Logfile schreiben. Dann kann man schnell sehen, wenn etwas nicht gelaufen ist wie es sollte. Zu a: braucht mein Zweitcomputer aber mehr Harddisk.

Zu 2: In der Datenbank finden sich 98.000 Einträge der Form 'Spezial:Änderungen_an_verlinkten_Seiten/...' und 82.000 der Form 'Spezial:Linkliste/...' und bestimmt noch einige ähnliche. Ich werde das Argument nach dem '/' abschneiden, sodass es jeweils nur einen Eintrag dafür gibt.

Zu 3: Erklärt sich wohl teilweise aus 1.

--9xl 18:47, 19. Sep. 2010 (CEST)Beantworten

2010-10 Bearbeiten

Die Probleme mit der Aufzeichnung der Log-Dateien sind wohl behoben worden.

Es bleiben aber noch einige Fragezeichen.

  1. Bei den Zugriffszahlen haben sich die Verhältnisse umgekehrt. Laut Wikimedia waren es im Oktober 2 Mio, ich habe 2,8 Mio gezählt.
  2. Die oben zu 2. erwähnte Änderung habe ich durchgeführt. Trotzdem habe ich im Oktober Zugriffe auf 269.000 verschiedene Seiten gezählt obwohl es nur 212.000 Seiten gab. Das rührt anscheinend ganz wesentlich von verschiedenen Schreibweisen her, die von Mediawiki auf die gleiche Seite gelenkt werden. Bspw. 'Friedrich Schiller' und 'Friedrich_Schiller'; die erscheinen beide in den Log-Dateien. Das alles auszusortieren wird nicht einfach.

--9xl 10:42, 28. Nov. 2010 (CET)Beantworten

?? Bearbeiten

Woher kommt sowas? 4 Http://amygirl.chat.ru/images/image.txt? 2793 --Jmb1982 22:51, 10. Okt. 2010 (CEST)Beantworten

Verstehe ich auch nicht, wie das und ähnliches auf einem Wikimedia-Server landet, auch noch ein paar tausend mal. Da gibt es noch einige andere merkwürdige Erscheinungen, bspw. wer ruft einen Zweizeiler wie Jakob_Friedrich_Maler 3000+ mal auf? --9xl 12:58, 11. Okt. 2010 (CEST)Beantworten
Zurück zur Projektseite „Statistik/Seitenaufrufe“.