Wikipedia Diskussion:Personendaten/Wartung/Fehlerliste/Archiv/2011

aus Wikipedia, der freien Enzyklopädie
Letzter Kommentar: vor 9 Jahren von Onkelkoeln in Abschnitt Fehlerliste enthält Fehler
Zur Navigation springen Zur Suche springen

ID 248 - Alternativnamen falsch sortiert

Einige Artikel wie Anthony Hope und Angelina Jolie werden hier leider gelistet, sind aber nicht falsch. Sie werden erkannt, weil die wirklichen Namen Anthony Hope Hawkins und Angelina Jolie Voight lauten. Eventuell kann man das Skript so anpassen, dass wenn ein 'fehlerhafter' String im Feld ALTERNATIVNAMEN= gefunden wird (z.B. Hawkins, Anthony Hope oder Voight, Angelina Jolie) auch gleichzeitig danach gesucht wird, ob der String (Geburtsname), (wirklicher Name), (vollständiger Name), (Spitzname) gleich hinter dem 'fehlerhaften' String erscheint (wie bei den beiden Beispielen hier). Diese können dann gleich aus der Fehlerliste herausgenommen werden. Bei einigen weiteren gelisteten Artikeln bei ID248 können diese Strings noch ergänzt werden, sodass eigentlich nicht mehr allzu viele Artikel übrig bleiben sollten, die (eventuell) noch als weitere Ausnahmen hinzugefügt werden müssten. Könnte das klappen oder überseh ich etwas? Gruß und frohes Schaffen im neuen Jahr wünscht HS13 23:35, 1. Jan. 2011 (CET)

Muss ich mal ausprobieren. Das mit dem Klammerausdruck könnte genau das Problem lösen, was ich bisher immer sah. Denn genau solche Fälle sollten ja gefunden werden. -- sk 16:46, 6. Jan. 2011 (CET)
 Ok, hab das mal ins Skript eingebaut, mal schauen wie es morgen aussieht. -- sk 21:23, 11. Jan. 2011 (CET)
Danke, sieht sehr gut aus. Hast Du neben den 4 vorher genannten auch (Künstlername) und (Pseudonym) eingebaut? -- HS13 05:25, 12. Jan. 2011 (CET)
Nein, das Skript schaut nur, ob nach dem String ein Semikolon kommt oder das Zeilenende. Vorher wurde auch danach geschaut ob eine Klammer kommt. Das heißt dem Skript ist es egal was in der Klammer steht. Wenn eine Klammer da ist, wird der Artikel mit "Alternativnamen=Hans Arthur Meier (russische Schreibweise); H. Arthur Meier (Spitzname)" nicht gefunden.--sk 06:52, 12. Jan. 2011 (CET)

Heute keine Aktualisierung

s.o. Andim 11:08, 3. Jan. 2011 (CET)

Vielleicht hängt dies mit dieser Änderung zusammen. Ebenso funktioniert die Aktualisierung bei CW nicht. Andim 13:50, 3. Jan. 2011 (CET)
Ja das war angekündigt. Ich hoffe das der Umstieg auf Solaris gut klappt. -- sk 22:34, 3. Jan. 2011 (CET)
Heute hat es noch nicht geklappt. Liegt es vielleicht an der crontab? Andim 10:29, 4. Jan. 2011 (CET)
Ich schau mir das so schnell wie möglich an. -- sk 11:58, 4. Jan. 2011 (CET)
Durch die Umstellung von Nightshade auf Solaris, wurden die Cronjobs ausgesetzt. Ich musst was manuell an das neue System anpassen, aber es scheint erstmal wieder zu laufen. Ich hoffe morgen läuft es wieder normal. -- sk 21:33, 4. Jan. 2011 (CET)
Dieser Abschnitt kann archiviert werden. sk 21:45, 11. Jan. 2011 (CET)

Neuer Dump!!!

Es gibt einen neuen Dump [1], Andim 13:51, 12. Jan. 2011 (CET)

Wunderbar, werde ihn heute Abend auf dem Toolserver runterladen und morgen scannen, wenn es zeitlich klappt. -- sk 17:13, 12. Jan. 2011 (CET)
Dumpscan ist gestartet. -- sk 22:51, 12. Jan. 2011 (CET)
...mit fürchterlich vielen neuen Fehlern. --Pelz 01:18, 13. Jan. 2011 (CET)

Fehlermeldung max_user_connections

Ich bekomme jetzt immer die Fehlermeldung DBI connect('u_sk_pd_p:host=sql','sk',...) failed: User 'sk' has exceeded the 'max_user_connections' resource (current value: 15) at ./pd.cgi line 28. Stefan, kannst du nicht irgendwo fragen, damit der Wert auf 25 oder wenigstens 20 erhöht wird. --Ephraim33 10:45, 13. Jan. 2011 (CET)

Siehe #Alte/neue Fehlermeldung. Problem ist, dass Checkwiki auch noch umgestellt werden müsste. Merlissimo 11:38, 13. Jan. 2011 (CET)

begraben im Sterbeort

In der Rubrik Geburts- oder Sterbeort fehlt im Text (ID88) ist mir aufgefallen, das es "begraben:" im Sterbeort steht. Laut WP:PD ist es nur für das Datum vorgesehen. Wie könnte man das handhaben? Gleiches auch für "zwischen". Danke. Der Umherirrende 21:40, 4. Jan. 2011 (CET)

Eigentlich müssten wir das Feld dann leer lassen. Bessere Vorschläge? -- sk 20:03, 5. Jan. 2011 (CET)
Solange es sich nicht um Könige etc. handelt, die für ihr Begräbnis durch ganz Europa transportiert werden, bietet der Begräbnisort bei unbekanntem Sterbeort in meinen Augen genausoviel Information, wie das Begräbnisdatum bei unbekanntem Todesdatum bietet. --Schnark 10:04, 7. Jan. 2011 (CET)
Sehe ich genauso, also analog zu Tauf- bzw. Begräbnisdatum. Andim 23:07, 13. Jan. 2011 (CET)
Ich habe WP:PD angepasst. Jetzt müsste Stefan nur sein Skript anpassen (Sollte auch ohne Doppelpunkt angegeben werden). Der Umherirrende 21:43, 16. Jan. 2011 (CET)
Ich hab jetzt in ID88 'begraben' und 'getauft' als Ausnahme neben 'bei' und 'unsicher:' eingebaut. Bei den anderen Fehlerkategorien müssen wir mal schauen wo das noch mit auftaucht und ich das im Skript anpassen muss. -- sk 21:40, 21. Jan. 2011 (CET)

ID 170

M.E. hat Wilhelm (Braunschweig) dort nichts zu suchen. Gruss --Pelz 18:16, 12. Jan. 2011 (CET)

 Ok, als Ausnahme eingebaut. -- sk 21:36, 21. Jan. 2011 (CET)

ID 87

Bitte mal Paul Ikier als Ausnahme hinzufügen. Danke. --Pelz 18:19, 12. Jan. 2011 (CET)

Eingebaut. -- sk 21:34, 21. Jan. 2011 (CET)

Nationalität Fidschi / Hongkong

Hier Portal:Badminton/Mitarbeit listet der Bot in der Personendatenwartung:
Karyn Whiteside (Kurzbeschreibung ohne Nationalität) - Ng Wei (Kategorie mit Nationalität fehlt) - Yip Pui Yin (Kategorie mit Nationalität fehlt). Die :Nationalitäten sind aber alle da. […] --Florentyna 08:31, 12. Jan. 2011 (CET)

übertragen von meiner Disk (BD:Merlissimo#Neue Funktionen)

Zumindest der erste Fall mit Fidschi-Inseln sollte imo bei ID 213 berücksichtigt werden. Bei den beiden Hongkong-Fällen müsstest die Experten mal schauen, ob man Chinese ergänzen sollte. Eigentlich ist es Unterkat von nach Staatsangehörigkeit. Merlissimo 22:40, 12. Jan. 2011 (CET)
Siehe unten. Ist eingebaut und erledigt. -- sk 21:32, 21. Jan. 2011 (CET)

Überflüssige Fehlerkategorien

  • Fehler 226 kann abgeschafft werden. Er ist ein Spezialfall von Fehler 129.
  • Fehler 227 kann abgeschafft werden. Er ist ein Spezialfall von Fehler 130.
  • Fehler 137 und Fehler 194 hören sich auch ähnlich an. 194 liefert mehr Treffer also scheint er wohl der bessere zu sein, da alle Fehler von 137 auch bei 194 stehen.
  • Fehler 136 und Fehler 193 ebenso. Fehler 193 ist der allgemeinere, der erhalten werden sollte.
  • Fehler 138 zeigt komischerweise überhaupt nichts an, obwohl er sich von der Beschreibung genauso anhört wie Fehler 266. Fehler 138 kann also entfernt werden.
  • Fehler 74 kann abgeschafft werden. Er ist ein Spezialfall von Fehler 12.
  • Fehler 72 kann abgeschafft werden. Er ist ein Spezialfall von Fehler 175.
  • Fehler 24, 35, 60, 85, 112 können allesamt abgeschafft werden. Sie sind Spezialfälle von Fehler 14.
  • Fehler 135 ist auch überflüssig. Es ist nur eine Schnittmenge der beiden Fehlerkategorien 136 und 137. Sonst haben wir auch keine Fehlerschnittmengenkategorien. Und durch die (gar nicht mehr so) neue Oberfläche ist ja bei jedem Artikel vermerkt, ob es mehrere Fehler zu diesem Artikel gibt.

--Ephraim33 14:36, 15. Jan. 2011 (CET) und 14:06, 17. Jan. 2011 (CET)

Danke für die Ausführungen. Generell ist mir eine doppelte Anzeige lieber, als dass irgendwas vergessen wird. Meist habe ich unterschiedliche Wege begangen um per Skript die einzelnen Fehler zu finden, weshalb ich nicht sicher bin ob wir dann was vergessen/übersehen, wenn wir die Vorschläge rauswerfen. Man könnte aber über einen "komplett erledigt" Button nach denken. -- sk 21:32, 21. Jan. 2011 (CET)

Neue Vorschläge

120 Jahre eingebaut. -- sk 21:22, 26. Jan. 2011 (CET)
174 auch korrigiert. -- sk 21:25, 26. Jan. 2011 (CET)

Geburts- bzw. Sterbedatum am Beispiel Lew Genrichowitsch Schnirelman

Von meiner Disk kopiert: Merlissimo 11:53, 18. Jan. 2011 (CET)

Hallo,

Benutzer:MerlBot listet den Artikel Lew Genrichowitsch Schnirelman zum Beispiel auf Portal:Mathematik/Arbeitslisten. Scheintbar kommt der Bot nicht mit der Vorlage Vorlage:JULGREGDATUM zurecht. Vielleicht könntest du das noch einbauen? Viele Grüße und danke für den tollen Bot! --Christian1985 (Diskussion) 11:49, 18. Jan. 2011 (CET)

Ich denke das sollte eigentlich abgefangen werden. Ich schau mal woran das liegt. -- sk 16:25, 18. Jan. 2011 (CET)
Wieso? Die Fehlermeldung war doch völlig berechtigt, wenn das Datum nach dem julianischen Kalender statt nach dem gregorianischen eingetragen war. --Schnark 09:22, 19. Jan. 2011 (CET)
Achso, das war mir leider unklar! --Christian1985 (Diskussion) 10:27, 19. Jan. 2011 (CET)
Cool. So muss das sein. Software hilft dem Menschen bei der Fehlerentdeckung. Ich habs auch nach dem Hinweis von Merlissimo nicht gesehen. Erst als Schnark protestierte. :-) -- sk 17:52, 19. Jan. 2011 (CET)

Noch einmal Hongkong (und Fidschi)

Es wäre wirklich gut, wenn zeitnah Hongkong mit in die Liste der Chinesen aufgenommen würde. Im Portal:Badminton/Mitarbeit kommen alle Personen aus Hongkong als Fehler (ohne Nationalität). Vielleicht gleich noch Macao und Macau mit in die Liste (wenn nicht schon drin) aufnehmen. Mit den Fidschi-Inseln gibt es nach wie vor Probleme bei Karyn Whiteside. --Florentyna 10:17, 20. Jan. 2011 (CET)

In Arbeit. -- sk 12:13, 20. Jan. 2011 (CET)
Besten Dank. --Florentyna 09:19, 21. Jan. 2011 (CET)
Hab die Chinesen um Hongkong, Macao und Macau erweitert. Bei Karyn Whiteside musste nur in der Kurzbeschreibung "fidschianische Badmintonspielerin" rein. -- sk 21:15, 21. Jan. 2011 (CET)

ID 263 und 264

Bitte Eucheir (Maler) als Ausnahme in beiden IDs hinzufügen. Gruß -- HS13 17:20, 23. Jan. 2011 (CET)

Nicht einfach einzubauen. Da muss ich nochmal nachdenken. -- sk 21:28, 26. Jan. 2011 (CET)

Julius Hirschwald

Taucht bei ID 88 Geburts- oder Sterbeort fehlt im Text auf: [2]. Vermutlich wegen dem zwischen. Ausnahme, Skriptkorrektur, Umschreiben? Könnt ihr mal bitte schauen? Merlissimo 13:04, 24. Jan. 2011 (CET)

P.S: Ich habe gerade den Abschnitt auf der alten Seite im WD-NS angelegt, weil der Bug-Link auf der Toolserverseite unten noch direkt dorthin führt. In pd3 hatte ich es schon korrigiert, aber es sollte auch noch in der aktuellen live-Version korrigiert werden. Merlissimo 13:11, 24. Jan. 2011 (CET)
'zwischen' sollte als Ausnahme hinzugefügt werden. Es betrifft einige Artikel und resultiert meist aus Reisen der Person, wo nur der Anfangs- und Zielort bekannt ist und eine genaue Einschränkung auf den dazwischen liegenden Sterbeort nicht möglich scheint. Gruß --HS13 18:07, 26. Jan. 2011 (CET)
 Ok, hab 'zwischen' als Ausnahme aufgenommen. -- sk 21:13, 26. Jan. 2011 (CET)

Geburtsdatum im Artikel fehlt in Personendaten

Ein relativ häufiger Fall: jemand ergänzt das Geburtsdatum im Artikeltext, vergisst aber „natürlich“ auch die PD und Kategorie zu ändern. Eine Liste dieser Artikel wäre hilfreich beim Verkleinern von Kategorien wie Geboren im 20. Jahrhundert. Gruß --Friedrichheinz 09:45, 1. Jan. 2011 (CET)

Eigentlich müsste man dazu nur den Vorschlag 139 etwas ausbauen. Das heißt wenn im Artikel "GEBURTSDATUM=20. Jahrhundert" steht wird das auch nochmal im Text geprüft. -- sk 21:44, 4. Jan. 2011 (CET)

Hier ein Beispiel. Scheinen solche Artikel schon irgendwo auf? --Friedrichheinz 12:34, 8. Feb. 2011 (CET)

Thien Tran und ID 268

Er wird als deutsch-vietnamnesischer Schriftsteller beschrieben, was ich für richtig halte, da er ab dem dritten Lebensjahr bis zum Lebensende in Deutschland gelebt hat. Dies ist also sein kultureller Hintergrund. Er ist aber nur als Vietnamese kategorisiert, weil im Artikel nicht steht, ob er je die Deutsche Staatsbürgerschaft bekommen/beantragt hat. Was tun? Merlissimo 03:08, 4. Feb. 2011 (CET)

Ganz einfach. Die korrekte Kurzbeschreibung wäre "vietnamnesisch-deutscher Schriftsteller". Dann würde auch ID 268 nicht anspringen. -- sk 07:45, 4. Feb. 2011 (CET)

Vielleicht lag es auch einfach nur an der Rechtschreibung (vietnamNesischer). --Florentyna 09:25, 4. Feb. 2011 (CET)

Arno Arnold und ID 265

Sein Vorname ist auch Teil seines Nachnamens, was das Script fälschlicherweise als Fehler erkennt. Bitte Erkennung ändern oder als Ausnahme hinzufügen. Merlissimo 03:11, 4. Feb. 2011 (CET)

Hier muss ich mich nochmal hinsetzen und meine Hausaufgaben machen. :-) -- sk 07:47, 4. Feb. 2011 (CET)
Derzeit ist wohl kein einziger der Einträge in dieser Liste wirklich ein Fehler. Bei einigen, wie Jerome K. Jerome sind Vor- und Nachname tatsächlich identisch (da hilft nur Aufnahme in die Ausnahmeliste), bei allen (?) anderen ist der Vorname ein Teil des Nachnamens (Adam Adami etc.) --Asdert 13:16, 8. Feb. 2011 (CET)

Portal:Sport/Wartungslisten

Abschnitt Falsche Kategoriensortierung: Die scheinen mir alle richtig zu sein. Es betrifft immer Tänzer und Radsportler. Da könnte ein logisches Problem vorliegen (laut Merlissimo aber wohl eher ein Problem ein Problem mit Umlauten).

Generell Schwierigkeiten gibt es bei Personen mit Apostrophen und ähnlichen Zeichen - vielleicht könnte man das etwas unschärfer einstellen (Angelo d’Arrigo, Émilienne d’Alençon, Leroy D'sa). --Florentyna 09:23, 4. Feb. 2011 (CET)

Hinweis

Bitte bringt euch mal in diese Diskussion mit ein. Danke. -- sk 11:20, 11. Feb. 2011 (CET)

"Personendaten fehlen" und "Personendaten fehlen, aber Personenkategorien vorhanden"

Fehler 2 und 4 liefern keine Ergebnisse, obwohl ich das zumindest nach dem Einbauen des neuen Dumps erwartet hätte. Dabei gibt es viele Artikel, bei denen die Personendaten fehlen:

--Ephraim33 14:36, 15. Jan. 2011 (CET)

Fehlerkategorie 4 wäre wohl überflüssig, wenn man Fehlerkategorie 2 dahingehend ergänzt, dass auch Kategorie:Person nach Tätigkeit, Kategorie:Person nach Staatsangehörigkeit und Kategorie:Person nach Ethnie (und eventuell weitere, s. Disk. Fehler 269) auf Vorhandensein von Personendaten geprüft wird. --Friedrichheinz 12:32, 18. Jan. 2011 (CET)
In Mann,Frau,Intersexueller hatte ich {{Vorlagenverwendung notwendig}} gesetzt. Siehe Disk in der Vorlagenwerkstatt. Mein Bot meldet das in einer extra Teilliste die immer gut abgearbeitet wird. Deswegen dürfte ein neuer Dump hier nicht so viele Treffer liefern, wie früher - sofern zumindest eine dieser drei Kats vorhanden ist. Merlissimo 19:07, 18. Jan. 2011 (CET)
Für die obere Liste der Artikel mit fehlenden Personendaten habe ich die Kategorie:Person nach Geburtsjahrhundert und Kategorie:Person nach Todesjahrhundert verwendet. Meiner Meinung nach ist auch dort "Vorlagenverwendung notwendig". Wo ist den die besagte "extra Teilliste die immer gut abgearbeitet wird" zu finden. --Ephraim33 20:16, 18. Jan. 2011 (CET)
Das ist so eingestellt, dass es nur für diese Kats ohne Unterkats funktioniert. Die Liste ist Teil der Worklist-Botliste. Heute morgen fehlte 27 mal {{Personendaten}} und viermal {{Dokumentation/Dokuseite}}. Bei der Erstauflegung im Dezember waren es insgesamt 410 Fälle.
Jetzt eben hatte ich z.B. bei den Kärntenern einen Eintrag gesehen [3]. Meine Variante soll auch kein Ersatz für Nr. 2 sein, sondern ist nur eine Erklärung dafür, warum nicht so viele Treffer zu erwarten sind, wie vielleicht früher. Merlissimo 20:31, 18. Jan. 2011 (CET)
Ja das erklärt mir das plausibel. Ich hab mich auch schon gewundert. Ich war mir keiner Schuld bewusst, dass ich da was im Skript falsch geändert hätte. Da waren also andere Kräfte am Werk. Danke für die Erklärung. -- sk 17:54, 19. Jan. 2011 (CET)
Hallo Stephan, irgendetwas scheint mit Deinem Skript nicht in Ordnung zu sein. Das von Merlissimo angesprochene Skript funktoniert nur, wenn die Kategorie Mann, Frau oder Intersexueller im Artikel vorhanden sind. Fehlt diese Kategorie, dann müßte eigentlich Dein Skript greifen. Tut es aber nicht! Heute bekam ich von einem Benutzer eine Anfrage auf meine Disk, ob ich die noch fehlenden PD-Daten bei Andrew Sherratt und Sergei Alexandrowitsch Tokarew ergänzen könnte. Bei beiden Personen fehlten die Kategorie:Mann. Ich fürchte doch, dass in Deinem Skript irgendein "Fehlerchen" steckt. Beste Grüße Silke Ewering 16:07, 20. Feb. 2011 (CET)

Aber zumindest Fehler 4 sollte um Kategorie:Person nach Geburtsjahrhundert und Kategorie:Person nach Todesjahrhundert ergänzt werden. Es gibt wieder einige die darunter fielen:

Außerdem wundert es mich, dass Fehler 4 gar keine Ergebnisse liefert, früher waren da immer etwa 375 Treffer. Stefan, kannst du dir Fehler 4 mal genauer anschauen, warum der keine Treffer mehr auflistet? Irgendetwas scheint da nicht mehr so zu funktionieren wie früher. --Ephraim33 10:31, 10. Mär. 2011 (CET)

Bitte erinnert mich nochmal in zwei Wochen, dann hab ich dafür wieder Zeit. Danke für euer Verständnis. -- sk 13:58, 11. Mär. 2011 (CET)
ok --Ephraim33 10:15, 12. Mär. 2011 (CET)

Neue Liste zum Abarbeiten, bis der Fehler wieder funktioniert: --Schnark 10:57, 11. Mär. 2011 (CET)

Fehler, die Groß-/Kleinschreibung im Sortierschlüssel betreffen

… können ab sofort deaktiviert werden, da seit dem 8. März alles automatisch in Großbuchstaben umgewandelt wird. Betrifft natürlich auch das Syntax-Korrektur-Projekt. --Schnark 09:54, 9. Mär. 2011 (CET)

Was ist eigentlich mit Umlauten und ß? Kann man die jetzt auch im Sortierschlüssel verwenden oder muss man die wie bisher in "normale" Buchstaben umwandeln? --Ephraim33 14:54, 9. Mär. 2011 (CET)

Kurze Antwort: nein. Lange Antwort: Im Moment noch nicht. Prinzipiell gäbe es die Möglichkeit, en:Unicode collation algorithm zu aktivieren, nur sind dazu auf den Servern nicht die notwendigen Erweiterungen installiert, außerdem würde ohnehin die Standard-Einstellung verwendet (was das für genaue Auswirkungen hat, weiß ich nicht, ich würde zwar von mir behaupten, dass ich technische Dokumentationen durchaus verstehen kann, aber in diesem Fall verstehe ich nicht einmal ansatzweise, was passiert). Das wird sich also noch etwas hinziehen, aber es ist wohl prinzipiell damit zu rechnen, dass wir irgendwann auch Umlaute und andere Sonderzeichen im Sortierschlüssel verwenden können, und diese so sortiert werden, wie sie sollen. --Schnark 09:12, 10. Mär. 2011 (CET)

Neuer Dump

Es gibt nach langer Zeit mal wieder einen neuen Dump: [4]. Andim 08:54, 24. Mär. 2011 (CET)

Scan läuft. -- sk 22:02, 24. Mär. 2011 (CET)
...ach darum werde ich behindert... --Pelz 23:22, 24. Mär. 2011 (CET)

Fehlerzähler

Kurzbeschreibung leer wäre hier wohl Fehler 21 gewesen, aber der fehlte (entgegen meiner Vermutung...). --217.227.102.89 19:08, 25. Mär. 2011 (CET)

Da waren die Personendaten so durcheinander, dass ja selbst ich als menschlicher Bearbeiter die leere Kurzbeschreibung übersehen habe. Welche Fehler genau zu diesem Zeitpunkt für den Artikel gefunden wurden, lässt sich ohnehin nicht mehr nachvollziehen, aber ich bin mir ziemlich sicher, dass Nr. 21 im Allgemeinen so funktioniert, wie er sollte. --Schnark 09:22, 26. Mär. 2011 (CET)
Nr. 21 bezog sich nicht auf eine der hier verwendeten Fehlerkennungen, sondern auf die Anzahl der Fehler im Artikel, 20 wurden in der Statistik gezählt, eben der 21. fehlte. Hinweis deswegen, falls da jemand möglicherweise eine Tabelle zu kurz definiert haben könnte (nach dem Motto: 20 Fehler werden wohl erstmal reichen). Die Anzahl an sich interessiert mich eigentlich wenig, die Beschreibungen sind für mich bestenfalls ein Hinweis. Fehler beseitigen und den Artikel überarbeite ich i.d.R. zu Fuß, Scripte sind mir etwas suspekt, die machen leider nicht immer das was sie sollen und was gut ist. U.a. können die nicht lesen und verstehen (schon gar keine Quellen :-)), ein in meinen Augen fataler Mangel. Auf die KI werden wir wohl noch etwas warten müssen. :-)), --217.227.89.206 22:29, 26. Mär. 2011 (CET)

Ausnahmen

Viele Grüße --Schnark 11:34, 31. Mär. 2011 (CEST)

 Ok, alles eingebaut. -- sk 20:32, 26. Apr. 2011 (CEST)

ID 128 neue Kategorie Kategorie:Geschlecht unbekannt

Hallo SK, die Kategorie:Person nach Geschlecht ist durch eine 4. Kategorie mit dem Namen Kategorie:Geschlecht unbekannt erweitert worden. Dort sollen alle Biographien, die nicht eindeutig einem Mann, einer Frau oder einem Intersexuellen zugeordnet werden können eingetragen werden. Wäre schön, wenn Du Dein Skript entsprechend korrigieren könntest. Viele Grüße --Silke Ewering 12:53, 3. Apr. 2011 (CEST) PS: Die Diskussion darüber hat hier stattgefunden.

Ich bin gerade beruflich stark eingespannt. Komme frühestens in 14 Tagen zu einer Erweiterung des Skriptes. Danke für die Geduld.-- sk 07:58, 4. Apr. 2011 (CEST)
 Ok, eingebaut. -- sk 20:39, 26. Apr. 2011 (CEST)
P.S. Ich hab die Kategorie überall dort mit eingebaut, wo ich schon die Kategorie:Intersexueller im Skript hatte. Ich hoffe damit alle Stellen geflickt zu haben. Bei Nebenwirkungen einfach hier melden. -- sk 10:05, 27. Apr. 2011 (CEST)

ID141 Text ohne Semikolon vor dem Sterbezeichen

Ein Vorschlag: Suche nach Nicht-(-Zeichen und †, damit sollten Artikel wie Coelestin I. nicht mehr gelistet werden. Andim 11:38, 13. Mai 2011 (CEST)

Hier würde es reichen, ungenaue Geburtsdaten zu ignorieren (vor, nach), da diese nicht sehr häufig in der Einleitung stehen und somit auch kein Semikolon vor dem Sterbezeichen steht. Der Umherirrende 12:20, 13. Mai 2011 (CEST)
Ich möchte immer möglichst alles mit einbauen. Wenn ich hier die ungenauen Geburtsdaten rauslasse, dann fällt mir das später irgendwo wieder auf die Füße. -- sk 14:28, 13. Mai 2011 (CEST)
Ich habe das Skript umgebaut und den Hinweistext wesentlich verbessert, so das man jetzt mit Copy-Paste die Daten übertragen kann. Ich denke dadurch lassen sich die Vorschläge besser abarbeiten. -- sk 19:17, 15. Mai 2011 (CEST)

Neuer Dump

siehe [5], Andim 11:11, 15. Mai 2011 (CEST)

Oh, fein, den werde ich gleich mal einbeziehen. -- sk 13:03, 15. Mai 2011 (CEST)
 Ok, Dump läuft gerade in die DB rein. -- sk 21:11, 15. Mai 2011 (CEST)

ID252 Name mit fehlenden Buchstaben

Falls im Lemma ein Punkt vorkommt, sollte auch in Name ein Punkt vorkommen. Dies ist mir öfters bei Amerikanern sufgefallen mit Lemma="Vorname Buchstabe. Nachname", aber NAME="Nachname, Vorname Buchstabe". Andim 11:38, 13. Mai 2011 (CEST)

Gute Idee, wird eingebaut. -- sk 14:27, 13. Mai 2011 (CEST)
Ein Beispiel [6], Andim 11:15, 20. Mai 2011 (CEST)

ID90 Sterbedatum fehlt, Geburtsjahr schon 120 Jahre her

Wie Ephraim33 oben schon anmerkte, kann man dies erweitern auf alle Personen, auch ohne konkretes Geburtsadatum. Da ja inzwischen jede Person mit Geburtseintrag eine Geboren-Kategorie hat, muss man nicht mehr das Geburtsdatum analysieren, sondern man kann die Geboren-Kategorie analysieren. Alle Personen die nicht die "Geboren im 21. Jahrhundert", "Geboren im 20. Jahrhundert"-, "Geboren im 19. oder 20. Jahrhundert"- oder "Geboren 1890"- bis "Geboren 2011"-Kategorie haben, sollen ein Sterbedatum haben. Andim 11:38, 13. Mai 2011 (CEST)

Diese Bedingung findest du auch unter Benutzer:MerlBot/Vermutlich verstorben (werden mit †>150 markiert, sind aber derzeit alle abgearbeitet). Dort werden aber nur Personen mit Interwikilinks untersucht. Die Grenze für die Erkennung ist aber derzeit Geboren 1868 oder früher, weil die älterse noch lebende Frau nach eigenen Angaben 1869 geboren wurde. Im Gegensatz zu anderen Wiki hat dewiki jedoch keinen Artikel über sie. Merlissimo 12:14, 13. Mai 2011 (CEST)

Da sollten aber schon einige mehr bei rauskommen: [längere inzwischen abgearbeitete Liste entfernt] --Ephraim33 13:53, 13. Mai 2011 (CEST) geändert 17:06, 28. Mai 2011 (CEST)

Wie gesagt: Haben alle keinen einzigen Interwikilink. Merlissimo 14:21, 13. Mai 2011 (CEST)
Nicht bei allen: Glykon von Athen, Aiantides von Lampsakos, Priester Arnolt, Lykophron von Pherai, Iunia Tertia stehen welche drin. Der Umherirrende 14:24, 13. Mai 2011 (CEST)
Naja, das Problem lässt sich fix einbauen. Werde ich gleich mal machen. -- sk 14:26, 13. Mai 2011 (CEST)
Ok, für das Script existieren Interwikis nur, wenn das Zielwiki unter meta:Death_anomalies_table#Search_Config steht. Ich könnte das aber auch mal bei mir einbauen. Die beiden Kategorienbäume habe ich eh schon im Speicher. Merlissimo 14:48, 13. Mai 2011 (CEST)
 Ok, erledigt. Wird demnächst in der Ausgabe erscheinen. -- sk 07:50, 15. Mai 2011 (CEST)
Der Fehler sollte bei Geboren im 20. oder 21. Jahrhundert nicht anschlagen, siehe [7], Andim 06:48, 26. Mai 2011 (CEST)

Unter 10000

Wir sind wieder unter 10000 Meldungen! Andim 18:38, 23. Apr. 2011 (CEST)

Vielen Dank für Eure Mühen. Mir schwebt für die Zukunft ein weiteres Tool vor, dass sprachübergreifend die Personendaten vergleichen soll, damit man Abweichungen in unterschiedlichen sprachausgaben der Wikipedia erkennen kann. Mal schauen wann ich dazu Zeit habe. -- sk 14:06, 26. Apr. 2011 (CEST)
Und schon unter 9000! Andim 22:22, 2. Mai 2011 (CEST)
Und nun schon unter 8000! Andim 22:26, 11. Mai 2011 (CEST)

Zählst du eigentlich die Fehler oder die Artikel mit Fehlern. Für das Diagramm oben nutze ich die Anzahl der Artikel mit Fehlern - die sind ja stets weniger als die Fehler insgesamt. --Ephraim33 10:54, 13. Mai 2011 (CEST) PS: Wir können uns eigentlich ein paar neue Fehlerkategorien ausdenken. Gibt es noch irgendwelche Unregelmäßigkeiten in den Personendaten, die bei der Abarbeitung der bisherigen Fehler entdeckt wurden? Ich hatte 2010 schon den Vorschlag Geboren im 19. Jahrhundert (oder früher) und nicht gestorben gemacht, der offenbar noch nicht eingebaut wurde, weil die Alternative immer noch Artikel liefert. Überhaupt ist schon einiges archiviert, was noch nicht erledigt ist. --Ephraim33 10:54, 13. Mai 2011 (CEST)

Ich zähle die Fehler. Ich werde gleich mal neue Abschnitte mit ein paar neuen Vorschlägen und Anmerkungen aufmachen. Andim 11:06, 13. Mai 2011 (CEST)
Hallo Ephraim33, kannst Du denn die noch nicht erledigten Punkte aus dem Archiv hervorholen und sie unten anhängen? Am besten bei einem Archivverhinderungsvermerk. --RonaldH 11:55, 13. Mai 2011 (CEST)
Alternativ auf Erledigt-Archivierung umsteigen, dann könnte die Seite aber sehr lang werden. Die ToDo-Liste wird leider auch nicht kürzer. Der Umherirrende 12:18, 13. Mai 2011 (CEST)
Oje, ich sehe schon, ihr wollt alle, dass ich mal wieder Überstunden mache und mich intensiv dem Dump und dem Skript zuwende, weil euch Zahlen kleiner 10000 langsam daran erinnern, dass wir schon viel erreicht haben und langsam die Arbeitslosigkeit, oder zumindestens nur noch minimale Neufehler auftauchen. :-) Ok, dann werde ich mich mal wieder ins Zeug legen. Aber nicht erschrecken bei großen Zahlen. :-) -- sk 13:47, 13. Mai 2011 (CEST)
Könntest du vielleicht eine neue Spalte in deine Tabelle pd_error_desc einbauen, womit du markierst, ob eine bestimmte Fehlererkennung "sicher" funktioniert?
Mein Bot würde dann nur diese an die Portale verteilen, da die meisten Portalmitarbeiter mit wenig PD-Erfahung bei Falschmeldungen auf große Probleme stoßen. Das würde auch meine Disk etwas entlasten :D.
Im Moment habe ich ID 265 explizit rausgenommen, weil es sich bei einem Großteil um Falschmeldungen handelt. Den könntest du dann bis zum Bugfix einfach als unsicher markieren. Wenn du neue Fehlererkunngsfälle schreibst, könntest du diese vorerst als unsicher markieren und nach einer Testphase von ein bis zwei Wochen, wenn die hier erfahrenden Mitarbeiter noch keinen grundsätzlichen Fehler entdeckt haben, quasi für meinen Bot "freigeben". Merlissimo 14:11, 13. Mai 2011 (CEST)
Stefan: Es ist eher so, das bei einer geringen Anzahl von Fehlern immer mehr falsch positiv überbleiben. Daher sollte man auch schauen, das die Fehlererkennung angepasst wird, damit solche Fehler nicht mehr auftauchen und die Teillisten auf 0 abarbeitbar sind. Spart auch wieder Arbeit, da die Artikel nicht von jedem Benutzer durchgeschaut werden, was falsch sein könnte. Der Umherirrende 14:23, 13. Mai 2011 (CEST)
 Ok, also ich werde in Zukunft alle Fehler so bearbeiten, dass sie auf Null heruntergebracht werden können. Da sparen wir uns zusätzliche neue Spalten. Ausnahmefälle, die das Skript anzeigt, bitte melden, dann schmeiß ich die raus. -- sk 20:25, 12. Jun. 2011 (CEST)

Aus der Kategorie: Text ohne Geburts- und Sterbedatum

Aus der Unzahl sei exemplarisch mal dieser herausgegriffen. Der hat natürlich kein Geburtsdatum, sondern ein ordnungsgemäß eingetragenes Taufdatum, wie das in den PD-Daten und Einleitung auch vorgesehen ist. Gleichermaßen finden sich da Artikel zu Personen versammelt, die vllt. nur ein Datum in der Kategorie begraben statt eines expliziten Sterbedatums aufweisen. Meine Vermutung geht dahin, das das Script die vorgesehenen Ausnahmen hier nicht akzeptiert. Es hilft aber nix, diese Artikel zu listen, denn es wird sich kaum jemand finden lassen, der dazu dann die scriptgewünschten Geburts- und Sterbedaten zuverlässig belegbar auftreiben kann. Man könnte natürlich die Zeichen einfach von getauft auf * abändern, aber das wäre m.E. eine höchst unerwünschte Scriptbeschwörung. Wenn man diese Fälle abhandeln will, dann sollte das in 'ner Extrarubrik Nur Tauf- oder Begräbnisdatum vorhanden passieren, die dann aber wohl eine ewige Liste bleiben dürfte.

In etwa die gleiche Kuhle dürften auch ein paar von den Artikeln rollen, bei denen aus weltanschaulichen Gründen manche Autoren drüber wachen, das sich da ja kein Kreuz oder Stern in die biographischen Angaben verirrt :-)).

Ergänzend hierzu sind mir auch Artikel in die Finger gefallen, die zwar ein Sterbedatum, aber keinen Sterbeort, wohl aber einen Begräbnisort (und vllt. sogar ein dazu passendes Datum) aufweisen. Wie dann zwei Daten in das PD-Feld reinbekommen?

Ebenfalls nicht berücksichtigt wird m.E. das Thema vermisst oder für Tot erklärt. Da gibt's mehrere Artikel, die diese Angaben aufweisen, aber bisher ist mir kein Verfahren bekannt, wie sowas innerhalb der PD abgehandelt werden soll. Wie sich das Script dazu verhält, steht noch einem weiteren Blatt mit Fragezeichen dahinter.

Auffällig häufig werden auch Artikel angemeckert, die vllt. am Artikelanfang eine Infobox (z.B. dieser), ein Bild mit Beschreibung oder Namen in andersprachiger Schreibweise (Hebräisch, Chinesisch) aufweisen. Verendet da der Suchalgorithmus vllt. nach einer bestimmten Zeichenzahl oder lässt sich durch Infoboxen, Bilder, Sonderzeichen so verwirren, das er nicht mehr bis zur ordentlich formatierten Einleitung durchdringt? Es ist halt lästig, wenn man den Artikel aufmacht und dann feststellt, das eigentlich fast alles in Ordnung ist. Oder ist's hier das m.E. schon mal angesprochene Semikolon innerhalb der Kursivformatierung (vor dem *), das verwirrt? Kann doch nicht sein, das man das einzeln auspacken muß, nur damit dem Script Genüge getan ist. Kann sich die Fälle mal jemand ansehen? --Pflastertreter 01:23, 13. Mai 2011 (CEST)

Zu den weltanschaulichen Gründen einiger Benutzer: Mit dem Meinungsbildern Wikipedia:Meinungsbilder/Verwendung des genealogischen Kreuzzeichens und Wikipedia:Meinungsbilder/Einleitung biographischer Artikel solltest du die besseren Argumente liefern können ;-) Der Umherirrende 10:44, 13. Mai 2011 (CEST)
Ein Hauptproblem liegt darin, dass ";''' *", ";'' *", ",''' *" und ",'' *" vom Skript nicht erlaubt wird. Man sollte dies aber zulassen, da die Satzzeichen normalerweise auch formatiert werden. Mit dieser Änderung werden die meisten Fehler verschwinden. Andim 11:17, 13. Mai 2011 (CEST)
Ok, da muss ich wohl das Skript noch erweitern. Meist programmiere ich am Anfang die Fehler sehr unscharf, da die Sonder- und Problemfälle später erst auftauchen. Ich versuche auch mal das mit dem "getauft" zu implementieren. -- sk 13:54, 13. Mai 2011 (CEST)
Gegen unscharf am Anfang ist nix einzuwenden, ärgerlich wirds halt nur, wenn ein sogenannter Fehler auftaucht, der eigentlich keiner ist. Daher bitte nicht nur getauft, sondern auch begraben (bisher offiziell zulässige Optionen) und möglichst auch vermisst oder für tot erklärt (Fälle dürfte es reichlich geben.., nur wie formuliert man's am besten? ) berücksichtigen. Zur Weltanschauung: MB's haben leider nur eine schwache Wirkung auf reflexartige Fingerbewegungen :-)). --Pflastertreter 12:56, 14. Mai 2011 (CEST)
Ich hab im Skript einiges geändert, aber die Satzzeichen ";''' *", ";'' *", ",''' *" und ",'' *" werden weiterhin nicht erlaubt. Ich möchte dort möglichst korrekt bleiben. Das heißt das schrägem Text; gehört das Semikolon oder Komma hinter die Formatierung und nicht dort mit rein, da es ja kein Namensbestandteil ist. Die Änderung werde ich zeitnah einspielen. -- sk 18:54, 15. Mai 2011 (CEST)
Sinnvoll wäre vllt. auch die Auswertung des Begriffes tätig in der Klammer, habe manchmal auch fl. dafür gefunden. Die sollten irgendwo separat abgelegt werden, dafür kann man sicher auch passende PD-Daten, Kats finden, braucht aber manchmal etwas Fingerspitzengefühl (ggue. dem Autor...:-)). Und de facto stehen in einem solchen Artikel keine auswertbaren Lebens- und Sterbedaten drin. --Pflastertreter 21:16, 17. Mai 2011 (CEST)
Die meisten Fehlermeldungen aus dieser Kategorie nerven..., z.B. diese. Das geforderte Geburtsdatum steht hübsch formatiert drin, nur wird's wohl nicht gefunden, weil möglicherweise nach '( *' gesucht wird. Besser wärs m.E., auch '( formatiertes irgendwas;</formatende> *' zuzulassen, damit dürften die meisten Fehler verschwinden. Ansonsten sind das vermutlich mal eben um die 400 Artikel, um (völlig überflüssigerweise) ein Semikolon von links nach rechts zu schieben. --Pflastertreter 05:03, 2. Jun. 2011 (CEST)
Das deutet doch viel eher darauf hin, dass man die Einleitung des Artikels überarbeiten sollte. Diese einseitige Fixierung auf die Personendaten halte ich für suboptimal. Wenn man ein Lemma schon formal in Ordnung bringen möchte, darf man ruhig auch mal den Bildschirm nach oben scrollen und dort gegebenenfalls Hand anlegen. Bei Javier Sotomayor habe ich das getan. Warum die Konsistenzprüfung aufgeweicht werden sollte, erschließt sich mir nicht. --RonaldH 23:58, 2. Jun. 2011 (CEST)
Ein unerwartet hilfreicher Kommentar :-)), wenn ich auch mit deinem Hinweis auf die Fixierung (manchmal) übereinstimme. Es geht mir nicht um das Aufweichen, sondern um eine bessere Erkennung, denn die scheint mir hier schon etwas sehr fuzzy-(un)-logisch zu sein. Mein Hinweis dürfte sicher nicht der erste zu diesem Thema gewesen sein, vllt. war das Beispiel unglücklich gewählt. Mir erschließt sich beispielsweise nicht, warum ein * nicht erkannt werden kann, wenn ein das vorhergehende Feld abschließendes ; innerhalb einer Formatierung steht. Die Formatierung halte ich für ein Feldtrennzeichen für unerheblich, aber vllt. habe ich auch nicht die Tragweite oder andere Verendungsmöglichkeiten des ; erkannt. Das ist nicht der einzige Fall, aufgefallen sind mir auch jede Menge Israelis, hebräische Schrift scheint das Script auch nicht so recht verknusen zu können, beispielsweise hier. Aber dafür fällt sicher auch jemandem 'ne hilfreiche Lösung ein? Mir geht's jedenfalls drum, nicht wegen dem Script Trennzeichen von Pontius nach Pilatus zu tragen, da gibt's sinnvolleres zu tun. --Pflastertreter 17:37, 5. Jun. 2011 (CEST)

Kategoriensortierung mit Grossbuchstaben nach Kleinbuchstaben

Id 223 kann wegfallen, da es keine Unterscheidung mehr durch MediaWiki gibt. Alle Sortierschlüssel (auch durch SORTIERUNG) werden als Großbuchstaben gesehen (API-Abfrage zeigt das). Danke. Der Umherirrende 17:34, 16. Mai 2011 (CEST)

"Kategoriensortierung mit Kleinbuchstaben am Wortanfang" (ID 224) auch. Der Umherirrende 17:36, 16. Mai 2011 (CEST)
Gut zu wissen. Danke. -- sk 20:03, 16. Mai 2011 (CEST)
 Ok, erledigt. ID 223 wurde durch einen neuen Fehler im Skript ersetzt. -- sk 11:57, 13. Jun. 2011 (CEST)

Personendaten fehlen, aber Personenkategorien vorhanden

1) Da gibts jede Menge Einträge mit einer Kategorie Teilnehmer bei den Olympische ...spielen... zu bearbeiten. Das ist nur leider nicht die Personenkategorie, sondern es sind Kopflisten unter Liste olympische Spiele. Die Personenkategorie ist unter den Teilnehmern bei den ...spielen... eine Etage tiefer als Olympiateilnehmer (Land) zu finden. Das dürfte einige der 94? Fehler wohl erledigen.

2) Gleichermaßen hat's da viele Definitionseinträge erwischt, die gewöhnlicherweise auch in Kategorien zu finden sind, beispielsweise Suffragan oder Kapitularvikar. Die kann man möglicherweise daran erkennen, das sie ein ! oder gelegentlich auch ein Leerzeichen an erster Stelle im Sortierschlüssel der Kategorie eingetragen haben. P1) sollte einfach sein, P2) könnte man so vielleicht versuchen zu erkennen und separat zur Prüfung ausgeben. Lösungsmöglichkeit wäre manchmal, eine schriftliche Kat-Definition zu verfassen und die dort einzubauen. Wenn's allerdings die einzige Kat eines Artikels ist, ist das schwierig :-)). --Pflastertreter 04:34, 17. Mai 2011 (CEST)

Ich hab am Wochenende tausende Kategorien in meine Kategorienliste der Personenkategorien eingebaut. Ich hab mir dafür vor einiger Zeit mal ein passendes Skript gebaut, dass so eine Art Bewertung vornimmt. Da sind mir diese Kategorien durch geschlüpft. Werde das gleich wieder korrigieren. -- sk 16:09, 17. Mai 2011 (CEST)
Tausende? Automatisch bewerten? :-)), für zu Fuß hätte ich noch die Anmerkung Pantomime zu bieten (für die Darstellungsformen) und Pantomime (Darsteller) für diejenigen, die es ausführen. Good luck, --Pflastertreter 20:41, 17. Mai 2011 (CEST)
Naja, mein Skript schaut sich alle Kategorien bei Personen an und vergibt dann Punkte. Wenn eine Kategorie als zum Beispiel "loge" als Endung hat wie bei "Psychologe" oder "Zoologe", dann gibt es 2 Pluspunkte. Bei manchen Kategorien kommt da eine Menge zusammen. Gestern hab ich dann diese Bewertung durchgesehen und kopiert. Dabei sind mir die oben genannten Kategorien bei ca. 1500 neuen Personenkategorien durch die Lappen gegangen. -- sk 22:28, 17. Mai 2011 (CEST)

Hab jetzt folgende Kategorien wieder aus der Liste rausgenommen:

  • Person im Tanach
  • Teilnehmer bei den Olympischen Sommerspielen
  • Christlicher Geistlicher
  • Römisch-katholischer Geistlicher
  • Pantomime
  • Sechzehnkönigreiche
  • Person im Neuen Testament
  • Person des Christentums
  • Neuoffenbarer
  • Musikpädagogik (DDR)

Sollte jetzt besser sein. --sk 22:56, 17. Mai 2011 (CEST)

Stimmt, ist es. Bitte folgende Kats auch aussortieren:
  • Bundesministerium der Verteidigung, die beiden letzten Personenbewohner sind aus der Sach- in eine Personenkategorie (Person (Bundesministerium der Verteidigung) umgezogen worden.
  • Duke Ellington, ist eine Kategorie zu einer Person, enthält aber außer drei oder vier anderweitig bereits verdrahteten Musikern nur deren Produktionen. Kann sich natürlich in Zukunft leicht ändern, aber derzeit gibt's da etwa 75% falsche Fehler.
--217.227.90.194 20:03, 10. Jun. 2011 (CEST)
Noch so ein Exemplar:
  • Kreator, Musikgruppe als Thema, zu drei von elf bisherigen/aktuellen Mitspielern gibt's ordentliche Artikel, der Rest sind deren Werke,,,, gemeinsames Kennzeichen wie bei Duke Ellington: Die bemeckerten Artikel scheinen wohl alle auch im Kategoriebaum Album vertreten zu sein, was ich nicht für 'ne ausgemachte Personenkategorie halte. Vllt. wäre die Kat Album ein Kriterium, um für Artikel, die auch in Personenkats drinstecken, eine Fehlermeldung zu unterlassen. --Pflastertreter 23:53, 10. Jun. 2011 (CEST)
Orden und Ehrenzeichen sind zwar gewöhnlicherweise Personen zugeordnet, hier jedoch auch einigen geographischen Objekten, die auch als solche kategorisiert sind, i.e. der Stadt Inebolu und der Stadt und der Provinz Kahramanmaras. --Pflastertreter 20:34, 12. Jun. 2011 (CEST)

Abweichung von Titel und Name

Wir haben im Moment die Fehler 259, 25, 202, 252 um Unterschiede zwischen Titel und Name zu erkennen. Ich schlage zwei neue Fehler vor: Jedes Wort aus dem Titel (vor Klammer) soll in Name enthalten sein und jedes Wort aus Name soll im Titel enthalten sein. Andim 18:06, 25. Mai 2011 (CEST). Auch Fehler 23 gehört mit dazu. Andim 06:46, 26. Mai 2011 (CEST)

Genau das macht doch 259 oder meinst du was anderes? -- 212.111.241.81 10:14, 8. Jun. 2011 (CEST)
Ich hätte gerne auch die andere Richtung. Andim 13:51, 8. Jun. 2011 (CEST)
 Ok, ist eingebaut. Hab die 223 (ehemals Kategorienfehler) nun mit dem Fehler im Skript besetzt. -- sk 19:58, 12. Jun. 2011 (CEST)

Kurzbeschreibung ohne Nationalität, aber mit Kategorie

Hier [[8]] stehen ein paar Einträge mit dem Hinweis auf eine vorhandene Nationalitätenkategorie "US-Amerikaner" obwohl es diese nicht gibt. Vielleicht sollte da mal nachgeschaut werden. --NeverDoING 08:17, 26. Mai 2011 (CEST)

Die Kategorie:US-Amerikaner ist vorhanden, aber auskommentiert. Für Mediawiki ist sie also nicht vorhanden, für das Skript schon. Andim 13:24, 26. Mai 2011 (CEST)
Scheint sich erledigt zu haben. -- sk 20:01, 12. Jun. 2011 (CEST)

Kategoriensortierung mit Grossbuchstaben nach Kleinbuchstaben (223)

Fehler 223 kann gestrichen werden, wie Schnark bereits am 9. März bemerkte (inzwischen archiviert). --Ephraim33 17:06, 28. Mai 2011 (CEST)

 Ok, ich hab die ID 223 mit einem neuen Fehler im Skript versehen. -- sk 19:57, 12. Jun. 2011 (CEST)

neue Ausnahmen

--Ephraim33 17:06, 28. Mai 2011 (CEST)

 Ok, soeben eingebaut. -- sk 08:29, 12. Jun. 2011 (CEST)

Neuer Vorschlag bei ungenauen Jahresangaben

Wenn bei GEBURTSDATUM oder STERBEDATUM "um Jahr" steht, darf keine Jahreskategorie für das Geburtsjahr oder Sterbejahr verwendet werden, sondern die größere Jahrhundertkategorie (Beispiel). Bei "Um Datum" ist eine Jahreskategorie möglich, wenn sich das um nur auf den Tag bezieht. --Ephraim33 16:20, 15. Mai 2011 (CEST)

 Ok, eingebaut unter ID 271. Hab zwar noch keinen solchen Fall entdeckt, aber vielleicht gibts ja was im Dump. -- sk 20:13, 15. Mai 2011 (CEST)
Komisch, da müssten hunderte oder tausende Fälle sein. Nach Templatetiger wird "um" im Geburtsdatum 8213 Mal verwendet, bei 30 (nicht repräsentativen) Tests tritt der oben beschriebene Kategorisierungsfehler 10 Mal auf: Magnus Maximus, Hans Greiner IV., Lullus (Lul), John Hepburn, Erik VII. (Dänemark), Vaslav Nijinsky, Hugo der Große, Alexander IV. (Papst), John Eccles, Guy de Chauliac. Aber vielleicht musst du wirklich erst den neuen Dump auswerten, damit die neue Fehlerkategorie anspringt. --Ephraim33 20:46, 15. Mai 2011 (CEST)
Ich hab nur mit ca. 8000 Artikeln getestet und da war keiner dabei. Gerade läuft der neuste Dump rein. Wenn dort nix gefunden wird, dann muss ich mein Skript umschreiben. -- sk 21:12, 15. Mai 2011 (CEST)
Also scheinbar hab ich da Mist zusammen programmiert. Werde das korrigieren. -- sk 16:11, 17. Mai 2011 (CEST)
 Ok, ich hab mich da nochmal dran gesetzt und den Fehler im Skript überarbeitet. War etwas knifflig, aber jetzt funktioniert es. -- sk 11:55, 13. Jun. 2011 (CEST)
Kannst Du vielleicht den neuen Dump vom 1. Juni verwenden, um den neuen Fehler aufzuspüren? Viele Grüße, Andim 12:48, 13. Jun. 2011 (CEST)
 Ok, hab den neuen Dump-Scan gestartet. -- sk 08:09, 14. Jun. 2011 (CEST)

DISPLAYTITLE

Ein weiterer Vorschlag. Man sollte DISPLAYTITLE bzw. SEITENTITEL auslesen. Im Skript müsstest Du nur die Titelvariable, die durch den Seitennamen belegt wird, durch diesen Wert ersetzen, wenn dieser gesetzt ist. Dies sollte z.B. bei melody. helfen. Andim 22:40, 15. Jun. 2011 (CEST)

Ich werde das mit machen, aber ich lass mir dabei etwas Zeit. Im Augenblick arbeite ich intensiv daran, dass ich die Grundlage des Skriptes (wie auch Check Wikipedia) von einer prozeduralen Struktur auf eine objektorientierte Struktur umstelle. Ist mein erster Versuch in der OO-Welt. Vorteil daraus ist, dass ich auch parallel andere Artikel abarbeiten kann, um zum Beispiel im Personendatenumfeld Links auf Begriffsklärungsseiten finde bzw. für einen deutschsprachigen Artikel auch in anderen Sprachen nach passenden Personendaten suchen kann. Das mit den SEITENTITEL ist mir auch letztens aufgefallen. --sk 06:52, 16. Jun. 2011 (CEST)

Fehler 265

Wie schon von anderen erwähnt sollte hier nicht auf den gleichen Wortteil sondern auf das gleiche Wort untersucht werden. Zudem würde ich vorschlagen auch zu zählen, wie oft das Wort (oder der Wortteil) bereits im Titel erscheint. Ist die Anzahl im Alternativnamen gleich der des Titels (z.B. Samir Khalil Samir), kann der 'Fehler' aus der Liste raus. Dann sollte eigentlich nicht mehr viel übrig bleiben, was als Ausnahme hinzugefügt werden müsste. Ein weiterer Vorschlag wäre, es ähnlich zu ID248 zu handhaben und einen Klammerausdruck bei ALTERNATIVNAME zur Erkennung zu verwenden. Guck mal bitte was hier passen würde. Gruß --HS13 20:03, 17. Jun. 2011 (CEST)

Taufdaten

Das ~, das ich bereits mehrfach in der Einleitung als Notation für die Angabe eines Taufdatums (teilweise auch zusätzlich verlinkt auf Taufe) gefunden habe (und das Du dann durch * getauft ersetzt hast), scheint sich keiner einfach ausgedacht zu haben. Wenn ich hier hinein sehe, sieht das eher wie eine übliche Notation aus. In der Form würde ich das für die Angabe von Taufdaten durchaus für zulässig halten (also also ~ Datum oder ~ getauft Datum), die Bio's werden schließlich nicht für die Scriptkompatibilität geschrieben, sondern damit man die lesen kann, und das auch als nicht WP-Eingeweichter. Der Kasten für begraben ist mir allerdings bisher noch nicht untergekommen :-)). Wäre meinerseits eine Anregung für die Zukunft, dürfte möglicherweise Unmut zwischen Autoren und der Standardisierungstruppe vermeiden helfen. Oder erzeugt das anderweitige Inkompatibilitäten (ausser der Scriptanpassung), die ich nicht bedacht habe? --Pflastertreter 21:09, 14. Jun. 2011 (CEST)

Hallo Pflastertreter, ich hab am Wochenende gefühlte 20 Artikel mit "~" angepasst. dabei waren aber auch Einträge wie "( getauft ...)" oder "(Taufe ....)". Als Hobbygenealoge kenne ich das Zeichen, aber in der Wikipedia haben wir uns nun mal für (* ...; † ...) entscheiden, auch wenn die Person Moslem, Jude, Buddhist, im Kampf gefallen, außerehelich geboren, eingeäschert, begraben ist. Siehe auch Genealogische Zeichen. Ich finde deshalb "(* getauft ..." einen sehr guten Kompromiss, zwischen Einfachheit und Standardkonformität und trotzdem ohne Informationsverlust. Beim Tod schreiben wir ja auch manchmal nur "† begraben ... ". -- sk 18:48, 15. Jun. 2011 (CEST)
Haben uns entschieden? WP entscheidet per MB, das Taufe und Geburt dasselbe ist? Hargh, da rollen sich ja die Fußnägel auf im Sinne von Einheitsbrei. Mir geht's nicht um 'ne Glaubens- oder andere Richtung, aber sachlich verschiedene Dinge sollten m.E. auch durchaus mit unterschiedlichen Begriffen bezeichnet werden dürfen. --Pflastertreter 22:30, 18. Jun. 2011 (CEST)
Mit "haben wir uns entschieden" wollte ich aussagen, dass mir der genaue Zeitpunkt der Festlegung von (*...; †...) vor vielen Jahren nicht mehr bekannt ist. Sachlich möchte ich auf jeden Fall bleiben. Mir geht es dabei darum das im Artikelanfang nicht etwas steht, was sicherlich viele überhaupt nicht zu deuten wissen. "~" müsste man schon entweder zu Taufe oder Genealogisches Zeichen verlinken, damit es die Mehrheit der Leser verseht (IMHO). Nur zur Info wir reden hier über 432 Artikel von 378885 Personenartikel (0,11%) in denen beim Geburtsdatum "getauft ..." steht. Für mich steht das * und † für die Lebensdaten soweit diese bekannt sind. Im Idealfall Geburtstag und Sterbetag. Wenn die nicht vorhanden sind, dann eben für die ersten bekannten Lebensdaten wie zum Beispiel das Taufdatum oder die Beerdigung. Manchmal werden wir ja auch noch ungenauer mit "vor 623" oder "zwischen 300 und 350", aber für die grobe Einordnung reicht das aus. @Pflastertreter: Wie sieht denn deine Wunschformulierung für die Taufe in ersten Absatz der Biographien aus? -- sk 09:29, 19. Jun. 2011 (CEST)
Meines Erachtens sollten Geburts- und Taufdaten sauber voneinander getrennt bleiben und letzteres nicht ersteres im Notfall ersetzen. Sprich: wenn keine Geburts- und Todesdaten zu eruieren sind, dann geben wir das zu, indem wir entweder nichts dazu sagen oder aber so präzise wie möglich (z.B. Jahrhundertangabe) werden. Taufdaten kann man gern in der Einleitung oder im Artikellangtext als Zusatzinfo beisteuern. In den PD würde ich sie aus Konsistenzgründen komplett weglassen. --RonaldH 09:36, 19. Jun. 2011 (CEST)
@Stefan: Das das Zeichen ~ für's Taufdatum vielleicht nicht so bekannt ist wie das * für's Geburtsdatum ist mir durchaus bewusst, von daher stimme ich Dir zu, das man das verlinken sollte, ob auf Taufe oder Genealogisches Zeichen, sei erstmal dahingestellt (am besten vermutlich auf den nicht vorhandenen Schnipsel genealogisches Zeichen#Taufe .. :-)). Aus Gründen der Eindeutigkeit würde ich aber in der Einleitung darauf verzichten, die beiden Formulierungen * (für geboren) und getauft zu vermischen, denn das ist m.E. eine unzulässige Vereinfachung.
Idealerweise sollten in der Einleitung die Lebensdaten mit Geburts- und Sterbedatum zu finden sein, wenn eben nicht erreichbar, wäre ein belegtes Tauf- oder Begräbnisdatum für mich auch akzeptabel. Das man ein Tauf- oder Begräbnisdatum in den PD derzeit nicht in separate Felder einträgt, sondern ein Feld für zwei Verwendungen nutzt, ist ein anderes Thema. Dort ist das für mich insofern in Ordnung, als das die Personendaten ein Artikelteil sind, der von einem Nur-Leser i.d.R. nicht wahrgenommen wird und in erster Linie einer datenbankinternen Anbindung und Auswertung des Artikels dient. Es sollte aber in der Einleitung bei einem in geeigneter Form nachvollziehbaren (i.e. belegbaren) Datum bleiben.
Damit möchte ich darauf hinweisen, das wir hier oft über den unteren Bodensatz an Personenartikeln reden, zu Personen, zu denen entweder nix oder wenig bekannt ist bzw. der (Erst-)Autor nix oder wenig hinterlassen hat (z.B. Quellen u.a.). Zu den Personen ist oft nur ein einziges Datum im Lebenslauf fix bekannt, alles andere liegt im Dunkeln (der Geschichte, der Eitelkeit, whatever), wurde uns nicht verraten und kann bestenfalls aus dem Zusammenhang erschlossen werden. Ein Klassiker dazu wären beispielsweise die römischen Konsuln, Konsulatsjahr und vllt. noch ein paar Karrierestationen sind bekannt, aber wann die geboren wurden oder verstorben sind, kann man bestenfalls aus den (normalerweise) zu erwartenden Mindestaltern für bestimmte Ämter schließen. Diese Datenlage wird i.d.R. auch im Artikel, auch in der Einleitung schon, sehr deutlich (Konsul des ausgehenden 3. Jahrhunderts (o.ae.), möglicherweise Sohn von, Vater von...u.a.). Damit hat man jetzt bei vielen Personenartikeln eine zeitliche Einordnung in den Personendaten geschaffen, indem man diese Angaben mit den (üblichen) Zeiträumen (z.B. Konsul erst ab 40 o.ae., sicher nicht im Alter von 12 als Offizier 'ne Schlacht gewonnen) abzugleichen versucht hat. Daraus sind dann Angaben wie zwischen 320 und 360 geboren für die Personendaten abgeleitet worden, was für eine datenbankinterne Auswertung (via PD) durchaus brauchbar ist, im ungünstigeren Fall auch mal 'zwischen 2. und 6. Jahrhundert' geboren. So etwas deshalb aber ausdrücklich nochmal in die Einleitung zurück zu verpflanzen (nach dem Motto, was da steht, muss auch da stehen...), finde ich nicht eben ideal, weil es eine Genauigkeit suggeriert, die auf Grund der vorhandenen Quellen meist nicht gegeben ist. Wenn sich der Zeitraum angeben (und hoffentlich auch belegen) lässt, wäre das noch in Ordnung, aber ein oder mehrere Jahrhunderte (allein aus Konsistenzgründen) in die Einleitung (*; †) hineinzuschreiben, die im Einleitungssatz i.d.R. sowieso erwähnt sind, finde ich formal übertrieben. I.e., falls nur Jahrhunderte oder noch ungenauere Angaben zum Sterbe- oder Geburtsdatum in den PD-Daten vorliegen, würde ich i.d.R. auf eine explizite Erwähnung solcher Zahlen in der Einleitung verzichten. --Pflastertreter 00:40, 29. Jun. 2011 (CEST)

Fehler 141

Etwas kompliziert. Wenn das Geburtsdatum mit einer Referenz belegt ist, fordern die Richtlinien für Referenzen, dass die Referenz nach dem Semikolon steht (siehe Wikipedia:REF#Stellung_der_Fu.C3.9Fnote_im_Flie.C3.9Ftext). So etwas meldet das hiesige Skript aber als Fehler. Lässt sich das beheben? Beispiel für einen solchen Fall: William Martin Murphy. Den Hinweis verdanke ich Benutzer:AFBorchert. Gruß-- dä onkäl us kölle 21:18, 20. Jun. 2011 (CEST)

Da muss ich mal schauen wie ich das im Skript anpassen kann. Danke für den Hinweis. Alternativ wäre auch ein Vermerk am Ende der gesamten Lebensdatenangabe möglich, aber das ist sicherlich nicht unbedingt so gewollt. Ich schau mal. Erstmal danke für den Hinweis. -- sk 21:42, 20. Jun. 2011 (CEST)
Vielen Dank für Eure Bemühungen. In der Tat wäre ich dankbar, wenn ich wie jetzt mit zwei getrennten Referenzen arbeiten könnte, da die zu dem Geburtsdatum bzw. Geburtsort ausführlich auf die unterschiedlichen Angaben dazu eingeht. Lasst es mich bitte wissen, wann ich das wieder typografisch korrekt setzen kann, ohne dass es bei Euch in den automatisiert erstellten Bearbeitungslisten wieder auftaucht. Viele Grüße, AFBorchert 12:35, 26. Jun. 2011 (CEST)

Zu diesem Fehler ist vermutlich auch diese Diskussion interessant. Ein Konsens scheint zu sein, dass unscharfe Angaben nicht in den Einleitungstext sollen. Möglicherweise könnte der Bot das berücksichtigen. --NeverDoING 09:17, 28. Jun. 2011 (CEST)

Allerdings bin ich nicht sicher, ob das wirklich hilft. Siehe z. B. Johann Peter Hebel und [9]-- dä onkäl us kölle 22:27, 28. Jun. 2011 (CEST)

Problemfälle in der Wartung aus Portal:Sport/Wartungslisten

Zum ersten: Da fehlt im Skript das umwandeln von &#39; in ' (spezielle XML-Bedeutung) für das Lemma. Steht schon sehr lange auf der ToDo-Liste aber Stefan ist leider noch nicht dazu gekommen. Der Umherirrende 21:34, 12. Mai 2011 (CEST) Hier nicht richtig
Das glaube ich nicht. Diese Artikel weisen sowohl im Lemma als auch im Namen ein korrektes Apostroph aus. Das Problem liegt darin, dass das Lemma z.B. Angelo d’Arrigo heißt, der NAME aber Arrigo, Angelo d’. Es kommt ein zusätzliches Leerzeichen hinzu, außerdem ist der Lemma-Bestandteil d’Arrigo in NAME nicht zu finden. Andim 22:18, 12. Mai 2011 (CEST)
Stimmt. Es ist nicht das gleiche Apostroph ’'. Das Problem mit ' ist aber noch nicht gelöst. Betrifft id 252. Der Umherirrende 22:28, 12. Mai 2011 (CEST)
Achja, die lieben Sonderzeichen. Hier kämpft man wirklich immer wieder mit. Also eigentlich nimmt das Skript immer den Titel als Referenz heran. Das heißt, wenn das überall der selbe Apostroph/Hochkomma/etc. ist, müsste eigentlich auch das Skript zufrieden sein. @Der Umherirrende: Welches Problem mit ' meinst du, ist noch nicht gelöst. -- sk 13:52, 13. Mai 2011 (CEST)
Unter der ID 252 gibt es Einträge wo steht, das ein "&" ("&" - Chamene'i, Ali) im Namensfeld fehlt. Da der Titel aber ein solches Zeichen nicht enthält, kann das ja nicht sein. Da der Titel aber ' enthält, nehme ich an, dass das Skript &#39; sieht, da es im XML so stehen wird, und somit fehlt ihm das & im Namensfeld. Der Umherirrende 14:09, 13. Mai 2011 (CEST)
Da muss ich jetzt nur noch ein weg finden, dieses &#39; mit perl in das korrekte Unicode-Zeichen umzuwandeln. -- sk 16:37, 13. Mai 2011 (CEST)
Mit dem Wikitext solltest du das schon machen. Ich hatte mir irgendwann mal sub replace_special_letters aufgeschrieben (siehe ToDo-Liste), welches für den Titel fehlt. Der Umherirrende 16:44, 13. Mai 2011 (CEST)
 Ok, das hat mich heute fast einen ganzen Tag gekostet, aber dafür hab ich dann den Fehler entdeckt. Die API gibt aus irgendeinem Grund bei dem Hochkomma ein &#39; zurück. Wenn man weiß wo das herkommt, kann man es dann einfach abfangen. Dadurch sind die Fehleranzahl deutlich gesunken. -- sk 20:23, 12. Jun. 2011 (CEST)
Bei Fehler 252 gibt es aber immer noch viele Treffer. Andim 11:52, 13. Jun. 2011 (CEST)
Es gibt immer noch 3 Treffer: Al-Qasim al-Ma'mun, Moscheh Ya'akov Ben-Gavriêl, Mata'afa Mulinu'u II.. Andim 21:44, 22. Jun. 2011 (CEST)
Stefan: Das ist die Eigenart von XML, genauso wird für die Zeichen <>&" die Entitäten zurückgegeben. Das war immer das, was ich versucht habe, zu vermitteln. Dein Skript machst soetwas ja schon, wenn es aus dem Dump ließt, das ist auch XML. Der Umherirrende 21:56, 22. Jun. 2011 (CEST)
Jetzt mal wieder vorne: Der Fehler hat bei Louise N'Jie wieder zugeschlagen. Meine Beobachtung ist, dass der Fehler nicht anschlägt, wenn Du einen Dump scannst, aber anschlägt, wenn Du neue oder kürzlich geänderte Artikel scannst. Viele Grüße, Andim 09:17, 10. Jul. 2011 (CEST)

Fehler 268

Bei turkmenisch muss noch Turkmene ergänzt werden. Andim 14:32, 17. Jun. 2011 (CEST)

 Ok, eingebaut. -- sk 21:21, 13. Jul. 2011 (CEST)

ID 213, 251 und 253 (Kurzbeschreibung ohne Nationalität)

Hier sollte neben "US-Amerikanischer" und "Schweizer" auch eine Ausnahme für "Liechtensteiner" gemacht werden (wird aus demselben Grund groß geschrieben wie Schweizer). --Tschaensky 10:22, 27. Jun. 2011 (CEST)

 Ok, eingebaut. -- sk 22:33, 13. Jul. 2011 (CEST)

Fehler 271

Fehler 271 sollte auch anspringen, wenn unsicher: Jahr auftritt (bei unsicher: Datum besser nicht, weil sich das "unsicher" nur auf Tag und Monat beziehen könnte, das Jahr aber sicher ist). --Ephraim33 14:51, 2. Jul. 2011 (CEST)

Personen mit Kategorie Geboren unbekannt oder Gestorben unbekannt sollten herausgenommen werden. Andim 21:49, 12. Jul. 2011 (CEST)

Fehler 4: Personendaten fehlen, aber Personenkategorien vorhanden

Beim Fehler 4: Personendaten fehlen, aber Personenkategorien vorhanden kann die Datei input_category_de_person.txt wie folgte geändert werden:

Die Datei input_category_de_noperson.txt kann wie folgt angepasst werden:

Kategorie:Notname und Kategorie:Pseudonym steht übrigens auf beiden Listen. --Ephraim33 19:24, 12. Jul. 2011 (CEST)

Personendaten fehlen

CatScan liefert mal wieder eine relativ lange Liste mit Artikeln in Mann/Frau ohne Personendaten. Für Leute mit weniger als Geduld als ich sie über den Vormittag hinweg hatte: Hier ist die Liste zum Abarbeiten: --Schnark 11:29, 16. Jul. 2011 (CEST)

Uta-napišti, Iunia Tertia, Richard H. Baker, Jakob Meister, Raghu Vira, Hamdan bin Mohammed Al Maktoum, Meister Pancracius, Perseus (Persien), Carlton Michael Gary, Tyler, the Creator, The Good Natured, Johannes und Paulus, Ludwig von Hörselgau, Meister der Weingartner Liederhandschrift, Lyra Jakuleviciene, Thidericus, Bartholomäus von Salerno, Frank Winfield Anderson, Machir (Person), Marcelo Martins, Philipp Meyer (Theologe), Hans-Helmut Flohr, Walter Ködderitz, Joannes Manlius (Wanderbuchdrucker), Tony O’Malley, Fadrique Enríquez, Wilhelm Cuntz, Karl Freiherr von Stengel, Friedrich Kettner, Leopold Freiherr von Edelsheim-Gyulai, Nathan Brown, Marcel Pieofke, Johann Friedrich Künnecke, Barbi Twins, Nerthus von Norderney, Kasimiro, Michael Max, Melanie Gebhard, Khalid Adem, Der Düring, Hubert Laschitza, Karl Bollenrath, Hiltbolt von Schwangau, Carlo Cazals, Paulino Bernabe, Domhnall II., Earl of Mar, Vjekoslav Glavač, Arvydas Petras Žygas, Axel Otto Mörner, Friedrich Rose, Michael Corsten, Walter Schaefer, Niko Alm, Paulina vom Herzen Jesu im Todeskampf, Louis-Urbain-Aubert de Tourny, Nuno Krus Abecasis, Fritz Erler (Mediziner), Elías Mendes Trindade, Paul Ohler, Benjamin Mako Hill

Neuer Vorschlag

"ALTERNATIVNAMEN=" ist leer, aber im Einleitungssatz wird eine Sprachvorlage verwendet (zum Beispiel {{RuS|foo}} oder {{lang|ru|foo}}) oder dort ist ein Link auf eine Sprache (z. B. russisch). --Ephraim33 18:54, 18. Jul. 2011 (CEST)

Fehler 223

Fehler 223 hat sich bewährt. Dabei wird überprüft, ob alle Wörter aus NAME auch im Titel vorkommen. Jetzt wäre es schön auch den umgekehrten Fall zu haben, ob nämlich alle Wörter aus dem Titel vor der ersten Klammer auch in NAME vorkommen. Fehler 259 macht so etwas ähnliches, aber nicht konsequent. Dies sollte leicht zu programmieren sein, da der Code von 223 verwendet werden kann. Wir brauchen aber noch weitere Überprüfungen. Betrachten wir mal den Fall NAME="a ab" und TITEL="ab". Die NAMEnsbestandteile a und ab kommen in TITEL vor. Der TITEL ab kommt auch in NAME vor. Also schlagen beide Fehler nicht an. Man sollte die Wörter in TITEL und NAME zählen. Diese müssten gleich sein. Das ist aber immer noch nicht die ultimative Lösung, wie folgendes Beispiel zeigt: NAME="ab abc" und TITEL="a abc". Man müsste also überprüfen, ob jedes Wort in TITEL auch ein Wort in NAME ist und umgekehrt, also nicht nur auf Enthaltensein prüfen. Viele Grüße, Andim 13:41, 30. Jul. 2011 (CEST)

Fehlerliste enthält Fehler

Ich komme von der Seite: comments and bugs

Bei dem Artikel George St. Clair Joof kann keine Nationalität angegeben werden. Da der Staat Gambia noch nicht existierte. Ebenso verhält es sich mit dem Artikel Henry A. Madi, es nicht belegt ob er Brite, Gambier (zu seinem Tode) oder Libanese gewesen ist. Bitte Skript in soweit ändern, dass auch unbelegte Staatsbürgerschaft akzeptiert werden kann. --Atamari 15:47, 24. Aug. 2011 (CEST)

Die Person ist wieder eingetragen worden. --Atamari 15:20, 31. Aug. 2011 (CEST)

Dump vom 29. Juli 2011

Unter [10] wird gerade ein neuer Dump gebacken. Es wäre schön, wenn Du diesen einspielen könntest, da im Moment der Dump vom 1. oder 21. Juni verwendet wird. Vielen Dank, Andim 13:44, 30. Jul. 2011 (CEST)

Dump ist fertig! Andim 18:04, 30. Jul. 2011 (CEST)
Unter [11] wird gerade der nächste Dump erstellt. Andim 16:55, 13. Aug. 2011 (CEST)
Und fertig! Andim 11:46, 14. Aug. 2011 (CEST)
Aktuell ist [12]. Andim 07:55, 1. Sep. 2011 (CEST)
Wird gerade gescannt. -- sk 21:46, 7. Sep. 2011 (CEST)

Falsche Fehlermeldungen

Hallo Stefan, eine Reihe korrekter Angaben erscheinen z.Zt. als angeblich falsch:

Unter "Kategorie:Geboren im Jahrhundert fehlerhaft" werden aufgeführt, ebenso unter "Kategorie:Gestorben im Jahrhundert fehlerhaft":

Puabi – um 25. Jahrhundert v. Chr. vs. Kategorie:Geboren im 3. Jahrtausend v. Chr.
Dhu l-Kifl – vor 7. Jahrhundert vs. Kategorie:Geboren unbekannt
Abas (Schriftsteller) – vor 4. Jahrhundert vs. Kategorie:Geboren im 1. Jahrtausend v. Chr. oder 1. Jahrtausend
Herneith – um 30. Jahrhundert v. Chr. vs. Kategorie:Geboren im 4. oder 3. Jahrtausend v. Chr.
Kasa (Beamter) – um 29. Jahrhundert v. Chr. vs. Kategorie:Geboren im 3. Jahrtausend v. Chr.
Gemniemhat – um 20. Jahrhundert v. Chr. vs. Kategorie:Geboren im 3. oder 2. Jahrtausend v. Chr.
Maapermin – um 28. Jahrhundert v. Chr. vs. Kategorie:Geboren im 3. Jahrtausend v. Chr.
Wadjesen – um 29. Jahrhundert v. Chr. vs. Kategorie:Geboren im 3. Jahrtausend v. Chr.

Außer evtl. bei Abas sind alle Angaben korrekt. Dhu l-Kifl ist ein schwieriger Fall, wenn man die PD nicht ganz entfernen will, ist aber kaum etwas Vernünftigeres möglich. Wenn der Fehler nicht so schnell korrigierbar ist, sollten mindestens diese beiden Fehlerkategorien zeitweilig aus der Fehlerliste entfernt werden, um unsinnigen 'Korrekturen' vorzubeugen. --Griot 22:00, 1. Okt. 2011 (CEST)

 Ok, ist eingebaut. Die beiden Fehler (263, 264) konnten mit dem "um","vor" im Geburtsdatumsfeld nicht korrekt umgehen. Hab diese Fälle von der Prüfung ausgeschlossen. Danke für den Hinweis. -- sk 22:26, 1. Okt. 2011 (CEST)
Danke, Stefan, für die schnelle Reaktion – die aber leider noch nicht erfolgreich war… (Abas ist geändert und erscheint nicht mehr. Die anderen erscheinen weiter. Bei Dhu l-Kifl hilft wohl nur, ihn als Ausnahme zu behandeln.) Gruß, --Griot 14:09, 3. Okt. 2011 (CEST)

Neuer Dump

Nach der Umstellung auf Mediawiki 1.18 wurde die Dumperzeugung wiederaufgenommen. Unter [13] gibt es das neue Werk. Andim 22:16, 10. Okt. 2011 (CEST)

https

Nachdem sowohl der Toolserver als auch Wikipedia nun sowohl über http als auch https aufgerufen werden können, wäre es schön, wenn Links von https://toolserver.org/~sk/cgi-bin/pd/pd.cgi?view=only&id=208 auch wieder auf https://de.wikipedia.org/wiki/August_Guth führen würden. Dazu würde es reichen, die Wikipedia-Seiten protokoll-relativ zu verlinken, also als href //de.wikipedia.org/wiki/August_Guth anzugeben. --Schnark 11:37, 18. Okt. 2011 (CEST)

Eine "Protokoll-relative" (ich interpretiere das mal genauer als Schema-relative) Verlinkung ist bei html nicht möglich. Eine URL ohne Scheme (wie in deinem Beispiel) ist nicht erlaubt. Und bei relativen URLs gilt immer die gleiche authority (=Scheme, host, port, user).
Man könnte also die URL nur im Script nur fallweise "zusammenbauen" (ja nach Anfrageart). Dafür müsste aber das Script wissen, dass es per ssl angefragt wurde. Da der ssl-Zugriff über einen transparenten Proxy läuft, sehe ich keine Möglichkeit dies abzufragen. Merlissimo 13:58, 18. Okt. 2011 (CEST)
Die von Schnark vorgeschlagende Vorgehensweise entspricht aber genau der, die auch MediaWiki verfolgt. Siehe auch URL#Relative URL. Der Umherirrende 18:48, 18. Okt. 2011 (CEST)
Ja, wer nicht glaubt dass es funktioniert: //toolserver.org/~sk/cgi-bin/pd/pd.cgi?view=only&id=208 sollte auf //de.wikipedia.org/wiki/August_Guth verlinken, das entsprechende Protokoll wird vom Browser ergänzt. --Schnark 09:25, 19. Okt. 2011 (CEST)
Danke für den Hinweis. Da muss ich mit den CGI-Variablen noch das HTTPS abfragen und einbauen. Interessant, auf was man in der modernen Welt alles achten muss. -- sk 19:36, 26. Okt. 2011 (CEST)
 Ok, eingebaut. Ich hab bisher immer href="http://... geschrieben. Wurde geändert in href="//... Wusste nicht dass es so einfach ist. Werde das in anderen Skripten auch einbauen. -- sk 19:49, 26. Okt. 2011 (CEST)

Alternativnamen

Hier tauchen zwei neue Klammerbezeichnungen auf: Künstlername und Ordensname. Irgendeine Dis kann ich dazu nicht finden. Im Prinzip scheint mir das aber in Ordnung zu sein. Ggf. müssten aber die Scripte angepasst werden. --Pelz 22:26, 18. Okt. 2011 (CEST)

Im Augenblick wird der Klammerausdruck bei den Alternativnamen nur für "vollständiger Name" ID 256 und für "wirklicher Name" ID 255 überprüft. Hier könnte man generell weiter aufräumen. Bisher hab ich den Klammerausdruck aber als Freifeld angesehen. Dort kann man fast alles reinschreiben. -- sk 20:28, 26. Okt. 2011 (CEST)

ID 155 und 141

Die obigen Routinen liefern Fehlermeldungen, wenn beispielsweise vor dem Geburtsdatum ein kursiv gesetzter Name mit kursivem Semikolon steht. Diese Auszeichnung ist jedoch nach den Typografieregeln Wikipedia:Typografie#Auszeichnung korrekt. Die Fehlerroutine verlangt hingegen ein "gerades" Semikolon. Beispiel für eine darauf folgende "Korrektur": [14]. Der Hinweis stammt von Benutzer:Elisabeth59. Von diesen Meldungen scheinen ca. fünf am Tag aufzulaufen. Lässt sich das ändern? Gruß--dä onkäl us kölle 20:14, 9. Nov. 2011 (CET)

Hmm, also ich bin mit der Reglung nicht ganz glücklich, weil mir das genau anders logischer erscheint, als es die Typografiereglung sagt. Klar lässt sich das ändern. Werde ich mich wohl noch mal ran setzen. -- sk 16:22, 15. Nov. 2011 (CET)
Typographie ist wohl auch "eine Wissenschaft für sich" und offenbar nicht nur logisch. Danke!-- dä onkäl us kölle 18:43, 15. Nov. 2011 (CET)

Neuer Dump

Unter [15] gibt es einen neuen Dump. Es wäre schön, wenn Du ihn hier und bei CW einspielen könntest. Viele Grüße, Andim 07:41, 21. Nov. 2011 (CET)

 Ok, erledigt. -- sk 13:55, 28. Nov. 2011 (CET)

Fehlerliste enthält Fehler

Ich komme von der Seite: comments and bugs

Bei dem Artikel George St. Clair Joof kann keine Nationalität angegeben werden. Da der Staat Gambia noch nicht existierte. Ebenso verhält es sich mit dem Artikel Henry A. Madi, es nicht belegt ob er Brite, Gambier (zu seinem Tode) oder Libanese gewesen ist. Bitte Skript in soweit ändern, dass auch unbelegte Staatsbürgerschaft akzeptiert werden kann. --Atamari 15:47, 24. Aug. 2011 (CEST)

Die Person ist wieder eingetragen worden. --Atamari 15:20, 31. Aug. 2011 (CEST)
Was ist den nun mit Personen, bei denen eine Staatsbürgerschaft nicht belegt ist? --Atamari 16:47, 13. Okt. 2011 (CEST)

Ich komme von der Seite: http://de.wikipedia.org/wiki/1951 1951]

Hier findet sich unter den im Jahr 1951 Geborenen für den 22.Januar der Eintrag 22. Januar: Cajus Julius Caesar, deutscher Politiker

Ich denke mehr muss man dazu nicht schreiben, das ist ein Scherzeintrag. (nicht signierter Beitrag von Pievi6 (Diskussion | Beiträge) 10:18, 19. Okt. 2011 (CEST))

Schau Dir bitte erst einmal den Eintrag richtig an. Cajus Julius Caesar ist nicht gleich Gaius Iulius Caesar. Der Eintrag stimmt also.--NeverDoING 10:35, 19. Okt. 2011 (CEST)

@Atamari: Diese Vorschlag ist halt nur ein Vorschlag den das Skript stur vorschlägt. Solange keine Whitelist oder Blacklist eingebaut ist, werde ich da nix machen können, da man sonst nur mit einer Kategorie "Person ohne Nationalität" oder so was rausfiltern könnte. -- sk 14:19, 3. Jan. 2012 (CET)

Heute enthält die Liste Fehler die längst abgefrühstückt sind. Z.B. Alexander von Oheimb im Fehler 74 und viele andere mehr. Ist irgendwas schiefgelaufen oder bin ich blind? --Pelz (Diskussion) 22:34, 28. Aug. 2012 (CEST)

Nix blind, das sind alles alte Hüte--dä onkäl us kölle (Diskussion) 23:02, 28. Aug. 2012 (CEST)
Aber warum? Wo liegt denn da der Fehler und ist der morgen wieder weg? --Pelz (Diskussion) 23:50, 28. Aug. 2012 (CEST)
Jetzt ist er wieder weg. Andim (Diskussion) 08:20, 29. Aug. 2012 (CEST)
Danke --Pelz (Diskussion) 19:51, 30. Aug. 2012 (CEST)
Wäre eine Idee, eine (Wartungs-)Kategorie einzuführen wie Staatsangehörigkeit ungeklärt? Sommit gäbe es keine Fehlermeldung und man könnte gezielt nach Informationen suchen. --Atamari (Diskussion) 00:28, 6. Nov. 2012 (CET)

@Atamari:, @Onkelkoeln:: Hab jetzt die Whitelist in das Tool eingebaut. Dadurch sollte diese Diskussion eigentlich erledigt sein. Hab George St. Clair Joof und Henry A. Madi auf die Whitelist von ID 213 gesetzt. Kann jetzt jeder für alle anderen Artikel auch machen. -- sk (Diskussion) 21:13, 22. Feb. 2015 (CET)

Whitelist finde ich ne echte Verbesserung, danke!--dä onkäl us kölle (Diskussion) 21:30, 22. Feb. 2015 (CET)
Dieser Abschnitt kann archiviert werden. --sk (Diskussion) 13:56, 25. Feb. 2015 (CET)