Benutzer Diskussion:Wurgl/Fehler Infobox

aus Wikipedia, der freien Enzyklopädie
Letzter Kommentar: vor 6 Jahren von Wurgl in Abschnitt Infobox Inline-Speedskater
Zur Navigation springen Zur Suche springen

False Positives[Quelltext bearbeiten]

Da ich nun erneut mehrere False Positives gelöscht habe, wäre es sinnvoll eine Unterseite anzulegen wo die Artikel aufgelistet werden, und dem Bot diese als Ausnahmenliste vorzugeben. --Wikijunkie Disk. (+/-)

Mach mal ein paar einfach hier rein. Am Anfang waren so viele, dass ich den Wald vor lauter Bäumen nicht mehr gesehen hab. Ein paar Ausnahmeregeln hab ich ja schon ins Script eingebaut, aber es sind noch einige. Dann guck ich momentan nur, ob das Modul Wikidata eingebunden ist und wenn ja, nehme ich an dass die Geburtsdaten von dort kommen. Eine Ausnahme ist die Infobox_Fußballspieler, die hat das zwar eingebunden, holt sich aber anderes Zeugs raus. Ist halt alles "irgendwie" und anders, folglich viele Sonderfälle. Aber wie gemurmelt, papp ein paar hier rein und werde aus denen verallgemeinern und die filtern. --Wurgl (Diskussion) 13:38, 6. Nov. 2017 (CET)Beantworten
zwei aktuelle Beispiele: Dave Bautista (logischerweise braucht es keine 2 komplett ausgefüllten Boxen) und Julius Seyler (Angabe wie bei den PD vorgeschrieben macht die Box unnötig breit). --Wikijunkie Disk. (+/-) 17:34, 6. Nov. 2017 (CET)Beantworten

Schachspieler[Quelltext bearbeiten]

Was ist jetzt eigentlich mit den Schachspielern? 188.98.181.8 21:08, 6. Nov. 2017 (CET)Beantworten

Die Wiederbelebung von WikiHistory ist dazwischengekommen. Alles geht nicht auf einmal. --Wurgl (Diskussion) 23:01, 6. Nov. 2017 (CET)Beantworten

2. Infobox[Quelltext bearbeiten]

Hab das mal entführt:

Hierbei handelt es sich um eine 2. Infobox. Stellt sich die Frage, ob die auch noch einmal komplett ausgefüllt werden muss. Silke (Diskussion) 21:30, 26. Nov. 2017 (CET)Beantworten

Ich kann zwar erkennen, dass eine zweite Infobox ist, aber da ich (fast) nur Abfragen auf APPERs Datenbank zu Vorlagenfeldern mache, hab ich keine Chance zu erkennen ob das die erste oder die zweite ist.
Ich denke, ich werde hier eine Blacklist basteln. Sind ja so einige Fälle wo ich nicht so richtig weiß, wie ich das angehe. --Wurgl (Diskussion) 21:48, 26. Nov. 2017 (CET)Beantworten

Fußballspieler[Quelltext bearbeiten]

@Wurgl: ich habe einmal die Liste abgearbeitet und bei den Falsch-Positiven meinen Kommentar hinterlassen. Bei 2 Einträgen, die ich mit unsicher gekennzeichnet habe, fehlt mir einfach das Hintergrundwissen zu der Vorlage. Schade, dass von den Portalen da nicht mehr Hilfe kommt... Viele liebe Grüße --Silke (Diskussion) 21:06, 3. Dez. 2017 (CET)Beantworten

Sehr gut! Danke! Jetzt bist du Fußballexperte!!!!!! Dann guck ich die nächsten Tage mal drüber und bastel noch ein wenig an Wünschen ein. So eine IP am Schachportal will unbedingt was *seufz* --Wurgl (Diskussion) 21:21, 3. Dez. 2017 (CET)Beantworten
Du hast es selbst angeboten. 129.13.72.197 13:51, 4. Dez. 2017 (CET)Beantworten

Probleme bei den Infoboxen[Quelltext bearbeiten]

Ich hab einige Fälle von falsch benamsten Parametern die allerdings (noch) leer sind, ich liste hier die extremsten auf, einzelne falsche ignorier ich.

  • Infobox Behindertensportler
    11 mal sterbetag statt sterbedatum
  • Infobox Fußballspieler
    163 mal sterbetag statt sterbedatum
  • Infobox Schwimmer
    643 mal sterbetag statt sterbedatum
  • Infobox Taekwondoin
    263 mal sterbetag statt sterbedatum
  • Infobox Wasserspringer
    320 mal sterbetag statt sterbedatum

Das kann entweder ignoriert werden und beim Nachtragen der Daten darf sich dann der entsprechende User ärgern oder es ist eine Aufgabe für einen Bot. --Wurgl (Diskussion) 15:43, 14. Dez. 2017 (CET)Beantworten

Neue Liste nach Totalumbau des Scripts[Quelltext bearbeiten]

Ich hab das Script jetzt von der Logik auf den Kopf gestellt, es waren einfach zu viele Sonderfälle und diese Sonderfälle alle zu berücksichtigen kann ein Mensch nicht machen, ein Bot aber schon. Das Problem ist die konsequent durchgezogene Veruneinheitlichung der Infoboxen. Das Geburtsdatum steht im Parameter geburtstag, oder Geburtstag, GEBURTSTAG, Geburtsdatum, GBtag, Geboren am, Geboren, birthdate und auch birth_date. Das Sterbedatum ist nicht besser, das steht in sterbetag, sterbedatum, Sterbedatum, STERBEDATUM, Todesdatum, Todestag, todestag, Verstorben am, Verstorben, deathdate und death_date. So nebenbei finde ich die Kombination von "geburtstag" und "sterbedatum" als äußerst unglücklich. Aber es ist nunmal so wie es ist.

Jedenfalls hatte ich keinerlei Lust in über 50 verschiedenen Infoboxen herumzuwühlen und aus dem Source die Informationen zu ziehen (Auch die Doku mitsamt Kopiervorlage ist in mindestens zwei Fällen falsch: [1] und [2]), sucht der Bot erstmal alle Infobox-Vorlagen die gemeinsam mit der Vorlage Personendaten in Artikeln vorkommen, liest den Source der Vorlage und prüft Daumen mal Pi welcher der oben aufgeführten Parameter vorkommt und ordnet die dann zu. Ähnlich wird auch herausgefunden ob das Wikidata-Modul von der Vorlage verwendet wird und in dem Fall auch der Abgleich mit Wikidata vorgenommen (nur wenn Wikidata-Daten auch angezeigt werden). Als Nebeneffekt werden falsch benamste Parameter gefunden, soferne der falsche Name einer aus der Liste oben ist. Reine Tippfehler finde ich nicht.

Infobox Inline-Speedskater[Quelltext bearbeiten]

Das Skript erkennt den Parameter geburtstag in der Infobox nicht. Viele Grüße, Andim (Diskussion) 18:19, 26. Dez. 2017 (CET)Beantworten

Nee. Also beim ersten ist es so, dass da *zwei* Infoboxen sind. In der einen (Infobox Eisschnellläufer) steht ein Datum und in der zweiten (Infobox Inline-Speedskater) steht nix. Für den Fall: ==> Blacklist, dort ein Abschnitt Infobox Inline-Speedskater und dann den Kerl eintragen. Bei zwei weiteren ist das auch so, mehr hab ich nix geguckt. --Wurgl (Diskussion) 00:29, 27. Dez. 2017 (CET)Beantworten
Ist bei allen so, habe ich nun in die Blacklist eingetragen. Andim (Diskussion) 01:04, 27. Dez. 2017 (CET)Beantworten
Gibt ein paar solche. Ich werte das via Datenbank von APPER aus, ich lese nicht die ca. 80.000 Artikel. Und daher hab ich keine Chance, irgendwie festzustellen welches die obere Infobox ist, also die wo das Datum drinnen sein sollte. Ob das Dingens jetzt geburtstag oder birthday oder so heißt, stelle ich durch recht simple Textsuche in der Vorlage selbst fest. Solange die Infoboxen die bisher bekannten und verwendeten Parameternamen verwenden, erkenne ich das, auf diese Art erkenne ich auch die nicht gar so richtigen Namen der Parameter (ein paar solche hast du ja ausgebessert). --Wurgl (Diskussion) 01:12, 27. Dez. 2017 (CET)Beantworten