Hilfe Diskussion:Normdaten/Archiv/2020

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen

Ungültige VIAF-Kennungen in Artikeln

Kürzlich wurden auf Wikidata zahlreiche (über 4000 ?) mittlerweile ungültig gewordene (VIAF-Fehlermeldung: Das Cluster wurde entfernt und ist nicht mehr in VIAF enthalten) VIAF-IDs gelöscht, die meisten davon wurden aus der deutschsprachigen Wikipedia nach Wikidata importiert. Beispiele:

  • 1 x 500
  • 2 x 500
  • 3 x 500
  • 4 x 500
  • 5 x 500
  • 6 x 500
  • 7 x 500
  • 8 x 500

D.h. die VIAF-IDs wurden zwar in Wikidata gelöscht, bestehen aber unter Umständen weiterhin in den deutschsprachigen Artikeln (und könnten ggf. wieder in Wikidata re-importiert werden, solange diese nicht auch aus den deutschsprachigen Artikel entfernt wurden, die englischsprachige Wikipedia bezieht die Normdaten über en:Template:Authority control auch aus Wikidata)

Beispiele: Wolfgang Leidig, Jürgen Blätzinger, Lucia Jantos, Klaus Picard, Vassilis Photopoulos, Kurt Jaworski, Josef Viehhauser, uvam.

Siehe dazu auch:

Ich könnte unbekannte VIAFs in unseren Artikeln aufspüren und in Benutzer:Wurgl/Fehler_GND ausgeben. Abgleich erfolgt mit dem monatlichen VIAF-Dump. Die Einschränkung ist halt die Zeitverzögerung zwischen Erzeugung des Dumps und generieren der Liste, wenn in diesen ein bis zwei Tagen VIAFs angelegt und bei uns eingetragen wurden, dann sind die auf der Liste. Wenn das mal durch ist, dann kann ich auch einen Live-Check machen (nicht dass mich die wegen zu viel Zugriffen blockieren). Ich schau mal meinen Datensatz hier an … stay tuned --Wurgl (Diskussion) 17:37, 23. Jan. 2020 (CET)
Okay. Also ich kann mit meinen Daten nicht zwischen "gibbes nix mehr" und "Ist jetzt eine Weiterleitung" unterscheiden. 19020 Treffer hab ich … *seufz* --Wurgl (Diskussion) 17:45, 23. Jan. 2020 (CET)
Bei Wolfgang Leidig handelte sich um einen Tn, die VIAF nach und nach eliminiert. Dass das Cluster (VIAF:10512949) entfernt wurde, obwohl der Link zu Wikidata (Q1718929) weiterhin gültig ist, ist ärgerlich. Für den Politiker liegt jetzt der GND 1203344546 vor. Mal sehen, was VIAF daraus macht. Falls das alte Cluster nicht reaktiviert wird, wäre ich dafür, dass man die Nrn. per Botlauf aus Wikipedia entfernt. --Kolja21 (Diskussion) 18:24, 23. Jan. 2020 (CET)
Ich basteln mal ein Script, das diese 19.000 durchackert. Wenn ich so alle paar Sekunden bei der VIAF anfrage, dürften die keine Beeinträchtgung merken. Dauert dann halt einen Tag. Danach haben wir ein paar Gruppen:
* "Das Cluster wurde entfernt und ist nicht mehr in VIAF enthalten" (siehe VIAF:64956538)
* Eine Umleitung wurde eingerichtet
* VIAF existiert gar nicht
* ... irgendwelche unvorhersehbare Spezialfälle
Die Umleitung kann ein Bot durchackern. Bei den anderen würde ich erstmal die Datenmenge angucken. Eventuell Botlauf, aber jedenfalls irgendeine Liste um die manuell nachzubearbeiten. --Wurgl (Diskussion) 18:42, 23. Jan. 2020 (CET)
Kein Einwand gegen eine automatisierte Löschung der betroffenen VIAF-Cluster.
@Wurgl: Eventuell die entstehende Liste gegen viaf-20200106-persist-rdf.xml.gz prüfen? Alles, was keine gültige VIAF-Nummer ist UND auch keine Weiterleitung, müsste doch nach meinem Verständnis gelöscht (oder Nonsens) sein?
Präventiv könnte man sich überlegen, ob man nicht einen Abgleich der folgenden Art macht:
  • Zuerst alle (ehemaligen) VIAF-Cluster ermitteln, die nur einen Wikidata- und einen GND-Link enthalten.
  • Die so entstandene Liste mit einer Liste der Tn abgleichen.
  • Diese VIAF-Links in der Wikipedia generell löschen.
emu (Diskussion) 18:43, 23. Jan. 2020 (CET)
Okay, jetzt sind es 2553 Stück (Rohformat). --Wurgl (Diskussion) 20:20, 23. Jan. 2020 (CET)
Sieht beim Drüberschauen gut aus, wobei offenbar auch manche auferstanden von den Toten sind, etwa VIAF:5043157952118765600002 oder VIAF:8020157884839860620000. Liegt wohl am Lag zwischen Datensatz und heute.
PS: Je intensiver man sich mit VIAF beschäftigt, desto irrwitziger erscheint es, was dort passiert. Persistente, verlässliche Nummern sind das jedenfalls nicht … --emu (Diskussion) 20:59, 23. Jan. 2020 (CET)
Ja, das ist der Lag. Stand meines Datensatzes (hier auf meiner Kiste@Home) ist 8. Januar, ca. 20 Uhr. Die VIAF-Daten wurden am 6. Januar. Also 2 Tage Lag. Weniger geht kaum, weil die Files ja erzeugt werden müssen und wohl nicht sofort veröffentlicht werden. Außerdem guck ich nicht alle 10 Minuten nach :-)
Ich will aber nicht alle auf einen Rutsch rauswerfen, sonst läuft Benutzer:APPER/VIAF über. --Wurgl (Diskussion) 21:09, 23. Jan. 2020 (CET)
Die VIAF-IDs sind in der Tat nicht persistent. Bei dem Wirtschaftswissenschaftler Drew Fudenberg (Q1258707) wurden nach und nach alle korrekten Links gelöscht. Seit September 2016 findet sich unter "seiner" VIAF:59183378 die "First National Bank of Lynn‏". Die Datenbank ist strenggenommen keine Normdatei, sondern eher eine Suchmaschine wie Google. --Kolja21 (Diskussion) 21:43, 23. Jan. 2020 (CET)
Bei Personen-Datensätzen könnte man ja (wenn GND vorhanden ist) den Link https://viaf.org/viaf/sourceID/DNB%7C141497254 (Beispiel) einsetzen. Der ist immer aktuell … Bei den anderen wird es kompliziert. --Wurgl (Diskussion) 21:48, 23. Jan. 2020 (CET)
Ich hab ein paar per Hand abgearbeitet und werde folgendes machen: Alle Datensätze mit ungültiger VIAF, bei denen nur GNDName und VIAF belegt sind beackere ich per Bot. Sprich: Ich werfe dort die VIAF raus. Diejenigen, wo GND oder LCCN belegt sind, lass ich in Ruhe. Damit sollten diese Lag-Fälle aus der Bot-Liste rausfallen. --Wurgl (Diskussion) 09:22, 24. Jan. 2020 (CET)
Bot gestartet … 1917 Artikel werden jetzt mal entviafisiert, ich guck nachher was die anderen sind, eventuell noch ein weiterer Lauf. --Wurgl (Diskussion) 12:03, 24. Jan. 2020 (CET)
487 Stück sind jetzt noch. Das sind alle, die eine GND haben. Ich kann zwar per Bot die VIAF dort rauswerfen, aber danach dort per Hand die richtige VIAF einsetzen ist ein unnötiger Edit und das Wochenende ist ja schon da. --Wurgl (Diskussion) 17:59, 24. Jan. 2020 (CET)

@Wurgl, Emu, Kolja21: vielen Dank, dass ihr euch so rasch und kompetent dem Thema angenommen habt! --M2k~dewiki (Diskussion) 00:37, 24. Jan. 2020 (CET)

Ich bin durch. Es sollte jetzt keine falschen VIAFs mehr geben. Bei den händisch korrigierten waren durch etliche mit Kopierfehler (also die erste oder letzte Ziffer hat gefehlt) oder Abtippfehler (in der Mitte hat eine Ziffer gefehlt) dabei. Und seltsamerweise recht viele Werke und auch einige Geographika und Orte, also solche die eine andere Ursache als GNDName hatten. Und so an die 20 Lag-Fehler, also solche wo der Dump vom Monatsanfang doch etwas zu alt war.
Wie auch immer, in der nächsten (oder übernächsten) GND-Fehlerliste werde ich auch diese unbekannten VIAFs auflisten.
Letzter Punkt: Was mit den weiterleitenden VIAFs machen? Sie funktionieren ja, das spricht gegen Bot. Sie sind nicht die aktuellen IDs, das spricht für einen Botlauf. --Wurgl (Diskussion) 19:01, 26. Jan. 2020 (CET)

Etwas Off-Topic, aber was soll das mal werden? GND 128261056? War bei Gerd Däumel zugeordnet. --Wurgl (Diskussion) 20:31, 25. Jan. 2020 (CET)

Das ist ein gültiger Normdateneintrag für Gerd Däumel (analog zu den Stubs in Wikipedia). Der Tp wäre bereits erg. worden, wenn der zuständige Mitarbeiter der UB Marburg (DE-4‏) recherchiert hätte, statt schnell mal eine Dublette anzulegen. Meldung auf WP:GND/F ist raus. --Kolja21 (Diskussion) 23:04, 25. Jan. 2020 (CET)

Die Geschichte von der unbekannten Insel: LCCN ist momentan nicht aufrufbar, im VIAF-Katalog nicht zu finden (weder deutscher noch port. und engl. Titel) --Wurgl (Diskussion) 10:12, 26. Jan. 2020 (CET)

Hier wird es kompliziert. LCCN no2011-168424 für die span. Ausgabe. Weiterleitung des alten VIAF-Clusters auf VIAF:184913663 für die engl. Ausgabe (LCCN no99-027428). Ist als "Expression" statt "Werktitel" erfasst, s. Functional Requirements for Bibliographic Records. --Kolja21 (Diskussion) 20:22, 26. Jan. 2020 (CET)
Archivierung dieses Abschnittes wurde gewünscht von: Jack User (Diskussion) 15:42, 9. Jun. 2021 (CEST)

Templatecount mehr als pagesincategory

@Wurgl, Kolja21, Emu: mögliche Quelle für emus 811.827 ist templatecount, was bei Wikipedia:Personendaten verlinkt ist. aktuell 819651 ... das ist mehr als pagesincategory Mann+Frau+Geschlecht unbekannt. Idee warum? Bibliotaker (Diskussion) 23:06, 16. Mär. 2020 (CET)

Gibt es die Vorlage:Personendaten ausserhalb von Kategorie:Person nach Geschlecht? Bibliotaker (Diskussion) 18:07, 17. Mär. 2020 (CET)

Ja! so 10-20 Tierchen aus Kategorie:Individuelles Säugetier (nicht alle, aber doch einige haben eine Zuordnung) und dann gibt es einige Weiterleitungen die keine Kategorie zugeordnet haben. Weiterleitungen auf Artikel die Gruppen von Personen beschreiben. "Das Architektenpaar x+Y blah bla", oder "Die Musikband blubb". --Wurgl (Diskussion) 18:26, 17. Mär. 2020 (CET)
Ah, danke. In Weiterleitung kann Personendaten drin stehen, Vorlage Normdaten auch? Ich hatte umgekehrt Weiterleitungen in Personen nach Geschlecht, wo die Vorlagen nicht vorhanden waren, die stören dann in Petscan. Die Tools geben ~60 000 ausserhalb von Person nach Geschlecht gemessen 23:30-23:50:
Bibliotaker (Diskussion) 23:54, 17. Mär. 2020 (CET)
Halt! Manche Tierchen haben Normdaten vom TYP p. Personendaten haben die natürlich nicht. Da hab ich was flash gelesen. Sind dann wohl die Weiterleitungen. Mit Petscan hab ich mich nie beschäftigt, ich muss nicht alles können. Es gibt ja auch Quarry. Also 2047 Weiterleitungen mit Vorlage Personendaten, davon 4 ohne Mann/Frau/etc. --Wurgl (Diskussion) 00:52, 18. Mär. 2020 (CET)
Danke! Hab deine geforkt, die ohne cl code ergeben ca. 757100, der templatecount müsste also auch in anderen Namespaces zählen? Jedenfalls in NS 10:
Dein mit cl code, ohne Weiterleitung zeigte Treffer in Unterkategorien, daher geforkt und 'Transgender-Person' gewandelt in 'Transgender-Person', 'Nichtbinäre_Person', 'Transsexuelle_Person', d.h. neu: nicht in ('Mann', 'Frau', 'Geschlecht_unbekannt', 'Intersexuelle_Person', 'Transgender-Person', 'Nichtbinäre_Person', 'Transsexuelle_Person')
D.h. alle mit Personendaten sind in Person nach Geschlecht. Es sind damit wohl alles Menschen. Test bei Jesus, den gibt es als Jesus Christus (kein Mann, keine Person nach Geschlecht) und als Jesus von Nazaret (Mann), beide mit der selben GND. Bibliotaker (Diskussion) 13:35, 19. Mär. 2020 (CET)
Archivierung dieses Abschnittes wurde gewünscht von: --Kolja21 (Diskussion) 19:30, 7. Feb. 2022 (CET)

GND kiz - Name der Einrichtung geändert, Unterabteilung in Andere Namen

Vivantes Auguste-Viktoria-Klinikum

Organisation   Auguste-Viktoria-Krankenhaus
Andere Namen   AVK
               Auguste-Viktoria-Krankenhaus. Abt. Öffentlichkeitsarbeit

Der GND-Satz ist so nicht treffend. Auch wird hier vermischt, das gesamte Krankenhaus mit einer Abteilung. Bibliotaker (Diskussion) 23:35, 28. Mär. 2020 (CET)

Wenn Einrichtungen ihren Namen ändern, erhalten sie in der Regel eine neue GND. Unter "Andere Namen" wird aufgeführt, welche Unterorganisationen in diesem Normdatensatz mit erfasst sind. Die "Abt. Öffentlichkeitsarbeit" erhält keine eigene GND, da sie offenbar nicht bedeutend genug ist. --Kolja21 (Diskussion) 00:08, 29. Mär. 2020 (CET)
Für kiz gibt es keinen WP-zu-DNB-Fehlermeldeprozess, oder doch? Gibt es zumindest eine Sammelstelle oder soll man REMARK nehmen? Bibliotaker (Diskussion) 07:26, 29. Mär. 2020 (CEST)
Leider gibt es nur eine Liste für Personen. Im oben genannten Fall liegt aber kein Fehler vor. Jede Besitzveränderung einer Firma zu dokumentieren, kann die DNB nicht leisten. Vivantes wird es nicht ewig geben und es bleibt auch unter dem nächsten Eigentümer das Auguste-Viktoria-Krankenhaus. Namensvarianten werden nur erfasst (oder ein neue GND angelegt), wenn der Bedarf (d.h. Publikationen etc.) vorliegt. --Kolja21 (Diskussion) 08:00, 29. Mär. 2020 (CEST)
DNB sollte vielleicht besser mit Firmenregistern verknüpft werden. Nach GND4P (publisher), GND4C (culture), wäre GND4A (für alle) angebracht. Kann man Personal leicht per Homeoffice arbeiten lassen. Staat Milliarden wegen COVID-19 für Nichtarbeit auszugeben, w#re das etwas was einen Mehrwehrt bringt. Bibliotaker (Diskussion) 14:09, 29. Mär. 2020 (CEST)
Wer sagt, dass die GND-Red. zzt. nicht arbeitet? Normdaten werden weiterhin ergänzt, korrigiert und neu angelegt, auch wenn ich nicht weiß, ob vom Büro oder vom Homeoffice aus. --Kolja21 (Diskussion) 19:24, 29. Mär. 2020 (CEST)
Archivierung dieses Abschnittes wurde gewünscht von: --Kolja21 (Diskussion) 19:32, 7. Feb. 2022 (CET)