Wikipedia Diskussion:WikiProjekt Weblinkwartung

aus Wikipedia, der freien Enzyklopädie
Letzter Kommentar: vor 11 Tagen von PerfektesChaos in Abschnitt Änderung des Abrufdatums nach Prüfung der IABot-Meldung?
Zur Navigation springen Zur Suche springen
Abkürzung: WD:WLW
WikiProjekt
Weblinkwartung
Redaktion   Diskussion   Toter Link   Bot-Auftrag   Monitoring   Domains im Fokus
Diese Diskussionsseite dient dazu, Verbesserungen an der Projektseite „WikiProjekt Weblinkwartung“ zu besprechen. Persönliche Betrachtungen zum Thema gehören nicht hierher. Für allgemeine Wissensfragen gibt es die Auskunft.

Füge neue Diskussionsthemen unten an:

Klicke auf Abschnitt hinzufügen, um ein neues Diskussionsthema zu beginnen.
Archiv
Auf dieser Seite werden Abschnitte ab Überschriftenebene 2 automatisch archiviert, die seit 7 Tagen mit dem Baustein {{Erledigt|1=--~~~~}} versehen sind oder deren jüngster Beitrag 1825 Tage alt ist.

Subdomains von admin.ch[Quelltext bearbeiten]

Dieser Baustein verhindert die automatische Archivierung dieses Abschnitts und seiner Unterabschnitte. - Diese Vorlage bitte entfernen, wenn alle erledigt sind

Die Seitenstruktur bei diversen Subdomains von admin.ch wurde umgestellt, so dass es nun unzählige defekte Weblinks gibt. Betroffen sind:

Muss/soll für jede Subdomain eine Domainseite angelegt werden? Oder was wäre sonst ein sinnvolles Vorgehen? --Leyo 11:29, 10. Mär. 2017 (CET)Beantworten

@Leyo: Ich möchte deine Idee befürworten – habe im Bereich astra.admin.ch auch schon mit der Bearbeitung begonnen. Netten Gruß --Bwbuz (Diskussion) 15:21, 12. Jun. 2017 (CEST)Beantworten
Das ist mir aufgefallen, danke. Die meisten dieser Weblinks habe ich inzwischen mit der Vorlage:Toter Link markiert. --Leyo 16:03, 12. Jun. 2017 (CEST)Beantworten
Und da musste ich ein wenig rätseln…warum hast du Weblinks mit der Vorlage markiert? --Bwbuz (Diskussion) 00:13, 15. Jun. 2017 (CEST)Beantworten
Damit sie insbesondere für die Leser als tot ersichtlich sind, die Webarchiv-Version eher gefunden wird und die Links eher korrigiert werden. --Leyo 23:11, 11. Feb. 2019 (CET)Beantworten

archive.is: ".IS domain will likely stop working soon"[Quelltext bearbeiten]

verwandte diskussionen

Zur Info:

Archive.is meldet: Please do not use http://archive.IS mirror for linking, use others mirrors [.TODAY .FO .LI .VN .MD .PH]. .IS might stop working soon. (Tweet Thread; Blog). Gruss --KurtR (Diskussion) 02:32, 5. Jan. 2019 (CET)Beantworten

gudn tach!
wie geht man nun damit um? es gibt ja praktisch nur instabile domains von archive.today. komplett verbieten waere doof, weil die links ja haeufig besser als nix sind.
also notgedrungen templates dafuer einsetzen, bei denen man die TLD bequemer wechseln kann? hmm.
der besitzer von archive.is war mal bei der wikipedia, aber wurde 2013 gesperrt, sonst koennte man den nach zukunftsaussichten fragen. ich hab mal auf enwiki nachgefragt, wie die es handhaben wollen. -- seth 12:11, 5. Jan. 2019 (CET)Beantworten
Die Vorlage:Webarchiv mit dem Parameter archive-is lässt sich ohne Artikeländerungen auf eine andere TLD umstellen, damit bleiben viele Links funktionsfähig. Dann müsste man sich nur noch um den verbliebenen (und hoffentlich kleinen) Rest kümmern. -- Gruß, 32X 22:34, 5. Jan. 2019 (CET)Beantworten
@KurtR, Lustiger seth, 32X: Die Vorlage habe ich mal auf .today umgestellt. für den Rest braucht es einen Botauftrag, insbesondere da viele dieser Links in den Zitationsvorlagen (Internetquelle, Cite web,...) verwendet werden.
Sinnvoll wäre es auch wenn die Kurzlinks gegen Langlinks mit Vorlage Webarchiv ausgetauscht würden. Das kann ein Bot erledigen, der zuvor mit einem http-Client wie curl das Redirect ausliest und den resultierende Original-URL und Zeitstempel in die Vorlage einträgt.
Anmerkung: derzeit wird die Domain auf .fo umgeleitet. Da die Färinger aber wohl auch über kurz oder lang die Domain sperren könnten, habe ich .today gewählt. Das wurde zwar auch schon mal gesperrt, ist aber derzeit wieder offen, und vorläufig halte ich das für weniger riskant als eine Länder-TLD
Liste der betroffenen URLs
Falls der gleiche Inhalt auch auf im Internet Archive angeboten wird, wäre eine Umstellung angezeigt, aber das ist mit Handarbeit verbunden.
 Frohes Schaffen — Boshomi Defekte URLs - Hilfe mit!10:57, 6. Jan. 2019 (CET)Beantworten
gudn tach!
ich hatte user:CamelBot kuerzlich beigebracht, die short urls zu ersetzen -- bisher noch ohne template[1]. das koennte ich versuchen, auf template-benutzung umzustellen. -- seth 12:09, 6. Jan. 2019 (CET)Beantworten
@user:Boshomi (oder auch gerne jemand anderes, falls es wer weiss): was soll z.b. in solchen faellen gemacht werden? soll da das template internetquelle aufgeloest werden? oder sind template:internetquelle und template:webarchive in irgendeiner unkomplizierten weise kompatibel/kombinierbar? -- seth 14:25, 6. Jan. 2019 (CET)Beantworten

Ich bin brav hierher von der Vorlage Diskussion:Internetquelle #kompatibilitaet mit template:webarchive bzw. archive.is/archive.today gekommen, verstehe aber absolut nicht, was denn die konkrete Frage ist, die hier erörtert werden solle.

  • Wenn ich mal viel Zeit habe, soll Internetquelle auf Lua umgestellt und generalsaniert werden.
  • Die Methodik wäre dann noch kompatibler als ohnehin.

Bitte eine konkrete Tabelle mit Parameternamen im Vergleich darstellen, damit klar wird, was denn jetzt der Sinn dieser Anfrage wäre.

VG --PerfektesChaos 20:04, 6. Jan. 2019 (CET)Beantworten

gudn tach!
@user:PerfektesChaos: sorry fuer die unklarheit.
das thema des thread ist: wie gehen wir mit der unstabilitaet der TLDs um?
ein vorschlag ist, fuer archive.(today|is|...) kuenftig besser das webarchive-template zu verwenden. (btw: siehst du das auch so? oder siehst du eine bessere loesung?)
per bot loese ich aktuell ohnehin die short-urls auf, tat dies bisher jedoch ohne template-support. kuenftig werde ich im zuge dieser konvertierungen jedoch gleich auch aufs webarchive-template umstellen.
die frage, die ich nun zuletzt stellte, lautet: was soll in diesem fall aus benutzten internetquelle-template-instanzen werden, bei denen der archive-isurl-parameter benutzt wurde? das und das bringt vermutlich nix, weil da noch die TLD vorgegeben ist, oder kann/soll sich das internetquelle-template via lua um eine etwaige kuenftige TLD-substituierung selbst kuemmern?
jetzt klarer? -- seth 22:12, 6. Jan. 2019 (CET) (parametername korrigiert) -- seth 09:40, 7. Jan. 2019 (CET)Beantworten
@user:PerfektesChaos Siehe dir mal das von en:user:GreenC geschriebene Modul en:module:Webarchive, bzw die dazugehörige Vorlage en:template:Webarchive an. Das wurde durch diesen Edit recht generisch, und könnte damit auch in Zitationsvorlagen eingebaut werden. Allerdings halte ich es für sinnvoll bestimmte Domains wie archive.is sowie die Portokolle durch die Programmierung auf die gewünschte Archiv-URL mit dem gewünschten Protokoll zu mappen.
@seth Ich weiß nicht wie lange es dauert, bis so ein Modul in die Zitationsvorlagen eingebaut werden kann. Ich kann das schon alleine aus Zeitgründen nicht umsetzen. Würde das umgesetzt, könnte man sich den Botlauf zumindest für die Zitationsvorlagen sparen. Die vorhanden archive-urls würden einfach durch das Modul geparst, und in die gewünschte URL umgewandelt.
Wenn so eine Umsetzung länger dauert, dann macht ein Botlauf Sinn, der zumindest die archiveis-Domains nach https://archive.today vereinheitlicht. Frohes Schaffen — Boshomi Defekte URLs - Hilfe mit!23:23, 6. Jan. 2019 (CET)Beantworten
  • Status der Vorlage:Internetquelle
    • Sie ist seit fünf Jahren als Sanierungsfall eingestuft.
    • Seit drei bis vier Jahren gibt es auch das Lua-basierte Nachfolgemodell.
    • Das Erscheinungsbild ist bei korrektem Altbestand unverändert, im Zweifelsfall sogar netter formatiert.
    • Eine Migration wird mutmaßlich in Tausenden und Zehntausenden von Bestands-Artikeln zu Wartungskategorien, Fehlermeldungen und Nacharbeit führen, weil jetzt die Parametersyntax strikter analysiert wird.
    • Eine Migration wird voraussichtlich zwölf Monate tagesaktueller Betreuung zur Nachsteuerung und der Beantwortung von Rückfragen der Benutzer erfordern.
  • Mein Zeitbudget
    • Ich bin völlig überlastet, habe Hunderte von Baustellen offen und mache grundsätzlich keine neuen auf, bevor nicht der Rückstau einigermaßen abgearbeitet ist und abgeschlossen werden konnte.
    • Nur unvermeidliche akute dringliche Angelegenheiten werden noch vorgezogen, wo noch größerer Aufwand zur nachträglichen Reparatur durch frühzeitiges Eingreifen abgewendet werden kann.
    • Vorlage:Internetquelle steht in der Reihenfolge anstehender neuer Großprojekte derzeit bei mir auf Platz 2.
  • Neue Parameter der Vorlage:Internetquelle
    • Sie soll zukünftig eine einfachere, robustere und kompaktere Handhabung von rotten links und der archivierten Versionen ermöglichen und die Leser besser anleiten.
    • Das ist aber nur in einem Aufwasch mit dem Rest der Aktion zu realisieren; nach einer größeren projektweiten Umstellung muss dann wieder fünf bis zehn Jahre Ruhe sein. Mehr verkraften die Autoren beim Umlernen nicht, die sich erfahrungsgemäß extrem schwer tun, eine Veränderung zu antizipieren, und noch ein Dutzend Jahre später wieder in der Rille landen, wo sie einstmals was über Wiki erlernt hatten. Und in eine laufende Migration mit einer noch anderen Migration hineinzugrätschen kann nur in einem völligen Desaster enden.
  • benutzten internetquelle-template-instanzen werden, bei denen der archive-isurl-parameter benutzt wurde?
    • Es gibt in der Vorlage:Internetquelle zurzeit keinen Parameter mit diesem Bezeichner.
    • Es gibt nur einen Parameter archiv-url.
    • Die zukünftige Programmierung der Vorlage:Internetquelle soll allerdings den jeweiligen Archivierungssystemen zugeordnete Parameter mit Kurz-Identifikation erhalten. Natürlich nur für die dann verfügbaren.
    • Die Frage müsste also lauten: Was soll im Altbestand mit URL der is-Domain im Parameter archiv-url geschehen?
    • Das ist dann vermutlich mit der Korrektur gemeint gewesen, die nach Entwurf dieser Antwort vorgenommen wurde.
    • Insgesamt finde ich die hier verfolgten Gedankengänge aber ziemlich konfus und kann die eigentliche Zielstellung des Thread nicht erkennen.
  • Modul in der enWP
    • Dies ist ausschließlich zur Unterstützung der einen Vorlage in der enWP konzipiert.
    • Eine Programmierschnittstelle (Lua) existiert nicht.
    • Die Dokumentation ist äußerst mangelhaft; praktisch nicht vorhanden.
    • Der Parametersatz und die Methodik ist festgeschrieben auf den Stil der enWP und mit deWP nicht kompatibel.
    • Die Programmierung sieht ausschließlich englischsprachige Benutzer vor; eine Verwendung über die enWP hinaus ist nicht vorgesehen.
    • Die Funktionalitäten sind fest verdrahtet und nicht unabhängig nutzbar.
  • Goldene Unix-Regel: Mache eine Sache zu einer Zeit, und mache diese richtig.
    • Hier geht es um einen Archivbetreiber, der zukünftig nicht mehr erreichbar sein wird. So what?
    • Das zu verquicken mit Totalumbau zweier Vorlagen, in mehr als einer Viertelmillion Artikeln millionenfach eingebunden kann nur schiefgehen.
  • Das Einzige, was Vorlage:Internetquelle zurzeit tun könnte, wäre ein vorhandenes Archivlink auf .is zu erkennen, die Verlinkung ab dem Tag X nicht mehr zu aktivieren, dafür Lesern und Bearbeitern einen Hinweis anzuzeigen.
    • Es gibt eine nebulöse Andeutung, dass sich aus einer „archiveis-Domain“ ein „archive.today“ ermitteln ließe. Wenn das tatsächlich so gemeint sein sollte, dass dabei eine funktionsfähige Verlinkung herauskäme, dann lassen sich algorithmisch diese Bestands-URL innerhalb der Vorlage konvertieren. Dann ist aber der gleichzeitig gewünschte Botlauf sinnlos, weil dann keine Einbindung geändert werden müsste. Wenn aber ein Botlauf alle Einbindungen durch eine algorithmische Konvertierung anpassen könnte, ohne für jede einzelne URL erst Kontakt mit dem www aufnehmen zu müssen, äh, ???, alles äußerst wirr und widersprüchlich hier.
  • Ein entscheidender Faktor in dieser Angelegenheit wird es sein, ob Lesern, Autoren und Bearbeitern eine erreichbare, verständliche und operationale Anleitung gegeben wird, was genau sie wie und auch warum mit dem Altbestand tun müssten.

VG --PerfektesChaos 12:20, 7. Jan. 2019 (CET)Beantworten

@PerfektesChaos: Danke für die ausführliche Antwort! Meine Zeit ist leider auch recht knapp. Für Internetquelle wäre die Idee, dass der archiv-url-Parameter so belassen wird wie er ist, aber das zukünftige Modul die dort eingetragene url parst und daraus den Archivierungsdienst (für den Linktext), Archivierungsdatum und die gewünschte Ziel-URL ausgibt.
  • für die ganzen „archiveis-Domains“ würde von der Vorlage automatisch https://archive.today resultieren. Der Pfad hinter der Domain bleibt unverändert. Ein entsprechender Hotfix in der bestehenden Vorlage würde vermutlich 70-80% der offenen ~8800 archiveis-URLs erreichen, die noch nicht auf https://archive.today umgestellt sind. Der Dienst wird nicht abgeschaltet, aber mich würde es nicht verwundern, wenn sich das ganze mal unter einer Domain wiederfindet, die den Begriff "archive" nicht mehr im Domainnamen enthält.
  • Zur Unix-Regel: da gebe ich dir vollkommen recht. Die Verarbeitung Webarchivierungsdienste sollte von einem zentralen Modul bereitgestellt werden, dass über eine vernünfig gestaltete Lua-API die gewünschten Texte, Datumsangaben, URLs und falls notwendig Error-Codes zurückgibt. Das englische Template habe ich erwähnt, weil es schon jetzt mit einem archiveurl-Parameter auskommt, und damit sehr intuitiv und benutzerfreundlich umgesetzt ist. In der Internetquelle wäre damit der archiv-datum-Parameter für alle Archiverungsdienste, die entsprechend des Memento-Protokolls einen Archivierungszeitstempel/datum in der URL enthalten, überflüssig.  Frohes Schaffen — Boshomi Defekte URLs - Hilfe mit!20:12, 7. Jan. 2019 (CET)Beantworten
Verstehe ich jetzt den zweiten Punkt richtig?
  • Die URL beginnend mit https://archive.today/ an Stelle von https://archive.is/ oder so ähnlich würde bereits ausreichen, um innerhalb der Vorlage:Internetquelle das gesamte Problem zu beheben, sofern diese betroffen wäre?
    • Das kann mit Leichtigkeit zentral geschehen.
    • Damit wären alle über Vorlage:Internetquelle laufenden Verlinkungen gefixt; egal was im Artikel stünde.
  • Bitte exakte Strings bestätigen.
Die zukünftige Parameterversorgung der Vorlage:Internetquelle ist wie folgt vorgesehen:
  • archiv-datum wie heute; ISO Pflicht
  • archiv-webcitation für www.webcitation.org – jedoch nur der charakteristische Code, ohne Domain usw.
  • archiv-today für archive.today – jedoch nur der charakteristische Code, ohne Domain usw.
  • archiv-is für archive.is – jetzt nicht mehr
  • archiv-????? (weiß noch nicht; -ia oder -org, später mal entscheiden für //archive.org/ – jedoch nur der charakteristische Zeitstempel-Code, ohne Domain und ohne Wiederholung des Parameters url=
  • archiv-**** – beliebig viele weitere sinngemäße Archive und ihre jeweiligen maximal reduzierten ID
  • archiv-url – wie heute; Universal-URL für alle nicht näher bekannten Archive sowie den Altbestand
  • archiv-bot wie heute
  • Siehe Vorlage:Defekter Weblink, wo genau das mit den beiden Parametern cit= und wba= bereits seit 2015 praktiziert wird.
  • Mehrere Parameter dürfen gleichzeitig angegeben sein; eine interne Regel entscheidet, ob überhaupt und welche der verfügbaren bereitgestellt würde.
VG --PerfektesChaos 20:40, 7. Jan. 2019 (CET)Beantworten
@PerfektesChaos: Zu Punkt 2 ja, das ist richtig. Es ändert sich die Domain, die URL dahinter bleibt gleich. Das ist im wesentliche das Gleiche, was wir bei hunderten Datenbanklink-Vorlagen auch machen.
  • zu den archiv-Parametern: Die bekannten Webarchivierungsdienste, die sich an das Memento-Protokoll halten haben allesamt ein relativ einfaches URL-Pattern nach dem Muster archivdienstdomain.TLD/[path/]Zeitstempel[/|?url=]URL. Das lässt sich relativ einfach parsen, die meisten dazu notwendigen Werkzeuge hast du selbst geschrieben (Urlutil, base62,...).
  • Der archiv-url-Parameter würde dem neuen Lua-Modul übergeben. Nach heutigen Wissensstand würde ich das in zwei Teile aufteilen. Das erste stellt die abstrakten Funktionen zur Verfügung, (Parsen, URL-Erstellung, Linktext-Zusammensetzung) das zweite wäre eine Lua-table in der für jeden bekannten Archivierungsdienst das URL-Pattern, Format des Zeitstempels und die Ausgabetexte inclusive Wikilinks abgelegt werden. (Ich lege inzwischen einigen Wert auf Trennung von Funktion und Daten)
  • Wäre das Pattern der archiv-url unbekannt, würde man wie bisher den archiv-datum Parameter benötigen. Für alle bekannten Dienste, würde aber der archiv-url-Parameter alleine ausreichen. Die Ausgabe-URL und der Ausgabetext würde über die Werte in der skizzierten Lua-table zentral festgelegt. Vorteil wäre, dass kein User irgendetwas neues lernen muss, und die Zitations-Vorlagen wie gewohnt verwenden kann.  Frohes Schaffen — Boshomi Defekte URLs - Hilfe mit!16:10, 18. Jan. 2019 (CET)Beantworten

Zu aktuellen Einbindungen von archiv-url=https://archive.is/

  • Sie werden vermutlich Ende des Wochenendes oder so innerhalb der Vorlage umgeschrieben aufhttps://archive.today/
  • Irgendwo steht in den Dokus, dass today veraltet wäre und man auf is umstellen solle; das müsste aktualisiert und kommentiert wwerden.

Ein Lua-Modul arbeitet völlig anders, und zwar mit dem was in der Einbindung auf der Wikitext-Seite steht.

  • Da stehen beim Altbestand klassischer Programmierung nur archiv-url= und dann ist alles andere gegenstandslos.
  • Die neue Lua-Programmierung will bei den jeweiligen Parametern nur noch den Zeitstempel im jeweilgen Format wissen, und konstruiert daraus selbst die volle Archiv-URL.
  • Die Frage des Parsens könnte allenfalls Bots und Skripte beschäftigen, die den Wikitext verändern, nicht aber das Innere der Vorlagenprogrammierung. Der ist das weitgehend egal. WSTM könnte das in ein paar Jahren zur Verkürzung des Quellcodes im Artikel hie und da ändern.

VG --PerfektesChaos 16:54, 18. Jan. 2019 (CET)Beantworten

  • Super, dass das Umhängen der Domain von archive.is auf diese Weise möglich ist.
  • Mein Wunsch, dass der der Parameter archiv-url als zentraler und für 99% aller Fälle einziger Parameter wird, kommt von der Benutzersicht. Ich hatte immer wieder die Rückmeldung, dass die Vorlage Webarchiv mit den "vielen Parameter(sic!)" schon als zu kompliziert empfunden wird. Und es ist ja tatsächlich so, dass man fast alle wesentlichen Informationen direkt aus den Memento-URLs herauslesen kann.
  • Der größte Nachteil den ich bei so einer Lösung sehe, ist, dass zwei URLs in der Vorlage stehen bleiben. Das kostet Speicherplatz und beeinträchtigt damit die maximale Zahl an Vorlageneinbindungen pro Seite, während eine Lösung, die mit einem Zeitstempel als Parameter auskommt, gegenüber dem aktuellen Zustand eine höhere Zahl an Einbindungen ermöglichen würde. Eventuell macht eine Mischvariante Sinn. Zeitstempel mappt nach Internet Archive, Base62 nach Webcitation, Weitere Archive

(die ja auch schon zum Teil 1000fach eingebunden sind) würden über die URLs eingebunden zentral in einer einzigen Vorlage/einzigen Modul verwaltet) Frohes Schaffen — Boshomi Defekte URLs - Hilfe mit!21:10, 18. Jan. 2019 (CET)Beantworten

gudn tach user:Boshomi!
ich hab's noch nicht ganz verstanden. sind solche bot-aenderungen nun erwuenscht oder nicht? soweit ich es sehe kann man den vollstaendigen url ja nicht aus den anderen template-parametern generieren, weil die uhrzeit fehlt (und ausserdem das archiv-datum falsch zu sein scheint?), oder? -- seth 00:09, 11. Jan. 2019 (CET)Beantworten
seth: Ja, solche Edits machen Sinn, wenn das ein Bot ausführt. Im verlinkten Spezialfall gibt es aber eine Anmerkung: Die URL wurde zuerst im Internet Archive gesichert, und von dort in Archive.is. Die Quelle ist im Internet Archive noch erreichbar, weshalb es eigentlich zu bevorzugen wäre. (Kann mir aber nicht vorstellen dass das ein Bot erledigen kann.
Zu meiner aktiveren Zeit habe ich mal mittlere vierstellige Zahl an archive.is-URLs auf Internet Archive umgestellt. Das ist aber Handarbeit, denn es ist alles andere als sicher, dass der gewünschte Inhalt zum richtigen Zeitpunkt auch im Internet Archive vorhanden ist.
Grundsätzlich wäre es auch wünschenswert alle archiveis-Domains unter einer einzigen Domain zu vereinigen, um die Verwendung leichter im Überblick zu behalten. Derzeit wäre das eben .today Frohes Schaffen — Boshomi Defekte URLs - Hilfe mit!16:10, 18. Jan. 2019 (CET)Beantworten

Update: Wenn ich den Twitter-Thread richtig verstehe, ist die Domain .is nicht mehr bedroht. Abwarten? @user:lustiger_seth, @PerfektesChaos, @user:Boshomi. --KurtR (Diskussion) 01:08, 11. Jan. 2019 (CET)Beantworten

Ich würde es nach Möglichkeit überhaupt vermeiden, archive.is zu verwenden, da die Betreiber dieses Dienstes anonym sind und man keine Ahnung haben kann, wie es um die Zukunftssicherheit steht. Ziemlich nebulöse Angelegenheit. Das Internet Archive (archive.org) ist da als etablierte, solide aufgestellte Non-Profit-Organisation doch viel vertrauenerweckender. Gestumblindi 01:16, 11. Jan. 2019 (CET)Beantworten

gudn tach!
@user:Gestumblindi: auf archive.is sind einige seiten gespeichert, die auf archive.org nicht vorhanden sind. deswegen bietet archive.is einen echten mehrwert fuer die wikipedia -- trotz der instabilitaet.
@user:KurtR: das grundproblem (die instabilitaet der TLDs) ist damit aber wohl nicht gebannt.
und die short-urls sollten so oder so besser durch langversionen ersetzt werden. -- seth 00:14, 12. Jan. 2019 (CET)Beantworten
@user:Gestumblindi: Da hast Du schon recht, dass man wenn immer möglich archive.org verwenden soll. Bei einigen Seiten fand ich nur archive.is Links, gewisse Seiten haben technische Probleme beim Archivieren mit archive.org.
@seth: Stimmt. Ich habe neuerdings das Problem, dass ich mit .today https-Fehlermeldungen bekomme: Keine gemeinsamen Verschlüsselungsalgorithmen. Fehlercode: SSL_ERROR_NO_CYPHER_OVERLAP, aber die Site mit .fo oder .is funzt. Bsp: bsp.fo vs bsp.today. --KurtR (Diskussion) 00:54, 12. Jan. 2019 (CET)Beantworten
Ich schrieb ja auch "nach Möglichkeit" ;-) Gestumblindi 02:33, 12. Jan. 2019 (CET)Beantworten

Die Verlinkung nach archive.today ist deutlich langsamer als auf archive.fo, weil jeweils mit etwas Verzögerung von ersterer auf letzterer weitergeleitet wird. Spricht irgendwas dagegen, zumindest die Hauptvorlage {{Webarchiv}} jetzt auf .fo zu verlinken? Ich hatte das gestern getan, funktionierte auch bestens, wurde aber mit Verweis auf diese Disk revertiert. Ich lese hier aber nichts, was gegen eine direkte Verlinkung nach .fo spräche. Falls diese Domain irgendwann abgeschaltet werden sollte, könnte man es ja mit einem schnellen Klick wieder ändern. --PM3 04:32, 9. Jun. 2019 (CEST)Beantworten

die Geschwindigkeit ist irrelevant. Es geht darum, dass eine Lösung gefunden wird die das Projekt selbst nicht unnötig gefährdet.  Frohes Schaffen — Boshomi Defekte URLs - Hilfe mit!17:49, 9. Jun. 2019 (CEST)Beantworten
 Info: *.is funktioniert aktuell weiter als *.is, der Abruf von *.today führt nach *.fo und dorthin linkt auch die von *.today bereitgestellte Browservorlage, falls das bei der Entscheidungsfindung irgendwie hilft. Gruß @ alle, Agathenon 15:57, 14. Jun. 2019 (CEST)Beantworten

Info: Domain problem again: http://archive.FO is shutting down. Other mirrors are safe.[2]. Gem. dortigem Screenshot ist ab November damit zu rechnen. z. K. @user:lustiger_seth, @PerfektesChaos, @Benutzer:ⵓ u. a. --KurtR (Diskussion) 00:55, 27. Okt. 2019 (CEST)Beantworten

@KurtR: das kommt nicht ganz unerwartet, im August/September hatte ich schon eine ganze Menge ( gut 1000) davon umgestellt, ich bin derzeit RL-bedingt zwar wieder weniger aktiv, aber die paar Restfälle (18 Stück) werde ich in den folgenden Tagen ebenfalls auf .today umstellen.  Frohes Schaffen —  Defekte URLs - Hilf mit! [​ɪ​​u:] 19:07, 28. Okt. 2019 (CET)Beantworten

Blogbeitrag zu den Domainproblematiken. --KurtR (Diskussion) 02:24, 30. Okt. 2019 (CET)Beantworten

Automatisches Archiv --> DONE[Quelltext bearbeiten]

Dieser Baustein verhindert die automatische Archivierung dieses Abschnitts und seiner Unterabschnitte. Grund: Von Eduevokrit gewünscht. --Anton Sachs (Diskussion) 10:00, 27. Nov. 2019 (CET)Beantworten

Vermutlich schon oft diskutiert, daher bitte nur antworten und gleich streichen:

Warum wird nicht jeder Link bei einer neuen Seite gleich archiviert (mit aktuellen Datum), damit nicht nach 2 Tagen schon der ext. Link wieder ungültig ist? Zum Zeitpunkt der Erstellung des Links war er ja noch gültig... Das könnte ein Bot vermutlich machen. Zumindest bei ganz neuen Seiten... --JackPilot (Diskussion) 09:12, 14. Okt. 2019 (CEST)Beantworten

Das macht das InternetArchive angeblich selbst automatisch. Nach meinen Erfahrungen funktioniert es allerdings nicht zuverlässig. Eine zusätzliche manuelle Archivierung dort und auf archive.today ist daher sinnvoll. --Rodomonte (Diskussion) 09:22, 14. Okt. 2019 (CEST)Beantworten
Das InternetArchive durchforstet Wikipedia und sucht neue Seiten und archiviert die ext. Links? Das kann ich mir kaum vorstellen, dass das geht. Das ist eine Wildcard über den gesamten Index von Wikipedia in vermutlich allen Sprachen. --JackPilot (Diskussion) 10:14, 14. Okt. 2019 (CEST)Beantworten
Siehe beispielsweise das Blog des Internet Archive oder diesen Beitrag auf wikiconference.org. --Rodomonte (Diskussion) 10:31, 14. Okt. 2019 (CEST)Beantworten
Thx for info. Ich werde Seiten, die mit toten Links sind, entsprechend in den Diskussionen Source Code markieren. Abschnitt als Done markiert. Kannst ihn auch löschen, wenn er stört. --JackPilot (Diskussion) 11:03, 14. Okt. 2019 (CEST)Beantworten
Danke für die Frage, sie beschäftigt mich auch schon seit einer Weile. Laut dem obigen Blogeintrag (Danke für die Links!) ist die automatische Archivierung der enWP abgeschlossen. Irgendwo hatte ich ferner den Hinweis gelesen, dass es ein halbes bis ganzes Jahr dauern kann, bis das Internet Archiv die Archivversionen freigibt und man deshalb mit der Achivlinksuche geduldig sein soll und nicht erreichbare Links ohne Archivlink nicht gleich als endgültig tot auffassen soll. Ich finde, das sind wichtige Informationen, die in die Anleitung rein sollten, wie man mit toten Weblinks umgeht. Es wäre toll, wenn die „alten Hasen“ unter euch behilflich sein könnten. Mir fehlt hier noch immer der komplette Überblick, sonst hätte ich mich da schon selbst ran gemacht. Deshalb diesen Abschnitt bitte noch nicht archivieren. --Eduevokrit (Diskussion) 12:15, 14. Okt. 2019 (CEST)Beantworten

Leerzeichen nach Pipe als Weblinkwartung?[Quelltext bearbeiten]

Hallo, wozu diese Leerzeichen unter der Überschrift WP:WLW? FYI. Gruß, --Wi-luc-ky (Diskussion) 16:07, 10. Feb. 2020 (CET)Beantworten

Wi-luc-ky : Solche Edits passieren normalerweise unbasichtigt, beim Überprüfen der Links, wobei das Skript die Vorlagenverwendung normiert. Bei dieser Normierung entstehen diese Leerzeichen, wodurch die Mediawiki-Software eine Änderung im Quelltext vermutet, die dann effektiv gar nicht stattgefunden hat. Die Software zeigt zwar das Diff automatisch, sodass man solche Null-Edits erkennen kann, wenn man das übersieht, bleibt der Nulledit in der Versionsgeschichte. Der Benutzer hat bloß das Funktionieren der URL geprüft, nicht mehr, aber auch nicht weniger. Da kein wirklicher Schaden entsteht, kann man WP:Korrekturen in solchen Fällen auch großzügig auslegen.  Frohes Schaffen —  Defekte URLs - Hilf mit! [​ɪ​​u:] 20:46, 11. Feb. 2020 (CET)Beantworten
Danke,  , für die Erläuterungen. WP:KORR wollte ich gar nicht aufrufen; es ging mir um die technischen Aspekte des Edits des Kollegen.
  • Als ZQ (wer immer das geschrieben hat) stand: „(fix WP:WLW +1lf; 3 externe Links geändert)“. Das ist angesichts des Diffs unverständlich, da weder 1 Link (?!) gefixt wurde, noch 3 externe Links geändert wurden. Damit beschreibt die ZQ nicht das, was durch den Edit bewirkt wurde.
  • Dass die Vorlagenverwendung en passant normiert würde, wäre ein Grund, doch ein Blick auf Vorlage:Webarchiv zeigt ja gerade, dass die Änderung nichts normiert hat (falls wir die in der VL-Doku stehenden Bspp. als Norm ansehen), sondern dass der Edit von der dokumentierten VL-Bspp. abgewichen ist.
  • Dann wäre das eine Anfrage an die automatisierte Technik der Weblinkwartung selbst, die dann serienmäßig solche funktionslosen, keine sichtbaren Änderungen bewirkenden Leerzeichen einfügt, die BEO füllt und die Beobachtenden beschäftigt. Weblinkwartung sollte in der Stille geschehen, wenn nichts zu ändern ist. Das allein mE wäre nützlich.
Gruß, --Wi-luc-ky (Diskussion) 22:37, 11. Feb. 2020 (CET)Beantworten

American Factfinder, vgl. en:Wikipedia:US Census Migration[Quelltext bearbeiten]

https://factfinder.census.gov wird am Monatsende abgeschaltet. Das betrift derzeit 833 Artikel.

Wenn ich die englische Übersichtsseite richtig verstanden habe, und ich bin mir da nicht so sicher :-(, dann gibt es Regeln mit denen Links wie https://factfinder.census.gov/bkmk/table/1.0/en/PEP/2016/PEPANNRES/0400000US53.16200 umgesetzt werden können.

Links wie https://factfinder.census.gov/faces/nav/jsf/pages/community_facts.xhtml ( ab etwa Possition 100 der verlinkten Weblinksuche) sind schon seit Jahren nicht zielführend, weil es da keine Permalinks gab, sndern mit Sessio-IDs gearbeitet wurde; sie führen nur zu einer Gesamtübersicht mit Suchfeldeingabe. Bei den Links ab etwa Position 620 hadelt es sich um eine Vielzahl von Linkmustern da steige ich noch net durch. Hat da jemand Ideen, wie man da vorgehen kann? --Matthiasb – (CallMyCenter) Wikinews ist nebenan! 00:13, 21. Mär. 2020 (CET)Beantworten

Hier ist der Guide (PDF). --Anton Sachs (Diskussion) 18:41, 8. Apr. 2020 (CEST)Beantworten

Archivlink bereits bei Angabe eines Einzelnachweises anlegen und angeben[Quelltext bearbeiten]

Auch wenn alle Weblinks nun vom Internet Archive archiviert werden, bleibt die Arbeit, den Archivlink zu überprüfen, sobald der Weblink nicht mehr erreichbar ist. Was spricht dagegen, von Anfang an neben dem aktuellen Link auch gleich den Archivlink anzugeben? Da sich ja zig Prozent der Links irgendwann einmal ändern (tot sind), wäre das eine ernorme Arbeitserleichterung. In der französischsprachigen Wikipedia scheint das so üblich zu sein, siehe zum Beispiel hier. --Eduevokrit (Diskussion) 22:47, 3. Jan. 2021 (CET)Beantworten

Das könnte z. b. so aussehen: <ref name="bigProjekte">{{Internetquelle |url=https://www.big.at/projekte/bsz-st-poelten/ |titel=BSZ St. Pölten–Sanierung und Erweiterung |autor= |werk=www.big.at |datum= |abruf=2021-01-04}} [https://web.archive.org/web/20210104141700/https://www.big.at/projekte/bsz-st-poelten/ Archivlink] </ref>, siehe Höhere Technische Bundeslehr- und Versuchsanstalt St. Pölten. --Eduevokrit (Diskussion) 15:32, 4. Jan. 2021 (CET)Beantworten
Hallo Eduevokrit, im Anstaltslink sehe ich nur 19 vom InternetArchivBot bereits 2018 bzw. 2019 angebotene, bisher leider ungeprüfte Mementos.
D. h.: Obwohl seit über zwei Jahren Mementos angeboten wurden, sind diese von den Nutzern nicht geprüft worden. Diese Prüfung verbleibt als Aufgabe, sei es, dass die Archivlinks von Anfang an vorhanden gewesen wären, sei es, dass sie vom IABot eingetragen werden. Arbeitsersparnis sehe ich hier so nicht.
In fr:Berlin stehen zwar viele [archive], nicht alle funktionieren aber! Da stellt sich die Frage nach dem Nutzen solcher Links.
Dass die Bevorratung von Archivlinks im Artikel aus verschiedenen Gründen müßig ist und als sichtbare Links unerwünscht sind, ist schon vielfach diskutiert und erklärt worden.
Gruß, --Wi-luc-ky (Diskussion) 18:25, 4. Jan. 2021 (CET)Beantworten
Hallo Wi-luc-ky, dass bei fr:Berlin nicht alle Archivlinks funktionieren, habe ich vorher nicht gesehen, da gebe ich dir Recht, so etwas ist natürlich ärgerlich. Bei der Höhere Technische Bundeslehr- und Versuchsanstalt St. Pölten habe ich erst mit der Weblinkwartung begonnen. Das Beispiel ist dort der 10. Einzelnachweis. Momentan arbeite ich primär die defekten Weblinks ab, die auf den Diskussionsseiten vermerkt sind, und arbeite dann die restlichen vorderen "en passant" mit ab. Einige tote Links werde ich wohl durch aktuelle ersetzen können wie beim Einzelnachweis 10. Aber es ist frustrierend zu wissen, dass spätestens in zehn Jahren ein Großteil der Ersatzlinks erneut tot sein wird. Und wenn es schon die Möglichkeit gibt, Webseiten zu archivieren, ist es doch naheliegend und zielführend, diese Möglichkeit auch zu nutzen. Eine Möglichkeit (ohne große Rumprogrammiererei) könnte sein, die Seiten händisch zu archivieren und wie in meinem Beispiel den Archivlink händisch hinzuzufügen. Falls das auf Widerstand stoßen sollte (warum eigentlich?), könnte man den Vorratsarchivlink auch auskommentieren. Da die Weblinkalterung ein systemimmanentes Problem ist, sollten wir es auch systemisch angehen. Eine ältere Diskussion dazu konnte ich im Archiv hier nicht finden, die Argumente würden mich aber sehr interessieren, Tipp, wo ich die vorangegangenen Diskussionen finden kann? --Eduevokrit (Diskussion) 19:30, 4. Jan. 2021 (CET)Beantworten

Es wird just dieser Tage zum x-ten Mal auf FZW erklärt. Die Gründe wurden bereits genannt:

  1. Die Artikelquelltexte werden zugemüllt.
  2. Der Arbeitsaufwand zum Aufsuchen eines Archivlinks ist identisch; ob jetzt sofort oder in zehn Jahren nach eingetretenem Bedarf.
    • Aber in zehn Jahren kann unter denjenigen Seiten gesucht werden, die in zehn Jahren veröffentlicht sind.
    • Die heute hinterlegte URL muss in zehn Jahren nicht mehr funktionieren; sei es weil der komplette Archivierungsdienst nicht mehr existiert oder weil der Inhaber der Domain den ungefragten Kopien widersprochen hat.
  3. Wenn man weiß, dass auf einer dynamischen Website nach dem inhaltlichen Stand von Januar 2021 gefragt wird, dann kann 2034 immer noch unter den in diesem Jahr verfügbaren Archivversionen mit Stand Januar 2021 oder möglichst zeitnah dazu gesucht werden.
    • Für statische Informationen wie die Digitalisate gedruckter Werke sind Abrufzeitpunkte ohnehin gaga und bei großen Websites völlig sinnfrei.
  4. Grundsätzlich nicht betroffen sind alternative Publizierer; also eine Uni und der Autor parallel usw.
    • Es geht nur um allgemeine Standard-Archive.
  5. Was irgendein anderes Wiki macht ist völlig wurscht.
    • Bei uns hatte man sich das vor zehn Jahren mal genauso vorgestellt.
    • Wir haben jedoch inzwischen dazugelernt; es verursacht nur Extra-Arbeit, bietet keine Gewähr dass es in zehn Jahren ein besseres Ergebnis liefern kann, und vermüllt inzwischen ein Jahrzehnt lang unsere Quelltexte.

VG --PerfektesChaos 20:52, 4. Jan. 2021 (CET)Beantworten

(BK) @Eduevokrit: Begrüßenswert, dass Du Dich der Archivlinks annimmst.
Vorweg: Alle neu im ANR eingestellten Weblinks werden automatisch von Archive.org archiviert; eine händische Archivierung ist demnach grundsätzlich nicht zwingend erforderlich.
Zwei sehr informative Diskussionen, die alles Wesentliche beinhalten:
Nach diesen Diskus ist eine Vorratsarchivierung wenig sinnvoll, so sinnvoll Dein Anliegen auf den ersten Blick auch scheint.
Gruß, --Wi-luc-ky (Diskussion) 21:12, 4. Jan. 2021 (CET)Beantworten
Erst einmal Dankeschön für die ausführlichen Antworten und die hilfreichen Links (die leichter auffindbar sein sollten, vielleicht hier auf der Vorderseite verlinken?). Einzig das Argument, dass prophylaktische Archivlinks den Quelltext zumüllen und Extra-Arbeit verursachen, finde ich nicht überzeugend. Aber ich lass das erst einmal ein paar Tage sacken. --Eduevokrit (Diskussion) 21:40, 4. Jan. 2021 (CET)Beantworten
Gerade entdeckt, hier wird ja fast die gleiche Diskussion geführt, wie in der Abteilung zu den Einzelnachweisen. Vielleicht wäre es geschickt, diese Diskussionen an einem Ort zusammenzuführen, um alle Argumente für und wider an einer Stelle versammelt zu haben. So sieht jeder nur einen Teilaspekt, und die gleichen Argumente und gleichen Gegenargumente werden immer wieder vorgetragen. Das ist nicht effizient. --188.101.171.216 16:57, 18. Aug. 2021 (CEST)Beantworten

static.fifa.com[Quelltext bearbeiten]

Diese über die Vorlage {{FIFA.com}} vielfach verlinkte Domain scheint es nicht mehr zu geben. Die Vorlage sollte wohl angepasst werden, falls es einen Ersatz gibt. Ich habe mir das nicht näher angeschaut, da mich Fussball nicht interessiert ;-) Gestumblindi 01:08, 6. Mär. 2021 (CET)Beantworten

Die Vorlage ist übrigens von Hadibe; habe ihn auch gerade mal angesprochen. Gestumblindi 01:11, 6. Mär. 2021 (CET)Beantworten
Die Vorlage ist repariert. Nicht die Domain an sich ist abgeschaltet, sondern die Spielerprofile werden nicht mehr von der FIFA unterstützt. Team und News funktionieren weiterhin. --Hadibe (Diskussion) 11:22, 7. Mär. 2021 (CET)Beantworten
@Hadibe: Ich meinte die Domain static.fifa.com, diese Subdomain von fifa.com ist ja wirklich abgeschaltet. Wenn die Spielerprofile nur noch als nicht mehr aktualisierte Archivversionen verlinkt werden, sollte das in den generierten Beschreibungen vielleicht noch ausdrücklich vermerkt werden? Also etwa statt "<Name> in der Datenbank der FIFA" so etwas wie "<Name>, Archivversion des Eintrags in der Datenbank der FIFA mit Stand <Datum der Archivversion>"? Gestumblindi 18:24, 7. Mär. 2021 (CET)Beantworten

CIA World Factbook[Quelltext bearbeiten]

Wie vorgehen beim Linkfix?

Bisheriger Link, als Beleg im Lemma Energiewirtschaft Litauens verwendet (Nr. 28 a,b,c): [3]

Möglicherweise wurde es lediglich an diese Stelle verschoben: [4]

Aber wie kann sichergestellt werden, daß das wirklich noch der gleiche Inhalt ist? Oder wurde der Inhalt auch aktualisiert oder geändert? Dann könnte man den Link ja nicht einfach austauschen, weil er – anders als der Originallink – dann ja möglicherweise gar nicht mehr das belegt, was ursprünglich damit belegt werden konnte.

Außerdem sind weitere 1438 Lemmata betroffen: https://giftbot.toolforge.org/weblinksuche.fcgi?target=https%3A%2F%2Fwww.cia.gov%2Flibrary%2Fpublications%2Fthe-world-factbook%2F%25&namespace=

Was tun? Mann kann doch kaum nachsehen, ob mit den neuen Links noch alle in den ganzen Lemmata referenzierten Zahlen und Fakten noch immer belegt werden können, wie mit den Originallinks. Das ist ja eine Arbeit für Monate, wenn nicht Jahre! Bis das fertig ist, haben sie es dann schon wieder verändert.

Gibt es vielleicht Mementos von der Originalfassung, die exakt zugeordnet werden können? Damit wäre sichergestellt, daß die Zahlen und Fakten genau so dastehen, wie der ursprüngliche Autor einer Passage eines Lemmas sie als Beleg eingefügt hatte. Ansonsten müssen ja alle betroffenen Passagen wie beim erstmaligen Schreiben überprüft und jede einzelne Zahl, jeder zitierte Fakt nochmals genau verglichen werden. Eine sinnlose Doppelarbeit.

Oder schreiben wir einfach überall dazu, daß der neue Link möglicherweise nicht mehr das belegt, was der ursprüngliche Link belegt hat, und ersetzen die Links trotzdem?

Liebe Grüße --188.101.171.216 16:44, 18. Aug. 2021 (CEST)Beantworten

Nachtrag: Also, zumindest für das Lemma Energiewirtschaft Litauens habe ich das Problem manuell behoben, alle damit belegten Zahlen im Lemma daraufhin überprüft, daß sie auch mit der unter der neuen Linkadresse abrufbaren Version noch vollständig belegt sind. Aber diese Arbeit kann ich nicht für die anderen 1437 toten Links dieser Domain schaffen. --188.101.171.216 23:37, 18. Aug. 2021 (CEST)Beantworten

Hinweis auf kostenlose Literatur-Zugänge für Wikipedia-Aktive[Quelltext bearbeiten]

Liebe Mitarbeitende vom WikiProjekt Weblinkwartung,

ich möchte euch gerne auf das Förderprogramm der Wikimedia-Vereine aufmerksam machen.

Wer einen Artikel schreiben oder überarbeiten möchte und dazu ein bestimmtes Fachbuch gebrauchen könnte, kann von den Wikimedia-Fördervereinen kostenlose Zugängen zu Fachliteratur erhalten. Weitere Informationen zur Literaturvergabe und andere Unterstützungsmöglichkeiten, wie die Erstattung von Bibliothekskosten, sind hier zu finden.

Sonstige Formen der Unterstützung, wie E-Mail-Adressen für Freiwillige, Trainingsangebote und anderes, sind unter Wikipedia:Förderung aufgeführt.

Es wäre sinnvoll, dass auch zukünftig Aktive und Neue in diesem Themenbereich auf das leider oft nicht bekannte Förderangebot hingewiesen werden und von kostenlos zur Verfügung gestellter Literatur profitieren können. Daher würde ich mich freuen, wenn ihr einen entsprechenden Hinweis dauerhaft an geeigneter Stelle dieses WikiProjekts platzieren möchtet, beispielsweise an geeigneter Position auf der Projektseite, oder als fixierter Hinweis oberhalb der Diskussionsbeiträge auf dieser Diskussionsseite. Als Vorschlag könnte die unter meiner Signatur folgende Vorlage verwendet werden – dazu einfach nur das „XY“ mit dem entsprechenden Themenbereich ersetzen.

Solltest du weitere Fragen zur Förderung haben, kannst du dich entsprechend deines Wohnsitzes an Wikimedia Deutschland (community@ – at-Zeichen für E-Mailwikimedia.de), Wikimedia Österreich (verein@ – at-Zeichen für E-Mailwikimedia.at) oder WMCH (ulrich.lantermann@ – at-Zeichen für E-Mailwikimedia.ch) wenden. Da dieser Hinweis auf mehreren Projektseiten platziert wird, möchte ich euch bitten, Fragen und Rückmeldungen zu dieser Kampagne dort auf der Diskussionsseite zu stellen, damit diese an zentraler Stelle gesammelt und beantwortet werden können.

Viele Grüße --Nico (WMDE) (Diskussion) 14:36, 16. Sep. 2021 (CEST)Beantworten


Vorschlag zur dauerhaften Platzierung des Förderhinweises an geeigneter Stelle:

Wenn du einen Artikel im Themenbereich XY schreiben oder überarbeiten möchtest und dazu ein bestimmtes Fachbuch gebrauchen könntest, kannst du von den Wikimedia-Fördervereinen kostenlose Zugänge zu Fachliteratur erhalten. Weitere Informationen zur Literaturvergabe und andere Unterstützungsmöglichkeiten wie die Erstattung von Bibliothekskosten sind hier zu finden.

webcitation.org[Quelltext bearbeiten]

Kann es sein das webcitation.org nicht mehr funktioniert? DB Connection failed --Dr Lol (Diskussion) 08:39, 20. Nov. 2021 (CET)Beantworten

@Dr Lol: siehst du WebCite und Disk. --Wiki1939 (Diskussion) 12:56, 5. Jul. 2023 (CEST)Beantworten

Wartungslisten aktualisieren[Quelltext bearbeiten]

Könnte noch mal ein Update angestoßen werden zu Wikipedia:WikiProjekt Weblinkwartung/Toter Link/Liste… ? Die letzten sind noch von 2017. Pintsknife (Diskussion) 15:28, 21. Jun. 2022 (CEST)Beantworten

Teilweise gehen die Altlasten noch weiter zurück, es hängt etwas davon ab, in welchem Fachgebiet (Kategorien) du tätig bis. Ich habe mich z. B. dem Bereich Schule gewidmet und dort alle Altlasten abgearbeitet (Meldungen auf der Diskussionsseite der Artikel). Die „aktuellen“ defekten Links bei Allgemeinbildenden Schule sind in dieser Liste zu finden. Oder meinst du was anderes?--Eduevokrit (Diskussion) 16:01, 21. Jun. 2022 (CEST)Beantworten
Ah, jetzt schnalle ich es, du meinst die Statistik auf der Vorderseite. --Eduevokrit (Diskussion) 16:03, 21. Jun. 2022 (CEST)Beantworten
Ne, ich meine die Listen, zb. Wikipedia:WikiProjekt Weblinkwartung/Toter Link/Liste 2015. Nicht die Statistik. Pintsknife (Diskussion) 16:37, 21. Jun. 2022 (CEST)Beantworten
Viele Seiten in diesem Wikiprojekt gehen auf Benutzer:ⵓ zurück, der sie ehemals erstellt und aktualisiert hat, inzwischen aber nur noch wenig aktiv ist.--Mabschaaf 16:51, 21. Jun. 2022 (CEST)Beantworten

Unterschiede zwischen den bots[Quelltext bearbeiten]

Auch wenn der bot nicht mehr aktiv ist, mir ist in Rauchgaskondensation aufgefallen, dass dort http://www.scheuch.com/de/aktuell_energie/IDnews=3425 vom Giftbot als nicht mehr funktionierend erkannt wurde [5], von den späteren bots aber nicht mehr [6], was wohl an der Rückmeldung der Website liegt? Wurde die Website umgestellt, oder hat sich etwas an den bots geändert? --Benutzer:Chemiewikibm 18:07, 2. Aug. 2022 (CEST)Beantworten

Falschschreibung in Vorlage Webarchiv/archiv-bot-core[Quelltext bearbeiten]

Hallo zusammen, bin bei Korrekturen der häufigen Falschschreibung "Achiv" (statt "Archiv") auch auf die Vorlage {{Webarchiv/archiv-bot-core}} (und deren Doku {{Webarchiv/archiv-bot-core/Doku}}) gestoßen. Mein Edit wurde revertiert mit der lapidaren Bemerkung „War schon in erster Version so“. So weit ich sehe, existieren keine der in der Implementierung angegebenen Vorlagen "Vorlage:Weba(r)chiv/IABot/..." – weder mit noch ohne "r". Auf Wunsch von Wiki1939 hier zur Begutachtung. cc:Benutzer:ⵓ (Erstautor). Danke u. Grüße, --rolf_acker (Diskussion · Beiträge) 17:47, 22. Jun. 2023 (CEST)Beantworten

Du hattest aufgefordert andere User sollen deine Änderung prüfen (siehe "bitte prüfen", deshalb die Rücksetzung.
Ich hätte nicht rückgesetzt, wenn du statt dessen geschrieben hättest, dass du bereits alle etwaigen Zusammenhänge geprüft hast.
Auch meine Begründung war nicht lapidar, denn ich schrieb: "ich kann nicht prüfen was alles die Weblinkwartung damit macht in welche Tools das überall eingebunden ist. Das musst du vorher prüfen.". --Wiki1939 (Diskussion) 13:50, 23. Jun. 2023 (CEST)Beantworten

Vermeiden defekter Weblinks[Quelltext bearbeiten]

Der Zustand der deutschen Wiki wird nach meinem Empfinden immer schlechter - egal auf welche Seite ich gehe, gefühlt sind 2/3 der Weblinks kaputt. Laut Statistik waren es 2017 zwar nur 12%, aber in Zahlen immerhin eine Million. Eine aktuelle Statistik wär auch interessant. Der Wartungsaufwand wird immer grösser, da immer neue Artikel geschrieben werden und im Laufe der Zeit praktisch alle Links kaputt gehen. Schliesslich muss jede Website früher oder später auf einen neuen Server umziehen. Manche Links verfallen im Jahrestakt, z.B. viele Regelbücher von Sportverbänden, manche noch schneller, z.B. in manchen Newsportalen.

Da es offensichtlich hoffnungslos ist der Seuche der defekten Weblinks Herr zu werden, indem man jede Menge Zeit damit verbringt kaputte Links zu fixen (Hat hier irgendwer die Hoffnung, dass sich eine Horde Hobbyloser hinsetzt und 1 Mio kaputte Links flickt?), die nach ein paar Jahren sowieso wieder kaputt gehen, wäre es an der Zeit von vorne herein Archivlinks zu setzen. Das geht ganz einfach:

  • Links hinter einer Bezahlschranke können mit dieser Methode nicht archiviert werden.
  • https://web.archive.org/ rechts unten in das Feld "Save Page Now" den Link eingeben
  • "Save Page" wählen
  • im nächsten Fenster erneut "Save Page" wählen
  • Nach ein bis zwei Minuten erscheint ein grüner Haken und der Text:A snapshot was captured. Visit page: /LinkZumArchiv/
  • Den Link zum Archiv wählen.
  • Im Archiv rüfen ob die Seite korrekt gespeichert wurde
  • Die URL aus der oberen Browserzeile in den Wiki-Artikel übertragen.
  • Um die doppelte Archivierung einer Seite zu vermeiden, kann auch der Link erst in die normale Wayback Eingabezeile eingegeben werden, dann werden entweder Snapshots präsentiert, oder es wird ein "Save Page" angeboten.

Dies sollte in den Autoren Tutorials so erklärt werden. Auf die Methode stiess ich zufällig in einem Tutorial der englischen Wiki. In der deutschen Wiki ist mir dieser Hinweis noch nicht untergekommen. Das sollte sich ändern. In der englischen Wiki wird den Autoren an Herz gelegt nur Archivlinks in Wikipedia einzubauen.

Beim Speichern eines gewöhnlichen Weblinks in einem Wiki-Artikel könnte man eine Aufforderung einbauen, den Link doch bitte vorher zu archivieren. Noch komfortabler könnte ein Bot das Archivieren neuer Links und das präventive Fixen von gewöhnlichen Links übernehmen. Wenn es bei Archive.org keine Probleme mit Bots gibt, sollte ein versierter Programmierer das eigentlich lösen können. Da Archive.org, soweit ich das erkennen kann, durchaus Willens ist die Wikipedia-Belege zu archivieren, sollte es "politisch" keine Probleme geben. Es könnte natürlich sein das Archive.org aus Sicherheitsgründen alles dicht gemacht hat, dann könnte sich ja Wikimedia-Foundation mal mit denen zusammensetzen und eine technische Lösung finden. Warum crawlt Archive.org eigentlich nicht von selber durch die Wikis? Dann wäre das Problem mit fishy Bots gelöst.

Diesen Gesunde-WebLink-Archivier-Bot würde ich gerne für meinen User dauerhaft aktivieren, so dass er jedesmal, wenn ich einen Wiki-Artikel speichere, das Diff nach einem neuen Link durchsucht und bei Bedarf den Link archiviert und fixt. Der Bot soll mich aber nicht mit alten kaputten Links nervten, dass Wikipedia verottet weiss ich auch so ;-) Da Wayback sehr langsam ist, gibt es vielleicht Bearbeitungskonflikte, daher wäre es evt auch sinnvoll, wenn sich der Bot den Link merkt und dann in der nächsten Nacht abarbeitet. Der Bot könnte ja auch gleich alle gewöhnlichen Links überprüfen und alle die funktionieren in Archivlinks umwandeln. Die Gammellinks darf er gerne für sich behalten. Genug geträumt. Gruss --Minoo (Diskussion) 23:06, 24. Sep. 2023 (CEST)Beantworten

Im Rahmen des Reverts auf Wikipedia:Defekte Weblinks in dortiger Disk vermerkt:

Es ist in diesem Wiki hier absolut unzulässig, Archivlinks einzufügen, solange die Webseite regulär erreicbar ist. Wikipedia:Weblinks #Archivierte Versionen

  • „Solange eine Website verfügbar ist, sollte kein Archivlink dazu für den Leser propagiert werden.“

Der Hintergrund ist folgender:

  • Jedes Archivlink ist eine URV, denn diese globalen Archivierungen erfolgen üblicherweise ohne Einverständnis des Anbieters.
  • Anbieter müssen sich irgendwie finanzieren, wenn sie nicht wie die Wikis von Spenden leben.
  • Die Finanzierung erfolgt regelmäßig über Klickraten, Anzeigen oder den Besuch benachbarter Seiten mit dem eigentlichen Zweck der Veranstaltung.

Wenn wir Archivlinks zu noch erreichbaren Original-URL anbieten, dann führt das dazu, dass Bezahlschranken oder Besuchsfrequenzen umgangen und vermindert werden.

  • Wenn kaum noch jemand die Original-URL besucht, dann hat der Anbieter den Eindruck, dass sich niemand für seine Angebote interessiert, und erstellt auch keine weiteren mehr, und pflegt auch nichts.
  • Wenn Anbieter dahinterkommen, dass Bezahlschranken oder Anzeigen oder Klickraten durch von uns angebotene Archivlinks umgangen werden, dann wenden sie sich an das Archiv und fordern die sofortige Löschung dieser URV. Weil Millionen Dollar bei einer Gerichtsentscheidung drohen, nehmen die Archive in solchen Fällen unverzüglich die gesamte Domain aus dem zugänglichen Archiv.
  • Damit sind nicht nur diese einzelnen Archivlinks in unseren Artikeln sofort tot, sondern auch alle anderen der betroffenen Domains auf wirklich nicht mehr erreichbare Einzelseiten. Für immer.

Die Strategie der enWP ist deshalb hirngeschissener Schwachsinn und bei uns strikt untersagt. Ich habe deine umseitige Einfügung deshalb wieder gelöscht.

  • Im Übrigen sollten derart massive Einfügungen auf Projektseiten zuerst hier auf der Disk vorgeschlagen und zunächst erörtert werden, statt sofort draufloszupreschen.
  • Wenn solche schlauen Tipps nach zwei Jahrzehnten bei uns nirgendwo empfohlen werden, dann wird das Gründe haben.

Nebenbei: In allen Wikipedien wird vollautomatisch jede neu in Artikel eingefügte externe URL an das IA zur Hinterlegung eines aktuellen Schnappschusses gemeldet, bzw. von diesem wird das wahrgenommen und eigenständig veranlasst. Seit mehreren Jahren.

VG --PerfektesChaos 12:02, 25. Sep. 2023 (CEST)Beantworten
Vielen Dank für diese freundlich formulierte ("hirngeschissener Schwachsinn") Erklärung, die ich inhaltlich durchaus nachvollziehen kann. Nur die Aussage, dass von allen neu eingefügten Links automatisch Schnappschüsse erstellt würden, kann ich absolut nicht bestätigen. Mir gammeln oft Links weg, die noch kein Jahr alt sind und von denen ich kein Snapshot finden kann. Gruss --Minoo (Diskussion) 12:14, 25. Sep. 2023 (CEST)Beantworten
Gäbe es für die erwähnten Probleme keine Lösungen? Man könnte ja beide Links (lebend und Archiv) einfügen. Da der Archivlink so langsam ist, wird niemand freiwillig den Archivlink nutzen solange der Link lebt. Der Archivlink könnte auch solange auskommentiert werden. Später können die Bots die toten Links rauslöschen. Gruss --Minoo (Diskussion) 12:26, 25. Sep. 2023 (CEST)Beantworten
  • Automatischer Schnappschuss:
    • Diesen Automatismus gibt es seit Jahren; ob er zwischenzeitlich mal nicht funktionierte weiß ich nicht.
    • Ist jedoch eine globale Funktion aller ANR aller Wikipedien.
    • Der Schnappschuss wird womöglich sofort gemacht, jedoch wegen URV bewusst nicht sofort öffentlich gemacht, sondern erst später.
  • Von vornherein gleich ein Archivlink in unserem Artikel hinterlegen:
    • Auch das wurde bereits vielfach vorgeschlagen und ist trotzdem nicht empfehlenswert.
    • Grund:
      • In den letzten Jahren waren gleich zwei Archivierungsdienste abgeschaltet oder wacklig.
      • Wenn in zehn Jahren die betreffende URL inaktiv wird, dann ist es früh genug, unter den dann verfügbaren Archiven nach einer archivierten Version zu suchen.
      • Es ist derselbe Zeit- und Arbeitsaufwand, ob du das nun ungeduldig gleich heute oder erst in zehn Jahren machst.
      • Ein heute festgestellter Archivlink ist aber ggf. in zehn Jahren unbrauchbar, weil der gesamte Archivierungsdienst nicht mehr existiert, oder weil der Anbieter irgendwann verlangt hat, dass seine Domain nicht mehr gezeigt werden darf.
      • Dann haben wir aber zehn Jahre lang eine kilometerlange URL durch unseren Quelltext mitgeschleppt, die dann am Ende doch nicht funktioniert.
      • Damit keine Klickraten und Bezahlschranken umgangen werden, sind Schnappschüsse teilweise erst nach mehreren Monaten sichtbar. Der Arbeitsaufwand jetzt sofort nach einer archivierten Version zu suchen ist damit für die Katz und sinnlos vergeudete Lebenszeit, die sinnvollerer Verbesserung am Wiki fehlt.
    • Nach dem Archivlink ist erst bei Bedarf (Unerreichbarkeit) unter den dann zukünftig erreichbaren Archivierungsdiensten und Versionen zu suchen.
  • Wir haben zwei Jahrzehnte Erfahrug mit diesen Angelegenheiten, und jetzt spontan mit ganz ganz einfachen Lösungen zu kommen wird nix werden.
VG --PerfektesChaos 12:54, 25. Sep. 2023 (CEST)Beantworten
@Minoo: Ich verstehe Deinen Frust mit den toten Weblinks. Ich gehöre zu den Wikipedianern, die regelmässig Links überprüfen und fixen. Der Aufwand ist sehr gross, die Zeit könnte man für anderes verwenden, wäre das Problem nicht da. Interessant fände ich die Lösung: zuerst die Live-URL, und ganz am Ende der Referenz das Archiv. Sollte die Live-URL kaputt gehen, gibt es noch das Archiv, das die Leser aufrufen können. Die franz. Wikipedia nutzt dies öfters, mit dem Dienst Wikiwix: Beispiel Ref 22. --KurtR (Diskussion) 00:53, 26. Sep. 2023 (CEST)Beantworten
aktive Wiki-Autoren, >1 Edit/Monat
Eher 20 Jahre Erfahrung im Versinken im Chaos.
Die Zahl der Artikel, die gewartet werden müssen nimmt zu (2017 unter 2 Mio Artikel, 2023 ca 2.8 Mio).
Die Zahl der aktiven Wiki-Autoren sinkt. (2017 ca 70 k, 2023 ca. 50 k).
2017 gab es pro Autor rund 28 Artikel. 2023 muss ein Autor schon 56 Artikel warten.
Die Annahme, dass Websites nur alle 10 Jahre aktualisiert werden, trifft vielleicht auf den örtlichen Taubezüchterclub zu, wo der Webmaster noch in HTML programmiert. Tatsächlich sind viele Links jahrelang kaputt, bevor sie geflickt werden. Ich habe schon öfter mehrere Stunden in Linkfixes für einen Artikel gesteckt, nur um beim nächsten Besuch ein Jahr später wieder einen erbaulichen Wartungs-Bot-Eintrag zu sehen. Es gibt Artikel deren Links ich schon zum dritten Mal, vierten Mal fixe, bei sinkender Motivation. Beim Schreiben belege ich oft Aussagen mit mehreren Links, damit ich beim Warten die kaputten einfach wegschmeissen kann. Trotzdem: wer seinen Bereich halbwegs funktional halten will, hat keine Chance. Bisher ist auch nicht aufgefallen, dass eine gute Fee auf wundersame Weise die kaputten Links in meinen Artikeln fixt. Wenn ich das nicht mehr mache, gammeln die Artikel weg. In zehn Jahren ist schlicht niemand da, der meine Artikel fixen wird. Mit jedem Autor, der geht, steigt die Anzahl der Artikel, für die sich keiner zuständig fühlt.
Zu Argumenten vom Typ "2 Zeilen ASCII sind zu viel" schweigt die Höflichkeit. Auch wenn du jeden, der am Status Quo etwas ändern möchte, mit einem Disclaimer-Kasten anschreist, es geht bergab. Gruss --Minoo (Diskussion) 22:50, 25. Sep. 2023 (CEST)Beantworten
Nur zum sagen bei den Nachrichtendiensten werden es immer weniger Links die zu warten sind, siehe [7].--Sanandros (Diskussion) 22:59, 25. Sep. 2023 (CEST)Beantworten
Zwar kriege ich kein so cooles Diff hin, aber 2021 waren es bei den Nachrichtendiensten noch 39 Seiten mit defekten Weblinks, heute sind es 93. Ansonsten ein herzliches Dankeschön an die fleissige Biene, die da in letzter Zeit aufräumt. Beim Reitsport sieht es nicht so rosig aus. Gruss --Minoo (Diskussion) 23:59, 25. Sep. 2023 (CEST)Beantworten
Im Reit- bzw. Rennsport betrifft es doch vorwiegend Pedigrees, dann bring doch die in Ordnung, ist doch überschaubar. Gruß von einem Pferdewirt --Hardcorebambi (Diskussion) 00:55, 26. Sep. 2023 (CEST)Beantworten
Nur zu, viel Spass damit. --Minoo (Diskussion) 16:15, 8. Okt. 2023 (CEST)Beantworten

Und nochmal:

  • Es ist genau der gleiche Arbeitsaufwand, die Archivversion dann zu suchen wenn die URL kaputt ist, oder ungeduldig jetzt sofort damit loszulegen.
    • Nur dass die damals gefundene Archivversion dann, wenn sie wirklich benötigt wird, auch schon wieder futsch sein kann.
    • Oder die URL hält 30 Jahre lang, die Archivversion wird niemals benötigt, und wir haben durch -zig Seitenversionen einen völlig sinnlosen URL-Bandwurm durchgeschleppt.
    • Oder der Absatz samt Aussage und ihrem Beleg wird wieder gelöscht und durch was anderes ersetzt, bevor die Webseite offline ging. Auch dann war der Aufwand für das vorschnelle Suchen nach einer Archivversion komplett vergeudet.
  • Es ist völlig egal ob die englische oder französische WP irgendwelche schlauen Tipps und Praktiken hätten – bei uns ist es unzulässig, Archivversionen im Artikel anzubieten, wenn das Original noch funktioniert, weil dem Anbieter damit Klickraten und Besuche entzogen werden.
  • Die gängigen Archive machen die Inhalte ohne Erlaubnis des Anbieters verfügbar und sind per se illegal. Sie sind deshalb auch keine stabilen Angebote.

Es ist mehr ein psychologisches Problem.

  • Von einem Buch oder einer Zeitschrift waren es die Leute gewohnt, dass sie auf ewig im eigenen Regal oder in irgendeiner Bibliothek verfügbar waren, nachdem Exemplare auf Papier gedruckt wurden und in der Welt verteilt waren.
  • Das ist bei Webseiten fundamental anders.
    • Die von uns benutzten kosten nichts, während irgendwann mal eine Bibliothek ein Buch oder eine Zeitschrift bezahlt hatte, oder die Nationalbibliothek Pflichtexemplare archivierte.
    • Die Anbieter haben weiterhin die Rechte an ihren Seiten.
    • Wir haben ihnen nichts abgekauft und keinerlei Rechte oder Ansprüche.
    • Das Angebot bedarf aktiver Energiezufuhr: Server brauchen Strom, Festplatten müssen alle paar Jahre ausgetauscht werden, Software muss regelmäßig und professionell auf die wachsenden Zugriffszahlen und Internettechniken angepasst werden. Ansonsten, ohne permanente Geld- und Energiezufuhr, ist das futsch.
    • Bibliotheken brauchen alle paar Jahrzehnte Dachdecker und permanente Heiz- und Klimatechnik; eine Serverfarm aber genauso. Das Buch im Regal frisst aber keine Energie und das Ausleihpersonal ist öffentlich bezahlt.
  • Webseiten sind deshalb nur virtuell und ihrer Natur nach vergänglich; statische Text-Inhalte in HTML noch halbwegs robust, Datenbankabfragen jedoch irgendwann unmöglich.
  • Das muss antizipiert werden, wenn mit Publikationen im Internet hantiert wird; es sind nun mal keine auf Papier gedruckten Bücher, und sie haben ihre eigenen Bedingungen, und die können wir mit noch so viel Schlaumeierei auch nicht ändern.
    • Den Wunsch, Webseiten wären auf ewig haltbar wie Papier, kann ich ja durchaus verstehen; sind sie aber nicht und sogar Papier hält nur einige Jahrhunderte.
    • archive.org ist eine private Stiftung, die durch Spenden getragen wird und von der niemand weiß ob sie in einem Jahrzehnt noch existiert. Die anderen sind noch wesentlich wackliger und instabil.
    • Die Überschrift „Vermeiden defekter Weblinks“ spiegelt verständliche jedoch unerfüllbare Sehnsucht wieder.
    • Es gibt für unsere Artikelbearbeitungen nichts zu verbessern; alle Vorschläge sind schädlich oder zumindest kontraproduktiv, verbessern am Ende zumindest nichts. Wenn es eine solch tolle Super-Lösung geben würde, hätten wir sie schon vor Jahrzehnten allgemein empohlen.

VG --PerfektesChaos 12:28, 26. Sep. 2023 (CEST)Beantworten

Grundsätzlich gilt immer der Vorrang des Original-Links. Gründe hat PerfektesChaos weiter oben genannt, die Finanzierung der Original-Domains sollte nicht beschädigt werden. Für Archivlinks nehmen wir den Fair-Use-Ansatz des amerikanischen Rechts in Anspruch. Das erfordert einen sehr sparsamen Einsatz beschränkt auf Fälle wo das nicht vermeidbar ist. Ergänzend hinzuzufügen wäre, dass viel URL sich im Lauf der Zeit ändern. Wenn der selbe Inhalt Jahre später auf der selben Domain unter einem anderen Link zu finden ist, so sollte dieser Inhalt gesucht und entsprechend angepasst werden. Archive-Dienste sind hier eine große Hilfe, da man so den originalen Wortlauf gut vergleichen kann. Und ja, Weblinkwartung ist sehr zeitaufwendig.  Frohes Schaffen —  Defekte URLs - Hilf mit! [​ɪ​​u:] 20:49, 26. Sep. 2023 (CEST)Beantworten
„Die Finanzierung der Original-Domains sollte nicht beschädigt werden“. Ich habe in letzter Zeit vermehrt den Einbau von Archivlinks zum Umgehen von Bezahlschranken bemerkt. Ok oder nicht Ok? Bzw. andere Möglichkeiten? --Pintsknife (Diskussion) 20:57, 26. Sep. 2023 (CEST)Beantworten
Wenn der Anbieter draufkommt, dass es diese Umgehung gibt, dann fordert er das Archiv zum Unterlassen auf, und einen halben Tag später sind alle Archivlinks dieser Domain platt.
Ein verlorenes Gerichtsverfahren kann Dutzende Millionen Dollar kosten, und nach einer einzigen rechtskräftigen Entscheidung wäre archive.org futsch. Mit alles.
VG --PerfektesChaos 21:06, 26. Sep. 2023 (CEST)Beantworten

Änderung des Abrufdatums nach Prüfung der IABot-Meldung?[Quelltext bearbeiten]

Hallo, in einer BD (ab 1. Einrückung) entstand die Frage, ob das Abrufdatum nach positiver Prüfung der IABot-Meldung (d. h., wenn das Memento o. k. ist und die Meldung entfernt werden kann) das ursprüngliche Abrufdatum auf den Tag der Prüfung zu ändern sei.

Aus verschiedenen Gründen habe ich mich dagegen ausgesprochen (Verlust des fundamentalen Bezugslinks; Irrelevanz des Prüfdatums).

Dagegen verwies Nordprinz auf Absatz 4 der Prüfanleitung.

Für den Fall in Absatz 2 ist das korrekt; für Absatz 3 und 4 m. E. aus o. g. Gründen nicht.

Dank für Rückmeldungen, --Wi-luc-ky (Diskussion) 19:06, 27. Feb. 2024 (CET)Beantworten

Hallo,
also ich hätte Absatz 4 der Prüfanleitung so verstanden, dass dabei das Datum der Archivierung gemeint ist. Der Parameter "abruf" der Internetquellenvorlage bezieht sich laut der Anleitung der Vorlage https://de.wikipedia.org/wiki/Vorlage:Internetquelle m.E. auf den Abruf des Originallinks, da ansonsten die Beschreibung in der Anleitung der Vorlage keinen Sinn ergeben würde. Viele Grüße --FunkyLizard (Diskussion) 10:44, 9. Mär. 2024 (CET)Beantworten
Stimme vollständig mit Wi-luc-ky überein und halte die in den o.g. Absätzen 3 und 4 enthaltenen Zusätze, das Abrufdatum auf den Tag der Archiv-Link-Prüfung zu ändern, bestenfalls für einen Copy/Paste-Fehler (eher für <ich sag's lieber nicht>). Der von Nordprinz vorgebrachte Einwand unterliegt meinem Erachten nach einem Denkfehler: Der Archivierungszeitpunkt einer Webseite steht selbstverständlich in keinem Zusammenhang mit dem Datum, wann diese Seite als WP-Beleg "abgerufen" wurde. Häufig wird wohl das Abrufdatum vor dem Archivierungsdatum liegen; das muss aber nicht sein. Eine Belegdarstellung „[...], 30. Mai 2017, archiviert vom Original am 7. Juni 2019; abgerufen am 31. Dezember 2023“ ist daher nicht „merkwürdig“ sondern entspricht halt den Gegebenheiten des Umgangs mit diesem Beleg an dieser Stelle.
Und weiter: Das Datum, wann der Archiv-Link möglicherweise geprüft wurde, ist – wie oben dargestellt – irrelevant; daher ist hierfür der Abruf-Parameter nicht zu missbrauchen.
Nebenbei: Wer die Beleg-Darstellung missverständlich findet, sollte einfach das eh im Archiv-Link enthaltene Archivierungsdatum nicht angeben. Damit verkürzt sich obiges Beispiel auf: „[...], 30. Mai 2017, archiviert vom Original; abgerufen am 31. Dezember 2023.“ Ich verfahre häufig so und setze den Parameter archiv-datum nur in Ausnahmefällen... Hab ich was übersehen? LG, --rolf_acker (Diskussion) 14:31, 17. Apr. 2024 (CEST)Beantworten
Danke für die beiden Rückmeldungen. Auch nach zwei Monaten erscheint mir eine Änderung nötig. Die jetzigen Formulierungen in der fraglichen Sache machen für mich keinen Sinn.
Zwei Vorschläge:
  • In Absatz 3 letzten Satz ersatzlos streichen: „Bitte denke daran, das Zugriffsdatum des Links zu aktualisieren, sofern vorhanden.“
  • In Absatz 4 letzten Satz am Ende umformulieren: „Falls dies der Fall ist, ersetze bitte den Archivlink, entferne wie unten beschrieben die Archivbot-Markierung und aktualisiere ggf. das Mementodatum.“
Damit ist sowohl das Mementodatum erwähnt (lt. FunkyLizard) als auch seine Erwähnung freigestellt (lt. rolf_acker).
  • Ich selbst würde das Mementodatum zwar immer angeben; aber wer es genau wissen will, kann das Datum ja schnell über ein Mouseover ersehen.
@Nordprinz: FYI.
Gruß, --Wi-luc-ky (Diskussion) 19:10, 17. Apr. 2024 (CEST)Beantworten

Wir haben nirgendwo eine Richtlinie, die zum Abrufdatum definieren würde,

  • zu welchen Zwecken es dienen soll,
  • in welchen Fällen es überhaupt erforderlich ist, und wo es überflüssig ist,
  • unter welchen Umständen es aktualisiert werden könne;
  • Spoiler: bei unveränderlichen Inhalten (Reproduktion von Druckwerken) auf wohlbekannten großen Websites ist es immer Nonsens und soll nicht angegeben werden.

Ein rein technischer erfolgreicher Abruf (Erreichbarkeit der URL) erlaubt keine Veränderung des Abrufdatums.

  • Erforderlich ist eine inhaltliche Prüfung, ob der angebotene Inhalt zu unserem Bedarf passt, namentlich als Beleg einer enzyklopädischen Aussage.

Nun sagt umstehend ja, dass die vom Bot empfohlene Archivversion durch Menschen geprüft werden soll, ob der Inhalt auch derjenige ist, der von uns erwartet wird.

  • Damit wäre eine Aktualisierung des Abrufdatums auf heute bei der Bestätigung durch Entfernen der Bot-Signatur legitim.
  • Steht bloß nirgendwo in den sonstigen Richtlinien, wie das gehahandhabt werden soll.
  • Steht aber auch nirgends, dass dies unerlaubt sei.

VG --PerfektesChaos 21:56, 17. Apr. 2024 (CEST)Beantworten

Sodele, Fortsetzung nach Drüberschlafen:
  • Auch wenn es nirgendwo festgeschrieben wurde:
    • Zweck des Abrufdatums ist es, bei veränderlichen Inhalten einer Seite in Web-Archiven einer ähnlichen Darstellung möglichst nahe zu kommen.
      • Bei unveränderlichen Inhalten (Reproduktion von Druckwerken) mag es in Organisation und technischer Aufbereitung im Lauf der Zeit Verbesserungen geben, aber bei einer seriösen und von uns häufig verlinkten Website sind alle Versionen gleichberechtigt, und die jüngste ist vermutlich die beste. Das Abrufdatum ist dann überflüssig und verwirrend.
      • Bei unvorhersagbaren Inhalten ist ein Abrufdatum sinnlos. Das betrifft:
        • Alle Google-Resultate, weil diese ggf. nach Verhalten des momentan abrufenden Endgerätes individuell generiert werden, und Google auch juristisch blockiert, dass Kopien in Web-Archiven hinterlegt werden.
        • Alle Suchergebnisse des Internet, auch sonst in dynamischen Katalogen, weil diese sich permanent ändern. Ohnehin vermeiden Web-Archive, dass sie überhaupt deren Datenbasis mit Millionen von Suchergebnissen vollmüllen.
        • Seiten, die überhaupt nicht als inhaltsgleiche Publikation konzipiert wären. Das sind:
          • „Homepage“
          • „Aktuelle Pressemitteilungen“ – hier müsste eher das Herausgabedatum der Pressemitteilung dokumentiert werden (falls vorhanden), als dass das Abrufdatum maßgeblich sei
          • „Meldung des Tages“
    • Sinnvoll ist das Abrufdatum dann, wenn eine Publikation nicht versioniert ist (nicht datiert), nicht dauerhaft ist, und die Inhalte legitim immer mal wieder aktualisiert werden könnten, und womöglich unbemerkt verändert werden.
  • Was folgt daraus im Sinne dieses Abschnitts?
    • Das bei ursprünglicher Einsichtnahme der Original-URL verwendete Abrufdatum mag bestehen bleiben.
    • Das Datum, an dem der Web-Krabbler des Archivs die Original-URL besucht hatte, ist ein legitimes Abrufdatum, wenn danach von Menschen geprüft wurde, dass diese Version inhaltlich zu dem von uns dargestellten Kontext passt.
    • Das Datum von jetzt gerade „heute“ ist verkehrt (sofern nicht mit den vorgenannten zusammenfallend).
    • Zur Einfachheit: Das frühere (allererste oder spätere) Abrufdatum einer Einsichtnahme in die Original-URL mit inhaltlichem Abgleich sollte schlicht bestehen bleiben.
    • Wenn fehlend, darf das Web-Krabbler-Auslesedatum nach inhaltlichem Abgleich dieser Archiv-Version nachgetragen werden.
VG --PerfektesChaos 12:42, 18. Apr. 2024 (CEST)Beantworten