Benutzer Diskussion:CamelBot/maintenance list/self-ref

aus Wikipedia, der freien Enzyklopädie
Letzter Kommentar: vor 1 Jahr von Leyo in Abschnitt Whitelist
Zur Navigation springen Zur Suche springen

archiv unter user talk:lustiger seth/archiv/bot/self-ref

was der bot erkennt

[Quelltext bearbeiten]

Perlen der sinnbefreiten Belege

[Quelltext bearbeiten]

Besonders skurril: die Diskseite eines Artikels der slowenischen Wikipedia als Beleg. Datei:Smiley emoticons doh.gif --Sam Lowry (Diskussion) 00:29, 29. Apr. 2017 (CEST)Beantworten

Wie sieht es mit Wikinews aus?

[Quelltext bearbeiten]

Wikinews: takeover of Rabbitohs ist so etwas als Einzelnachweis zulässig? --Liebe Grüße, Lómelinde Diskussion 08:33, 12. Mai 2017 (CEST)Beantworten

Oder mit Belegen durch Commonskategorien? Wie hier Christoph Peucker für Denkmalschutz. --Liebe Grüße, Lómelinde Diskussion 06:17, 20. Mai 2017 (CEST)Beantworten
gudn tach!
ich denke, es ist besser, solche fragen auf WD:BLG zu klaeren. -- seth 12:42, 20. Mai 2017 (CEST)Beantworten
Ach, so wichtig ist es nicht. Meine Edits sind eh bei manchen unbeliebt. --Liebe Grüße, Lómelinde Diskussion 13:21, 20. Mai 2017 (CEST)Beantworten

Parameter Online

[Quelltext bearbeiten]

insource:/Online *= *https?\:\/\/[a-z]{2,3}.wikipedia.org/ findet immerhin 149 Artikel. Allenfalls könnte dieser Typ auch berücksichtigt werden. --Leyo 11:51, 30. Mai 2017 (CEST)Beantworten

Ich schaue es mir mal an, scheint ja so als hättest du Vorlage:Literatur abgefragt. Es gibt aber sicherlich weit mehr. 2000+. --Liebe Grüße, Lómelinde Diskussion 15:27, 30. Mai 2017 (CEST)Beantworten
Es sind etliche Falsch-Positive darunter (aber bestimmt auch mehr echte Treffer). --Leyo 15:43, 30. Mai 2017 (CEST)Beantworten

@Lustiger seth: Wie stehst du zu meinem Vorschlag? --Leyo 11:26, 6. Jun. 2017 (CEST)Beantworten

gudn tach!
sorry fuer die spaete antwort. ja, koennen wir mal ausprobieren. am wochenende sollte ich zeit haben, das einzubauen. -- seth 22:19, 7. Jun. 2017 (CEST)Beantworten
bisher habe ich das mit leerzeichen drin: " Online=", ich werde es mal ausprobieren mit "leerzeichen oder pipe-symbol" und hoffe, dass das dann immer noch funzt. -- seth 12:00, 11. Jul. 2020 (CEST)Beantworten
scheint zu funktionieren: [1]. hoffen wir mal, dass es keine false positives gibt. -- seth 12:53, 11. Jul. 2020 (CEST)Beantworten
Besten Dank! --Leyo 21:48, 11. Jul. 2020 (CEST)Beantworten

Benutzer/Beleg/Mail?

[Quelltext bearbeiten]

Was machen wir mit Benutzerbelegen? --Liebe Grüße, Lómelinde Diskussion 11:33, 8. Jun. 2017 (CEST)Beantworten

Löschen, das ist purer TF (Aussagen, die nur auf persönlichen Erkenntnissen von Wikipedia-Autoren basieren, gehören nicht in die Artikel.) und Original Research. I think my pig is whistling... --Informationswiedergutmachung (Diskussion) 12:39, 8. Jun. 2017 (CEST)Beantworten
gudn tach!
meines erachtens sollte das, was auf der user page ist, auf die diskussionsseite des artikels. man kann dort darueber diskutieren und ggf. massnahmen fuer den artikel ergreifen. aber im main namespace sollte nicht darauf verlinkt werden.
der gag ist, wenn der e-mail-verkehr nicht in der wikipedia gepostet worden waere, sondern auf einem blog, dann waere er evtl. sogar als beleg akzeptiert worden. das ist ein ungeloestes problem gerade in solchen faellen, in denen die beleglage sehr schlecht ist, die relevanzhuerde nur knapp geschafft ist. -- seth 00:14, 9. Jun. 2017 (CEST)Beantworten
Das ist kein Gag, sondern so, wie die Wikipedia arbeitet. Und es ist kein ungelöstes Problem: WP:Belege Artikel sollen nur überprüfbare Informationen aus zuverlässiger Literatur enthalten. Unveröffentlichter (oder nur hier) E-Mail-Verkehr ist nun mal keine überprüfbare Information. Blogs sind im übrigen und üblicherweise keine zuverlässige Literatur. --Informationswiedergutmachung (Diskussion) 00:20, 9. Jun. 2017 (CEST)Beantworten
doch, ich sehe darin ein ungeloestes problem, auch wenn ich an einigen der richtlinien mitgeschrieben habe.
ueber einige themen, die WP:RK erfuellen, findet man nur sehr schwer informationen. ueber manche RK erfuellenden promis wird beispielsweise nur in boulevard-medien geschrieben und jene sind nun mal nicht gerade fuer ihre hohe zuverlaessigkeit bekannt. "ueberpruefbar" ist hier also sehr dehnbar. es gibt durchaus blogs, die zuverlaessiger sind als die bildzeitung.
interviews gehoeren ebenfalls zu problemfaellen. wenn jemand wp-relevantes in einem interview ein detail erzaehlt, das er sonst nirgends erwaehnte, und wenn dieses interview nun auf einem privaten hinterwaeldler-blog auftaucht: wie geht man damit um? eine moeglichkeit waere, selbst herauszufinden, ob das interview echt ist, indem man den interviewten anschreibt. das muesste jedoch jemand vertrauenswuerdiges machen, denn sonst koennte ja jeder kommen. dieses vorgehen grenzt wohl schon an WP:NOR und waere ja so aehnlich wie das, was hier abgelaufen ist.
ein anderes vorgehen ist, dieses detail aus dem interview einfach nicht im artikel aufzunehmen. das koennte jedoch bedeuten, dass vielleicht eine fuer die person wichtige information in der wikipedia nicht drinsteht. im extremfall kann dies eine information sein, die eine person ueberhaupt erst wp-relevant macht. dann beisst sich die katze in den schwanz. -- seth 18:46, 10. Jun. 2017 (CEST)Beantworten

Ernst Ziller

[Quelltext bearbeiten]

Ich bitte darum, dass sich jemand anderes diesem Fall annimmt, ich habe nicht vor mich von sturen Verfechtern ihrer Einzelmeinung verunglimpfen oder beschimpfen zu lassen. Leserinformation? Zitat: „Bitte mal Richtlinie durchlesen und verstehen, dass sie keinen Gesetzescharakter haben. An der Stelle kannst du dann auch noch über meine Aussage zum Nutzen für den Leser nachdenken. Schema F passt nicht überall.“ Manche hier sind eben immer gleicher als andere und für diese haben Richtlinien lediglich Bevormundungscharakter. Ich habe es zweimal versucht Informationswiedergutmachung auch, aber wo kein Wille ist, muss ich passen, die Gefahr ist mir zu groß. Aber ehrlich, wer kann mit Links auf griechische Seiten hier etwas anfangen? Genau das ist es was ich meinte, es wäre wichtig wenn man feste Regelungen hätte, die dann auch bindend wären. Es macht eh jeder so wie es ihm beliebt. Ich führe keinen Krieg gegen Uneinsichtigkeit. --Liebe Grüße, Lómelinde Diskussion 13:18, 21. Jun. 2017 (CEST)Beantworten

Solange hier ein paar Regelmißachter hofiert werden bzw. ihnen man erlaubt nach ihrer Willkür zu walten (trotz Hinweis auf die Regeln), werde ich mich hier verabschieden, denn dann fühle ich mich völlgi verarscht. @Artregor: Zur Kenntnis, du hattes den Artikel gesperrt. Ich nehme den Bot von meiner Beo, wer mir was zu sagen hat: ping. MfG --Informationswiedergutmachung (Diskussion) 13:25, 21. Jun. 2017 (CEST)Beantworten
Oh nein, ich möchte das nicht allein anpassen, dann lasse ich das ach, das wird mir wirklich langsam zu gefährlich. Ich nehme diese Seite auch von der BEO. Es ist einfach nur schade, dass es Leute gibt die alles dürfen weil es ihnen so besser gefällt, erst kommen sie und dann lange nichts mehr. Schade, ich habe gern hier ausgeholfen, weil ich das für sehr sinnvoll halte, aber nicht so. Sorry. --Liebe Grüße, Lómelinde Diskussion 13:57, 21. Jun. 2017 (CEST)Beantworten
Solange Regelhuber dies hier als Anlass nehmen, in Exzellenzartikeln ohne Ansprache des aktiven Hauptautoren (87%) herumzueditieren, muss man sich wirklich nicht mehr wundern. --Jbergner (Diskussion) 15:15, 21. Jun. 2017 (CEST)Beantworten
Mir ist völlig egal, ob ein Artikel exzellent ist oder nicht. Mir ist auch egal, ob der Autor aktiv ist oder nicht. Ich bin also ein Regelhuber und Jbergner kennt sie nicht. Nur beschimpfe ich nicht die Leute, die sich an die Regeln halten. Wenn einem Benutzer eine Regel nicht paßt, dann sollte er das auf der Regelseite diskutieren und nicht andere quer von der Seite anreden. Und außerdem brauchte man Jbergner ja nicht ansprechen, als aktiver Autor hat er das ja sofort gesehen. Und hier gibt es keine Sonderregel Sprich den Hauptautor eines exzellenten Artikels an, wenn du ihn änderst. Diese Regel wäre mir neu. --Informationswiedergutmachung (Diskussion) 15:16, 27. Jun. 2017 (CEST)Beantworten
nach kompromiss (ebenfalls noch im juni 2017) vermutlich erledigt. -- seth 12:59, 11. Jul. 2020 (CEST)Beantworten

Kunst und Künstler

[Quelltext bearbeiten]

Bei Kunst und Künstler möchte ebenfalls ein Benutzer die Regeln nicht akzeptieren. --Leyo 11:40, 11. Jul. 2017 (CEST)Beantworten

Bei Medea stehe ich auch alleine... Nun ja... --Informationswiedergutmachung (Diskussion) 12:44, 11. Jul. 2017 (CEST)Beantworten
scheint sich beides erledigt zu haben. -- seth 13:04, 11. Jul. 2020 (CEST)Beantworten

Theo Saevecke

[Quelltext bearbeiten]

Einen Admin revertiere ich nicht. Sorry, aber das muss jemand anderes machen. Ich meine, dass Nichtcommonsbilder auch nicht verlinkt werden sollten, sonst wären sie ja auf Commons, wenn sie frei wären, oder? --Liebe Grüße, Lómelinde Diskussion 19:44, 27. Jul. 2017 (CEST)Beantworten

hat sich anscheinend erledigt. uebrigens: unabhaengig davon, ob bilder (lizenztechnisch) frei sind, koennen sie als beleg herangezogen werden. -- seth 13:05, 11. Jul. 2020 (CEST)Beantworten

Problem VisualEditor

[Quelltext bearbeiten]

Der VisualEditor scheint gegen Wikipedia:Belege#Wikipedia ist keine Quelle verstossende Einzelnachweise geradezu zu fördern (aktuelles Beispiel). Hat jemand eine Idee, wie man da vorgehen könnte? VisualEditor ändern? Bearbeitungsfilter? …? --Leyo 14:48, 8. Nov. 2017 (CET)Beantworten

Wikipedia:Technik/Text/Edit/VisualEditor/Rückmeldungen/Archiv/2#Verstösse gegen WP:WPIKQ werden gefördert
@Lustiger seth: Wie siehst stehst du dazu, die automatische Generierung von Einzelnachweisen aus WP-URLs mittels Bearbeitungsfilter abzufangen (warnen oder verbieten)? --Leyo 02:01, 4. Jul. 2020 (CEST)Beantworten
gudn tach!
ich antworte dort. ach so, geht ja nicht, weil archiviert. also dann:
ich finde, sowas sollte direkt im VisualEditor abgefangen werden, um dem autor sofort feedback zu geben. evtl. macht es sinn dafuer ein ticket im phabricator zu oeffnen.
durch meine heutige aenderung in camelbot (die ich nur rund 3 jahre nach deiner anfrage umsetzte, sorry), wuerden solche faelle zumindest auch in der umseitigen liste gesammelt und der user wuerde auf seiner talk page darauf hingewiesen.
das edit filter wuerde ich bei sowas ungern nutzen, weil verhinderte edits die altbekannten nachteile haben (1. frust bei den autoren; 2. uns gehen evtl. wichtige infos verloren). dann lieber nachtraeglich die belege entfernen (falls es die user nicht selbst machen). -- seth 13:34, 11. Jul. 2020 (CEST)Beantworten
Nun ja, es gibt ja auch die Möglichkeit zu warnen (und nicht zu verbieten). Ein Phabricator-Ticket um das durch den VisualEditor abzufangen wäre sicher sinnvoll, aber dort kenne ich mich leider gar nicht aus. Ich wäre dir daher dankbar, wenn du dies übernehmen könntest. --Leyo 21:54, 11. Jul. 2020 (CEST)Beantworten

Halbautomatische Entfernungen

[Quelltext bearbeiten]

Die Einzelnachweise fremden Wikipedia-Artikeln als Belege können unter anderem so halbautomatisch erfasst und entfernt werden. Die Liste darf gerne ergänzt werden. --Leyo 00:46, 10. Apr. 2018 (CEST)Beantworten

  • \<ref\>\[\[:[^\>]+\> → (leer)
gudn tach!
vermutlich eher
<ref>\[\[:[^/>]+/?> → (leer)
wenn man von pcre ausgeht, oder?
aber unabhaengig davon koennte das in einzelfaellen nachhinten losgehen, z.b. wenn so auf ein bild referenziert wird. da waere ja die bessere loesung, das bild als bild einzubauen und dann im text eben darauf zu verweisen. -- seth 17:24, 11. Jul. 2020 (CEST)Beantworten

was ist mit w:?

[Quelltext bearbeiten]

Es gibt etliche Seiten die scheinbar nicht erfasst werden weil dort bewusst oder unbewusst diese Form versendet wird.

Ist mir nur wieder einmal aufgefallen, wieviele davon auskommentiert sind weiß ich nicht. --Liebe Grüße, Lómelinde Diskussion 11:31, 16. Mai 2018 (CEST)Beantworten

Die Artikel werden nur bei einer Änderung angeschaut. --Leyo 14:45, 13. Jun. 2018 (CEST)Beantworten
Beispielsweise bei Cölestina war dies jedoch der Fall und der Artikel hätte auf der Vorderseite aufgeführt werden müssen … --Leyo 11:16, 29. Mai 2020 (CEST)Beantworten
Ob dein Ping auch bei dem wahren seth angekommen ist? Im BK steht zumindest ein roter Seth ein lächelnder Smiley  Wo mir so etwas auffällt, ersetze ich es, aber ich habe so viel anderes um die Ohren, dass ich nicht gezielt danach suche und auch schon seit einer Ewigkeit nichts mehr von der Vorderseite bereinigt habe. --Liebe Grüße, Lómelinde Diskussion 11:27, 29. Mai 2020 (CEST)Beantworten
gudn tach!
der ping kam nicht an. der von Lómelinde dann schon, danke.
diese w:..-links, sollten eigentlich erkannt werden. bei Cölestina sehe ich nicht, dass kuerzlich solch ein link hinzugefuegt wurde.
er wurde dort wohl 2012 hinzugefuegt.[2] da CamelBot (bzgl. der meisten aenderungen) nur auf den RCs lauscht und normalerweise nicht aktiv sucht, bekam er das nicht mit. -- seth 22:15, 29. Mai 2020 (CEST)Beantworten

Verschiebungen aus BNR

[Quelltext bearbeiten]

Könnte CamelBot ggf. auch bei im BNR vorbereiteten Artikelentwürfen tätig werden und die Benutzer bezüglich der Selbstreferenz benachrichtigen, sobald die Entwürfe in den ANR verschoben werden. Ein aktuelles Beispiel ist Cornelia Bitsch. --Leyo 11:08, 29. Mai 2020 (CEST)Beantworten

gudn tach!
eigentlich wuerde der bot das bereits machen. bei Cornelia Bitsch hat der bot lediglich die selbstreferenz nicht erkannt, weil er vor dem "Online"-parameter (des literatur-templates) ein leerzeichen erwartete. das habe ich ihm offenbar falsch beigebracht. werde ich in kuerze korrigieren, damit er sowas erkennt.
danke fuer den hinweis! -- seth 22:24, 29. Mai 2020 (CEST)Beantworten
Bei FC La Walck wurde die Selbstreferenz bei der Verschiebung in den ANR erkannt, aber der Benutzer nicht benachrichtigt. Ich fände es sinnvoll, wenn dies auch in solchen Fällen erfolgen könnte. --Leyo 15:22, 5. Jun. 2020 (CEST)Beantworten
gudn tach!
das betrifft aber nur diese spezialfaelle, wo ein user vom user namespace in den main namespace verschiebt, oder? denn bei einer verschiebung innerhalb des main namespace wuerde sich der verschieber ueber die beachrichtung zumindest wundern -- vielleicht sogar aergern. -- seth 23:22, 5. Jun. 2020 (CEST)Beantworten
Ja, natürlich nicht für Verschiebungen innerhalb des ANR. Es geht darum, im BNR erstellte und anschliessend in den ANR verschobene Artikel zu erfassen. --Leyo 23:25, 5. Jun. 2020 (CEST)Beantworten
ok, ich habe mir ein issue dafuer erstellt und muss mir jetzt nur noch irgendwann die zeit nehmen, das umzusetzen. -- seth 10:08, 7. Jun. 2020 (CEST)Beantworten

2-Euro-Gedenkmünzen

[Quelltext bearbeiten]

@Lustiger seth:: ich habe jetzt zwar einige Selbstreferenzen rausgeworfen, bin mir aber nicht sicher, ob das alles war. Bei derzeit 1.358 Einzelnachweisen ist das auch nicht möglich bzw. geht das per Bot schneller? MfG --Jack User (Diskussion) 13:15, 8. Dez. 2020 (CET)Beantworten

gudn tach Jack User!
du hast anscheinend alle von camelbot detektierten selbst-refs erwischt, denn etwas spaeter hat camelbot die seite wieder von der wartungsliste genommen, siehe [3].
ich gehe normalerweise so vor, dass ich bei den artikeln nach [[: und wikipedia.org suche. damit findet man die stellen meist schnell. in diesem fall haette das noch nicht so viel gebracht, weil es viele einbindungen der art [[:Datei... gab. in einem solchen fall nehme ich dann einen externen editor (gvim) und suche dort per regulaerem ausdruck -- konkret /\[\[:[^D]\|wikipedia\..
aber stimmt, ich koennte camelbot vielleicht noch eine dritte spalte in der wartungsliste anlegen lassen, in der er zumindest die erste fundstelle angibt, damit man einen anhaltspunkt hat, wonach man suchen soll. ich notier's mir als todo, werde es aber aus zeitgruenden nicht so bald einbauen.
danke fuer den hinweis! -- seth 23:28, 8. Dez. 2020 (CET)Beantworten
Davon abgesehen: warum entfernt der Bot die Selbsreferenzen nicht gleich selber? --Jack User (Diskussion) 11:53, 9. Dez. 2020 (CET)Beantworten
@Lustiger seth: Und, beste Idee: man setzt gleich alle Sprachversionen auf die SPAM-Blacklist, dann muss auch nicht mehr hinterhergeräumt werden. --Jack User (Diskussion) 13:41, 9. Dez. 2020 (CET)Beantworten
gudn tach!
selbstreferenzen sollten nicht immer einfach nur geloescht werden, sondern es sollte mit augenmass geschaut werden, was die jeweilige selbstreferenz bezwecken soll. in einigen faellen sollte einfach ein bestehender artikel nicht als referenz angegeben, sondern lediglich verlinkt werden.
die spam-blacklist hat den nachteil, dass sie manche leute, die technisch nicht so bewandert sind, abschreckt ihren edit zu ueberarbeiten und dann abzuspeichern. in der folge waeren diese leute dann genervt und uns wuerde vielleicht eine sinnvoller ergaenzung verloren gehen. deswegen sollte die spam-blacklist moeglichst nur in bestimmten faellen benutzt werden. -- seth 00:06, 10. Dez. 2020 (CET)Beantworten
In der dritten Spalte könnte ggf. der relevante Difflink angegeben werden. Das würde auch beim Suchen helfen. --Leyo 14:28, 14. Dez. 2020 (CET) PS. Hast du eigentlich etwas geändert? In den letzten Tagen scheinen besonders viele Artikel gefunden zu werden …Beantworten
gudn tach!
sorry fuer die spaete antwort. (am besten mich immer anpingen.)
zum PS: ich glaube nicht. ich habe anscheinend 2020-12-06 eine aenderung vorgenommen und dann erst wieder einen monat spaeter.
dritte spalte: klingt sehr sinnvoll, hab mir's notiert, weiss jedoch noch nicht, wann ich dazu komme. -- seth 00:09, 21. Mär. 2022 (CET)Beantworten

Änderungsprotokoll

[Quelltext bearbeiten]

Wie sollen wir diesen Fall handhaben? --Leyo 14:46, 18. Jan. 2022 (CET)Beantworten

gudn tach!
hmm, idealerweise wuerde man den satz ueber sekundaerliteratur belegen und braeuchte dann keinen internen link auf meta-seiten. -- seth 00:01, 21. Mär. 2022 (CET)Beantworten
[Quelltext bearbeiten]

Sollte in begründeten Fällen ein Link auf die Hauptseite einer anderen Wikipedia-Sprachversion nicht erlaubt sein? Beispiel: Kaschuben#cite ref-11 --Leyo 16:41, 16. Mär. 2022 (CET)Beantworten

gudn tach!
doch ja, da finde ich eine verlinkung auf jeden fall sinnvoll. aber ich wuesste nicht, wie ich das dem bot beibringen koennte. -- seth 00:12, 21. Mär. 2022 (CET)Beantworten
Hm, allenfalls könnte sich eine Whitelist (wie z.B. da) anbieten. --Leyo 00:39, 21. Mär. 2022 (CET)Beantworten
eine whitelist waere kein problem. das habe ich vorgesehen. da stehen auch schon ein paar artikel drauf.[4] soll ich da auch den artikel "Kaschuben" draufsetzen? -- seth 00:59, 21. Mär. 2022 (CET)Beantworten
Es stellt sich die Frage, ob man Artikel als Ganzes whitelisten sollte oder nur bestimmte Weblinks.
Allenfalls wäre auch eine von Sichtern bearbeitbare Unterseite als Whitelist möglich. --Leyo 10:30, 21. Mär. 2022 (CET)Beantworten
gudn tach!
zu beiden punkten: das muesste ich halt erst noch dem bot beibringen (was ein zeitproblem ist). vorerst habe ich "Kaschuben" auf die interne whiteliste fuer selbst-referenzierungen gesetzt. -- seth 22:04, 21. Mär. 2022 (CET)Beantworten

Camelbot, Selbstreferenzen

[Quelltext bearbeiten]

Hierher verschoben von User talk:Lustiger seth#Camelbot, Selbstreferenzen, vergleiche zuletzt Spezial:PermaLink/221993129.

---Beginn Kopie---

Hallo, wegen der Wikimedia-Selbstreferenzen (Bezug auf dein Spezial:Diff/221876319, mein Spezial:Diff/221901134//221901389 und zuletzt dein Spezial:Diff/221904478):

„das mit den sprachkuerzeln ist ja ganz schoen doof.“ Find ich auch.

(Zu d:Wikidata:Database reports/Wikipedia versions):

„es gibt auch "tokipona", "be_x_oldwiki" und "zh-min-nan", wobei "be_x_oldwiki" so klingt, als brauche man es nicht zu beruecksichtigen.“

be_x_oldwiki kann tatsächlich ignoriert werden, denn der Domainname dazu ist be-tarask, vergleiche rechte Spalte der Tabelle auf Wikidata. Und tokipona ist tot, wurde 2009 wieder geschlossen (siehe auch Referenzen). Also muss man nur Bindestrichdomains beachten. Wenn man diese nicht explizit vorgeben will, ginge evtl. diese Regex (?):

  • Für Zeile 4078 und 4082, nur der Teil für die lokale Sprachen-Subdomain: [a-z]{2,3}(?:-[a-z]+){0,2}.
  • Für Zeile 4080 mit Berücksichtigung des eigentlich unsauberen, aber möglichen Doppelpunkts zu Beginn: \[\[(?::?w)?:[a-z]{2,3}(?:-[a-z]+){0,2}:(?!s:)|. Für Zeile 4081 dementsprechend \[\[:?w:(?!s:).

Ich hoffe, ich hab das mit den non-capturing groups hinbekommen. Wieso wird in Zeile 4082 der Online-Parameter von {tl|Literatur}} ausgewertet, aber nicht der url-Parameter von {{Internetquelle}} und {{Cite web}}?

„und dass fr:foo anders behandelt wird als zz:foo, weil es fr.wikipedia.org gibt, aber zz.wikipedia.org nicht, macht das ganze ebenfalls schwierig.“

Dazu kann ich dann nichts sagen. Wo ich aber ein potentielles Problem sehe: Man kann ja auch Anmerkungen mit Referenztags setzen, und dort sollten interne Links möglich sein, wenigstens als Wikilink („Siehe auch  …“). Ich habe letztens erst solch eine Seite bearbeitet, die relativ viel solcher Links besaß, ich finde sie jetzt gerade leider nicht. Wenn also eine Referenz einer bestimmten Gruppe zugehört, müsste der Bot sich zurückhalten. Ich weiß nur nicht, ob es sinnvoll, die möglichen Gruppen fest vorzugeben. Das provoziert doch Ärger.— Speravir – 01:03, 10. Apr. 2022 (CEST)Beantworten

Ich habe Spezial:Diff/221935979 zu spät bemerkt. — Speravir – 01:06, 10. Apr. 2022 (CEST)Beantworten
gudn tach!
  • tokipana: ah, ok, aber "simple" gibt's noch. das ist dann allerdings gemaess der oben verlinkten seite die einzige sprache, die aus dem schema herausfaellt. irgendwie dachte ich, gestern auch noch sowas wie "barwiki" fern der ersten spalte gelesen zu haben, aber dabei irrte ich wohl.
  • als regexp pattern koennte ich also (?:[a-z]{2,3}(?:-[a-z-]+)?|simple) nehmen, oder spezieller (?:[a-z]{2,3}(?:-[a-z]+)?|simple|zh-min-nan) oder analog zu dem von dir genannten pattern: (?:[a-z]{2,3}(?:-[a-z]+){0,2}|simple)
  • zu zeile 4080: mir hat die alte (teilredundante) formulierung da eh nicht gefallen, weshalb ich das gestern umformulierte. bei den sprachversionen brauche ich eigentlich nicht nach "(:?w)?" vorher schauen, sondern kann es sollte reichen, nach \[\[:$sprachversionspattern zu suchen. denn wenn irgendwas mit \[\[:w: anfaengt, ist eh klar, dass es eine selbstreferenz ist. daher nutze ich aktuell: \[\[(?::?w|:$sprachversionen):(?![cs]:)
  • literatur, internetquelle, cite web: "online=" hab ich 2017-06-10 eingebaut, vermutlich wegen user talk:CamelBot/maintenance_list/self-ref#Parameter_Online. um andere templates hatte ich mich da nicht gekuemmert. ich kann das aber auch gerne mal um "url=" erweitern. vorher muesste sich dafuer aber jemand mal die bisherigen treffer genauer anschauen.
  • ausnahmen: ja, die sollte man (nach und nach) aufnehmen -- oder man laesst das zumindest mit der benachrichtigung sein und fuehrt nur eine wartungsliste, die es den abarbeitenden ueberlaesst, wie sie damit umgehen.
  • aber eigentlich ist es ohnehin noch viel schlimmer: doi:foo, dcc:bar, git:baz, mw:quux, rt:quuux (siehe special:interwiki)
-- seth 12:42, 10. Apr. 2022 (CEST)Beantworten
gudn tach!
@Speravir, @Leyo: ich hab jetzt (seit 22:38) trotzdem schon mal die verbesserungen, die ich die letzten tage eingebaut hatte, aktiviert. die erkennung von selbstreferenzen sollte jetzt deutlich besser sein. verweise auf wikipedia-dateien wie sowas sollten jetzt ignoriert werden. dafuer werden refs mit zusaetzlichen attributen nicht mehr ignoriert.
wenn euch noch neue fehler auffallen, nennt mir gerne einfach den difflink, dann versuche ich camelbot anzupassen. -- seth 22:56, 10. Apr. 2022 (CEST)Beantworten
Danke! Aus meiner Sicht sollten Verlinkungen der folgenden Typen gelistet werden:
  • https://commons.wikimedia.org/wiki/File:… (gilt auch für alle Wikipedia-Sprachversionen)
  • [[c:File:…]], [[commons:File:…]] und ähnlich
  • upload.wikimedia.org/…
Bei Commons-Dateien sind m.E. Links auf die lokalen Dateibeschreibungsseiten vorzuziehen. --Leyo 23:22, 10. Apr. 2022 (CEST)Beantworten
ach so. und sollen da die leute auch benachrichtigt werden? -- seth 23:42, 10. Apr. 2022 (CEST)Beantworten
Hm, ich denke, bei diesen Fällen könnte auf eine Benachrichtigung verzichtet werden, da der Text ja nicht ganz passt.
Falls dein Bot Benutzer:CamelBot/upload links künftig regelmässig aktualisiert, kann der letzte Typ bei Benutzer:CamelBot/maintenance list/self-ref auch weggelassen werden. --Leyo 23:50, 10. Apr. 2022 (CEST)Beantworten
wenn die benachrichtigungen wegfallen sollen, wuerde ich eh eine neue liste generieren, z.b. user:CamelBot/maintenance list/commons-ref. da kann ich dann die von dir genannten link-sorten eintragen lassen.
user:CamelBot/upload_links hatte ich nur manuell angelegt. -- seth 00:13, 11. Apr. 2022 (CEST)Beantworten
(Einrückung wieder verringert, im Folgenden Reaktion auf verschiedene Ebenen):
Seth, upps, sollte das hier besser nach user talk:CamelBot/maintenance_list/self-ref übertragen werden?
Wenn man Onlinelinks der Lit.-Vorlage überprüft, muss man das für Internetquelle und Cite web erst recht tun. Leyo, Du hattest offensichtlich damals die Überprüfung angeregt, was Denkst Du dazu?
Simplewiki hatte ich tatsächlich übersehen, zh-min-nan separat aufzuführen, sollte die Regex zwar ein kleines bisschen weniger flexibel, aber wirklich deutlich weniger intensiv machen.
Zu Commons: Leyo hat schon Recht. Es sollte als Datei:Example.jpg (oder mit File) verlinkt werden statt mit commons:File:Example.jpg oder c:File:Example.jpg und erst recht nicht mit w:c:File:Example.jpg oder https://commons.wikimedia.org/wiki/File:Example.jpg (von Upload.wikimedia.org ganz zu schweigen). Bleibt vorerst das Problem der Verlinkung auf Seitenzahlen bei DjVu und PDF. Seth, dann müsstest du die Regex wieder so zurückbauen, dass nur Wikisourcelinks ignoriert werden. Links zu Galerien/Alben (entspricht vom Namensraum her Artikeln in Wikipedias) wären nur mit Interwiki- oder HTML-Link möglich, sollten aber eigentlich in Referenzen nicht notwendig sein, Problem hier evtl. wieder Anmerkungen; andererseits gibt es dafür die {{Commons}}-Vorlage, die jedoch nicht in Referenzen gehört.
Eine weitere Schwierigkeit sind Webarchivlinks, die nicht anders möglich sind. Entweder sind sie am Link zu erkennen, der mit https://web.archive.org/web/ beginnt oder einer Archive.today-Seite, die bekanntlich mit mehreren Domains aufwarten können (was Du in Zeile 79 aufzufangen scheinst) – Webcite weiß ich nicht –, oder mit ihrem alten Link in der Webarchivvorlage.
— Speravir – 02:03, 11. Apr. 2022 (CEST)Beantworten
gudn tach!
  • verschieben: stimmt, macht sinn, kannst du gerne tun.
  • commons: dafuer habe ich gestern ein eigenes pattern erstellt, siehe [5]. damit schaut der bot nach den links jetzt auch unabhaengig davon, ob sie in einzelnachweisen oder sonstwo stehen. das commons-template wird z.b. ignoriert. passt das so? die ergebnisse wuerde der bot dann an die o.g. stelle (commons-ref) schreiben. bisher hat er noch nix gefunden (er schaut nur in den recent changes).
  • somit brauch ich bei "self-ref" die commons-links nicht wieder mitaufzusammeln, oder?
  • archive-urls: derzeit werden bei self-ref archive-urls ignoriert (d.h. sie wuerden die match-bedingungen nicht erfuellen). bei commons-ref dagegen wuerden archive-urls bisher mitgematcht. duerfe aber vermutlich eh nur selten vorkommen, oder?
  • ach so, aktuell wird nur im main namespace geschaut.[6][7] wenn ich das aendern soll, sagt bescheid. --seth 22:33, 11. Apr. 2022 (CEST)Beantworten

---Ende Kopie---

Seth: Verschiebung offensichtlich erledigt. (Ist es hier beim Camelbot besser dich anzupingen?)
Artikelnamensraum sollte ausreichen. Höchstens noch Dateien, weil dort ziemlich viele Upload-Links existieren.
Zu „bei commons-ref dagegen wuerden archive-urls bisher mitgematcht. duerfe aber vermutlich eh nur selten vorkommen, oder?“ Ich weiß nicht genau, welche Variante Du ansprichst, aber solche Treffer hatten wir schon. Ich erweitere mal die Suche auf Wikipedias und Commons, sind ja beide so nicht erwünscht und in Zeile 4074 suchst du ja auch nicht nur in Commons, erstere sind oft sogar problematischer – Suche nach Direktlinks im Artikelraum ohne Vorlage:Webarchiv (Stand jetzt 9 Treffer), Suche nach Direktlinks im Artikelraum mit Vorlage:Webarchiv (Stand jetzt 8 Treffer).
Zu meinem „Wieso wird … der Online-Parameter von {{Literatur}} ausgewertet, aber nicht der url-Parameter von {{Internetquelle}} und {{Cite web}} hatte ich die dumme Idee, dass solch ein URL-Parameter auch in anderen Vorlagen vorkommen könnte und, ach sieh selbst die Suchanfrage. Ob dort immer vollständige Adressen vorkommen, worauf verlinkt wird und ob das False positives produziert und somit ein Problem ist, kann ich nicht einschätzen.
Über (?:https?:|\[) in Zeile 4072 wunderte ich mich zunächst, genauer wegen der eckigen Klammer als Alternative, aber man kann es ja simpel ausprobieren: Example.svg. Wusste ich noch gar nicht, dass der Parser das tut.
— Speravir – 02:39, 13. Apr. 2022 (CEST)Beantworten
gudn tach @Speravir!
  • ping: ja, bitte. und gerne bei jeder antwort, sonst verpenne ich leicht, zu antworten. :-)
  • archive: aktuell werden bei commons-ref auch archive-links (mit-)gefunden. wenn ich die nicht mitauflisten lassen soll, muesste ich das erst entsprechend basteln.
  • url-parameter in vorlagen: ja, hatte ich schon verstanden (und finde die idee gewiss nicht dumm). und ich hatte ja oben (2022-04-10 12:42) allgemein nach "url=..." gesucht -- also vorlagenunabhaengig (wobei ich offenbar auch nach URL=... suchen lassen sollte). nur: wenn ich das in den bot einbauen wuerde, wuerde er auch sofort leute, die sowas einfuegen, benachrichtigen, was bei false positives verwirrung bis schlechte laune erzeugen koennte. also sollte ich das vielleicht erstmal in einer separaten regel (aehnlich wie commons-ref) testen lassen und spaeter -- falls es zu funzen scheint -- in self-ref einbauen.
  • //example.org: ja, das sind protokoll-relative links, die eigentlich (meines wissens) heutzutage keinen zweck mehr erfuellen.
-- seth 23:49, 13. Apr. 2022 (CEST)Beantworten

Whitelist

[Quelltext bearbeiten]

Kannst du MediaWiki auf die Whitelist setzen? Dort sind solche Links halt notwendig. --Leyo 15:18, 4. Sep. 2023 (CEST)Beantworten

Gudn Tach!
Hmm, seltsam steht eigentlich schon darauf. Hab den Eintrag jetzt erstmal manuell entfernt. Falls die Seite nochmal gelistet wird, muss ich mir das genauer anschauen.
Danke für den Hinweis! :-) -- seth (Diskussion) 15:44, 4. Sep. 2023 (CEST)Beantworten
Okay, danke. --Leyo 15:48, 4. Sep. 2023 (CEST)Beantworten