Benutzer Diskussion:Stefan Kühn/Check Wikipedia/Archiv/2009/Dezember

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen

Dump scan

Can I ask for dump scan for pl.wiki. There was an error in scan in july ([1]), and after then we see only a few errors (from 100 000). Malarz pl 14:53, 7. Dez. 2009 (CET)

At the moment I redesign the workflow inside the script. I stopped the scans and stop one part of the script so that now every language get a new update daily. This is the reason why plwiki at the moment in the new interface stand by 42357 articles. In the future I will use more and more the possibility of the database. So I will change the script in the next weeks. But before Christmas I have not so much time (private and in the office). Maybe between Christmas and New Year I can start the redesign. -- sk 10:58, 10. Dez. 2009 (CET)

sup small Kombination

Hallo Stefan Kühn, ich habe gerade gesehen, daß die u.a. auch von mir auf Bundestagswahl 2009 ganz absichtlich eingesetzte Kombination "<sup> <small>" von deinem Skript als Fehler angesehen wird. Ich hab dann mal versuchsweise ein <small> bei einer der Fußnoten rausgenommen (natürlich nur in der Vorschau) und dabei festgestellt, daß die Zahlen dann definitiv zu groß werden, weil die Oberkante der Zahl soll mit der Oberkante der Klammer abschließen (und nicht die Klammer überragen !), das ist international so üblich bei Fußnoten.

Bitte daher diesen Fehler als "umstritten" kennzeichnen, da nicht in jedem Fall die "Beseitigung" der von den Autoren bewußt vorgesehenen Formatierung erwünscht ist. Die Größe der Zahlen reicht auch völlig aus, denn Blinde bzw. Sehschwache bekommen sie ja vorgelesen oder stellen die "Grundschriftart" größer ein, sodaß auch die Fußnotennummern größer werden.

Auch in Formeln braucht man manchmal kleinere und größere Zahlen auch da ist mit äußerster Vorsicht zu ändern, wenn man nicht genau weiß warum sup+small (oder sub+small) gesetzt wurde.

Danke. --PhChAK 02:07, 5. Dez. 2009 (CET)

Also ich hab mir mal das angeschaut. Im Abschnitt "Landeslisten" kann man problemlos auf die Fußnoten verzichten und das jeweils hinter dem Parteinamen mit ranschreiben. In der Wikipedia sollte man möglichst immer auf Fußnoten verzichten. Fußnoten sind was für Bücher. Ich denke dabei vor allem an andere Medien, die mit den Fußnoten ein Problem haben (z.B. bei der Darstellung auf dem kleinen Handydisplay). Das Problem ist das small, das ja nicht mehr im XHTML erwünscht ist. Wenn dann sollte man mit span arbeiten. -- sk 18:37, 6. Dez. 2009 (CET)
Das mit dem "direkt dranschreiben" funktioniert leider in dem o.a. Artikel nicht, weil dann kommt wieder einer von der Truppe, die diese Infos sowieso überflüssig findet und meint die störten nur und löscht sie, weil angeblich die Zeilen dadurch zu lang werden und die Liste an Übersichtlichkeit verliert. Dann muß ich sie aus meiner lokalen Datei wieder einfügen, damit andere nicht Stunden damit verbringen, das wieder neu rauszusuchen. Daher ist die Schreibweise mit den Fußnoten ein (schwer erkämpfter) Kompromiß um die mühsam recherchierten Daten allen Interessierten zugänglich zu machen und trotzdem keinen Edit-War auszulösen.
Fußnoten und <small>/</small>-Tags gibt es m.W. zu zigtausenden in der Wikipedia und die rauszubekommen dürfte mehr Schwierigkeiten machen, als die falsch geschriebenen Tages-Daten und die kaputten web-Links.
Auf kleinen Handy-Displays dürften alle lesenswerten und excellenten Artikel erhebliche Probleme bereiten, da sie selbst am "normalen" Bildschirm meist 10 Seiten und mehr haben und auf kleinen Displays dann schnell auf über 200 Displayseiten dargestellt werden und endlose Downloadzeit in Anspruch nehmen (ohne "Flachrate" ein ziemlich teures Vergnügen) - dagegen dürften ein paar zu kleine und damit auf dem Display unleserliche Fußnoten ein ziemlich kleines Problem sein zumal einige Handydisplays mit den <sub>- und <sup>-Tags auch schon Probleme haben und auch diese nicht korrekt darstellen können ...
Für Handys müsste es daher eine art "MobileWiki"-Ausgabe (wap-Ausgabe) geben, die nur die nötigsten Infos in einem Artikel zusammenfasst und dann eher "verlinkte Stubs" als Ergänzungen bietet, die man nur bei Bedarf abruft. In dieser "Sonderausgabe" würde ich dann alles vermeiden, was auf Handys Probleme macht. Die "normale" Wiki wird hingegen m.W. typischerweise auf 17"-Monitoren im 1024x768-Format gelesen. --PhChAK 01:32, 11. Dez. 2009 (CET)
Hast du schonmal über eine kleine Tabelle nachgedacht. Dann wird das sehr viel übersichtlicher dargestellt und ist auch auf anderen Geräten kein Problem. -- sk 07:45, 11. Dez. 2009 (CET)
Partei BW BY SN
XY-Partei x x
AB-Partei x

Item marked as done incorrectly

Hi Stefan, I'm wondering what happens when an article is marked as done on the new interface, without any actual changes made on the article. The list of the "done" items has been growing for the Chinese wiki, so I checked a few "done" articles, and found no edits after the error was found. Someone marked it on the interface by mistake. For example, the first two items on the error #17 have not been edited after the error was found.

Since there are less than 1500 items marked as done, I assume that all of them have been checked in the latest scan on the December 9, and should have cleared the "done" flag if it had not actually been fixed? Or does the scan only work on the changed articles? --Vina 23:39, 9. Dez. 2009 (CET)

Yes, this is a problem. I see this days before on the jawiki. Every day jawiki has more then 1000 done articles. My script scan this articles next day, and then again 1000 articles set as done. I found out, that the problem is a bot (Alexbot) in jawiki. Why? The "Done"-Button in the new interface is only a link. This link include the pageid of the article in this line. For example en:Alimony has the pageid 98205 and the done link for the error number 81 include the id 81 and the pageid 98205 (something like this: "...checkwiki.cgi?project=enwiki&view=detail&id=81&pageid=98205"). If someone click this link and go to this page then my script know that this error in this article is "done". But now some bots scans also this links. I don't know why. I have written to the autor of the "http://zh.wikipedia.org/wiki/User:Alexbot" but I had no answer. Maybe you can also ask the autor. Maybe someone had a better idea for the done-button. Let me know. -- sk 11:19, 10. Dez. 2009 (CET)
Thanks, I'll ask the bot operator and hopefully get an answer. --Vina 00:56, 11. Dez. 2009 (CET)
I asked Alex about his bot. He said that the only thing that the bot does is using the interwiki.py to traverse through the new and changed articles for Chinese and Japanese wiki, and add/modify interwiki links. It is using the pywikipedia code, following the new API to traverse pages rather than direct access. It is "standard" code, however, nearly all of the new commits for the new API on the pywikipedia is done by him as well. He looked at the code and couldn't see what might be the problem, but if there is a problem with it, the other interwiki bot might end up doing the same thing. In addition, he also runs the "welcome.py" for the new user pages, but that is only in the user namespace. Maybe there is some conflicts in URLs? I can't imagine what it might be since your script is perl rather than python.
I do have a suggestion for the "done" button. I noticed that both the link to a specific type of error, and the link for the done button both have "view=only". Maybe change the done button to be "view=done"? It's less likely for bot writers to construct an URL that is the same as the done button by accident. --Vina 06:58, 14. Dez. 2009 (CET)

Error 52

Hallo, gibt es eine Möglichkeit, dass QS-Kategorien, die anscheinend immer am Anfang eingefügt werden, nicht mit aufgezählt werden? Grüße, Inkowik32 (Disk - Bew - Vtr) 17:48, 17. Dez. 2009 (CET)

Das ist ein guter Hinweis. Mal schauen ob ich das hinbekomme. -- sk 19:57, 23. Dez. 2009 (CET)
Danke. --Grüße, Inkowik32 (Disk - Bew) 16:29, 26. Dez. 2009 (CET)

formatting lists with :

Formatting lists as ":*" isn't error and I myself often this. The more so, if previous levels are different more than by 1, then "**" produce wrong result:

some reply

answer
another answer
  • bulleted answer with :

some reply

answer
another answer
      • bulleted answer with **

(I wrote here, because in Russian wikipedia this topic appear in list of pages with errors). AVBtalk 14:53, 17. Dez. 2009 (CET)

I think this is not correct syntax. But you can deactivate this error in ruwiki. -- sk 19:56, 23. Dez. 2009 (CET)
How can I deactivate a particular error? There are numerous ones on Turkish wiki but none seems to be functional in the new interface. --Superyetkin 02:57, 25. Dez. 2009 (CET)
At the translationpage of your project (in ruwiki:here, in trwiki: here) you can set an error as "deactivated". You set only the prio of this error to 0:
#########################
# error description
#########################
# prio = -1 (unknown)
# prio = 0  (deactivated) 
# prio = 1  (top priority)
# prio = 2  (middle priority)
# prio = 3  (lowest priority)

For example you want deactivate the error 18 so you set in trwiki "error_018_prio_trwiki=3 END" to "error_018_prio_trwiki=0 END". Attention only "_prio_trwiki" will have an effect to the script. With every daily run the script check this value at this page and so you can deactivate the error in your language. -- sk 10:05, 28. Dez. 2009 (CET)

  • Hey Stefan, thanks for the advice but that does not seem to work (for at least some errors).
###########################################################################

 error_016_prio_script=1 END
 error_016_head_script=Template with Unicode control characters END
 error_016_desc_script=Find Unicode control characters <tt>&#x<code></code>FEFF;</tt> or <tt>&#x<code></code>200E;</tt> or <tt>&#x<code></code>200B;</tt> ([[:en:Left-to-right_mark]], [[:en:Right-to-left mark]], [[:en:Byte-order mark]]). This could be a problem inside a template. Copy the template in a texteditor (for example [[Notepad++]]), where you see the controle characters and delete this. Copy then this text back in the article.

<span style="color:#e80000;">The script was change for this error. Please fix the translation. If you find a bug then please tell this [[:de:Benutzer:Stefan Kühn/Check Wikipedia|here]].</span>

<span style="color:#e80000;">This is a new error. If you find a bug then please tell this [[:de:Benutzer Diskussion:Stefan Kühn/Check Wikipedia|here]].</span> END
 error_016_prio_trwiki=0 END
 error_016_head_trwiki=Unicode kontrol karakteri içeren şablon END
 error_016_desc_trwiki=Şablon, Unicode kontrol karakterlerinden birini ya da birkaçını içeriyor. END

###########################################################################

And this error (#16) still shows on this page. Any comments? --Superyetkin 03:00, 29. Dez. 2009 (CET)

At the moment only the wikipage use the translation-page. The new interface only use the prio_script. This can't change by a user. I work at this. -- sk 21:32, 30. Dez. 2009 (CET)

New Interface on Toolserver

Hallo Stefan, bei der Benutzung des New Inteface bekam ich schon mehrmals diese Fehlermeldung vom Toolserver:

DBI connect('u_sk_yarrow:host=sql','sk',...) failed: User 'sk' has exceeded the 'max_user_connections' resource (current value: 15) at ./checkwiki.cgi line 30 For help, please send mail to the webmaster (ts-admins@toolserver.org), giving this error message and the time and date of the error.

Ist die Zahl der gleichzeitig tätigen Benutzer des Interfaces tatsächlich auf 15 limitiert oder interpretiere ich das falsch?-- Ben Ben 15:01, 28. Dez. 2009 (CET)

Nachtrag: Fehlermeldung zuletzt hier gesehen: http://toolserver.org/~sk/cgi-bin/checkwiki/checkwiki.cgi?project=dewiki&view=detail&pageid=4986705 -- Ben Ben 15:06, 28. Dez. 2009 (CET)

Ich hab heute viel an den Skripten auf dem Toolserver gebastelt. Ich hab da auch diese Fehlermeldung ab und an bekommen. Ich denke durch die übermäßige Last wurde dieser Fehler dann erzeugt. Mal schauen ob das morgen auch noch da ist. -- sk 17:22, 28. Dez. 2009 (CET)
Hallo Stefan, das Problem besteht weiterhin. Es trat bei mir gestern und auch heute wiederholt auf. Gruß --Succu 08:44, 6. Jan. 2010 (CET)
Ich hab heute DAB angeschrieben, ob er mein Limit hoch setzen kann. Mal schauen ob das weiterhilft. -- sk 18:26, 10. Jan. 2010 (CET)
[2] Vielleicht hilft das. Andim 21:41, 10. Jan. 2010 (CET)

Hey there. This problem persists. There is no opportunity to make corrections on the system. --Superyetkin 22:10, 18. Jan. 2010 (CET)

I have solve the problem. Now you can work. But I will change some things. One script block all other scripts. -- sk 20:52, 20. Jan. 2010 (CET)

Again today: DBI connect('u_sk_yarrow:host=sql','sk',...) failed: User 'sk' has exceeded the 'max_user_connections' resource (current value: 15) at ./checkwiki.cgi line 47. -- A2 23:38, 7. Feb. 2010 (CET)

Detecting double sections

Could this project detect when a page has two sections with the same name one immediately after the other? This isn't always error that should be fixed, but in most cases it is. For previous discussion, see en:Wikipedia talk:AutoWikiBrowser/Feature requests/Archive 6#Removing double sections in articles. Svick 23:11, 21. Dez. 2009 (CET)

Interesting idea. I will try to implement this feature. -- sk 19:57, 23. Dez. 2009 (CET)
Hi! just one comment. In some pages the same section title appears more that 1 time, but that's ok becuase is related to diffent "main section". Is it possible to modify the script in order to detect if the same sub-sections hang from the same main section? Thanks. --Solde 17:32, 8. Feb. 2010 (CET)

Error number 056: Arrow as ASCII art and code

If an article talks about a programming language that uses double arrow => as syntax, then in this case it should not be corrected to ⇒. Code can be marked with <code> or <source>, but it can also be marked with indenting the text with one space:

this is a code example

I suggest the script would treat lines that begin with a space just as it would treat lines marked with <code> or <source>. -- 84.251.217.222 12:18, 26. Dez. 2009 (CET) (fi:user:Kimmolaine)

Hmm, I think <code> or <source> is the better way, it is not quick and dirty writing. A script can never solve the problem with the blank in front. Is this code or is this bad blank. If this script find <code> or <source> it solve this problem. So please insert <code> or <source>. -- sk 21:24, 26. Okt. 2011 (CEST)
Dieser Abschnitt kann archiviert werden. sk 21:24, 26. Okt. 2011 (CEST)