Wikipedia:Archiv/Datenbankabfragen

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen

Diese Seite gehört zum Wikipedia-Archiv.

Diese Seite dient als Hauptseite für die Koordination von Datenbankabfragen. Die Software MediaWiki bietet zwar eine Funktion, die SQL-Abfragen auf der Datenbank erlaubt (Spezial:Asksql), aber aus Performance-Gründen ist diese in der Wikipedia abgeschaltet. Es gibt jedoch ein Abfragemodul, das sich für kleinere eigene Abfragen oder auch die Programmierung eines Bots eignet. Außerdem werden in mehr oder weniger regelmäßigen Abständen Kopien der verschiedenen Wikipedia-Datenbanken zum Download angeboten (Wikipedia:Download), die für eigene Abfragen - offline-Abfragen - verwendet werden können.

Diese Seite ist ein Versuch, nach dem Vorbild von Offline reports eine gemeinsame Seite zur Verfügung zu stellen, auf der man Wünsche für Datenbankabfragen äußern kann, und die jeder mit den nötigen Mitteln und Fähigkeiten abarbeiten kann:

Einige Benutzer (u.a. MichaelDiederich) laden sich regelmäßig die neueste Kopie der deutschen Wikipedia-Datenbank herunter, und führen auf Anfrage Abfragen aus. Wer wirklich den aktuellen Datenbestand benötigt, kann sich im Wikipedia:Chat an einen Developer wenden, oder - wenn vorher bekannt ist, welche (wenigen!) Seiten betrachtet werden müssen - die Seiten über Spezial:Export als XML-Dump aus der WP herunterladen und manuell oder mit Hilfsprogrammen verarbeiten.

Die Ergebnisse werden üblicherweise auf Unterseiten des anfragenden Benutzers oder dieser Seite hochgeladen. Zu jeder neuen Ergebnisseite sollte auf der Seite selbst die verwendete Abfrage hinterlegt werden, um eine einfache Aktualisierung durch andere zu ermöglichen. Neue Seiten, die für andere Bearbeiter interessant sein könnten, sollten hier verlinkt werden.

Datenbankabfragen im Web

[Quelltext bearbeiten]
  • GrepWikiTitle (aus SQL-Dump) Einfache Suche nach Artikel-Titeln mit regulären Ausdrücken

Für intensiveren Datenbankzugriff gibt es den meta:Toolserver, bei dem du dich für einen Account bewerben kannst, damit steht dir dann ein direkter Datenbankzugriff zur Verfügung. Es werden dort ca. 640 Datenbanken der Wikimedia-Projekte mit ungefähr 5 Min. Verzögerung gespiegelt.

Aktuelle Dumps

[Quelltext bearbeiten]

Achtung: Seit MediaWiki Version 1.5 sind die Tabellen cur und old nicht mehr als SQL-Dump formatiert, sondern in XML. Siehe Wikipedia:Download für eine Anleitung zur Verarbeitung der Dumps (einschließlich dem Import in eine eigene MediaWiki-Installation).

Die aktuell herunterladbaren Dumps liegen auf http://dumps.wikimedia.org/dewiki/

Wartungslisten

[Quelltext bearbeiten]

Einige der Wartungslisten werden mit jedem Dump aktualisiert, einige erst, wenn sie größtenteils abgearbeitet sind.

Etliche der hier aufgeführten Wartungslisten werden nicht routinemäßig, sondern auf Anfrage, d.h. wenn konkreter Bedarf besteht, aktualisiert.
Aktualisierungswünsche sind ausdrücklich willkommen!

Liste Beschreibung Stand Status
Bilder
Benutzer:SirJective/Wartungslisten/Bildprobleme Bilder ohne Beschreibung, Beschreibungen ohne Bild etc. 26. November 2004
Benutzer:SirJective/Wartungslisten/Identische Bildbeschreibung Bilder mit identischen Bildbeschreibungen in verschiedenen WPs 3. Februar 2005
Benutzer:SirJective/Wartungslisten/Selbst erstellte Bilder Bildbeschreibungsseiten, auf denen keine Lizenz, aber der Text "selbst erstellt" steht erledigt
Benutzer:Dapete/Datenbankabfragen/Verwaiste Bildbeschreibungsseiten Bildbeschreibungsseiten, zu denen es weder hier noch auf Commons ein Bild gibt 14. Juli 2007
Wiki-Syntax
Benutzer:SirJective/Wartungslisten/Klammer-Ungleichgewicht Artikel mit Absätzen, bei denen die Anzahl der öffnenden und schließenden eckigen Klammern verschieden sind, sowie Artikel, deren Anzahl der öffnenden und schließenden geschweiften Klammern verschieden sind 31. Januar 2006 Teile L, N und O zum Abarbeiten vorhanden
Benutzer:SirJective/Wartungslisten/Pre-Text Artikel, die möglicherweise fest formatierten Text enthalten 27. Januar 2005 Liste nur für nur Sonderzeichen und A als Test der Abfrage, sollte evtl. vervollständigt werden
Personen/Personendaten
Benutzer:SirJective/Unkategorisierte Personen Personen (identifiziert durch bestimmte Zeichenketten im Text), die in keine Kategorie eingeordnet sind erledigt
Benutzer:SirJective/Personendaten Probleme in Artikeln, die Personendaten enthalten 7. Januar 2005
Benutzer:SirJective/Personen ohne Personendaten Artikel, die vermutlich Personen beschreiben, aber noch keine Personendaten enthalten 3. März 2005
Benutzer:FEXX/war Artikel, die die Zeichenfolge "|KURZBESCHREIBUNG=war" enthalten erledigt
Benutzer:MichaelDiederich/Plus als dagger Artikel, die vermutlich ein als Dagger (†) verwendetes Plus (+) enthalten 31. Januar 2006 erledigt
Artikeltitel
Benutzer:SirJective/Wartungslisten/Namensraum-Titel Artikel, deren Titel mit einem Namensraum kollidiert 20. Oktober 2005
Benutzer:SirJective/Klammerzusatz Artikeltitel mit Klammerzusatz ohne klammerlose Version 6. April 2005
Benutzer:SirJective/Wartungslisten/Ähnliche Titel Artikel, deren Titel sich sehr ähnlich sind 11. Dezember 2005 erledigt
Nicht vorhandene Artikel mit Sonderzeichen am Anfang 27. Februar 2006
Benutzer:Sansculotte/Zu lange Titel Artikel mit einem sehr langen Titel 28. Dez 2005
Verlinkungen auf vorhandene Seiten
Wikipedia:Archiv/Redirects im falschen Namensraum Redirects, die wir vermutlich nicht haben wollen erledigt
Benutzer:Rdb/Falsche Redirects Sehr kurze Artikel, die das Wort "siehe" enthalten und eventuell zu Redirects gemacht werden müssen erledigt
Benutzer:Echoray/Sackgassen-Artikel Artikel, die keine Links zu anderen Artikeln haben erledigt
Benutzer:SirJective/Wartungslisten/Halbwaisen Artikel, die nicht von Artikeln, aber möglicherweise von anderen Namensräumen aus verlinkt sind 6. April 2005 erledigt
Wikipedia:Selbstlinks Seiten mit Links auf sich selbst 27. April 2007 erledigt
Benutzer:SirJective/Wartungslisten/Selbstlinks via Redirect Seiten mit Links auf Redirects, die auf die ursprüngliche Seite verweisen 3. Feb 2005
Verlinkungen auf nicht vorhandene Seiten (broken links)
Benutzer:SirJective/Wartungslisten/Fehlende Artikel mit langem Titel brokenlinks mit sehr langem Titel 26. Jun 2005
Benutzer:SirJective/Wartungslisten/Kürzere Treffer fehlende Artikel, zu denen Artikel mit verkürztem Titel existiert 7. Januar 2005
Kategorien
Benutzer:SirJective/Wartungslisten/Topkategorien Kategorien, die in keine Kategorie eingeordnet sind 20. Oktober 2005
Benutzer:Ezrimerchant/Sehr kleine Kategorien Kategorien mit höchstens 2 Artikeln und Unterkategorien 20. Oktober 2005
Benutzer:Bierdimpfl/Nicht kategorisierte Seiten Artikel die in keine Kategorie eingeordnet sind 23. Januar 2006
Begriffsklärung
Benutzer:SirJective/Wartungslisten/Nicht verwaiste Begriffsklärungsseiten BKS, die noch Links von Artikeln haben 23. Dez 2004
Benutzer:SirJective/Wartungslisten/Begriffsklärungskandidaten Seiten, die vielleicht als BKS in Frage kommen 23.06.2005
Interwiki
Benutzer:SirJective/Gleichlautender Titel Artikel mit gleichem Titel in verschiedenen Wikipedias und möglicherweise noch Interwikilinks brauchen können
Benutzer:Mathias Schindler/Interwikiliste
Weblinks
Benutzer:SirJective/Wartungslisten/Artikel mit vielen Weblinks 21. April 2005
Wikipedia:Defekte Weblinks 7. Feb 2006
Sonstige
Wikipedia:Fehlende Artikel listet jene fehlenden Artikel die am häufigsten in anderen Artikel vorkommen. 11. März 2006 mit jedem Dump zu aktualisieren
Benutzer:SirJective/Kurze Artikel Artikel mit sehr kurzem Quelltext in bestimmten Kategorien; Demo-Liste anlässlich einer Diskussion über Stubs
Wikipedia:Falsches Datumsformat Artikel mit Datumsangaben im Format TT.MM.JJJJ 23. Januar 2006 nach Abarbeitung zu aktualisieren (derzeit hat nur SirJective das bisher verwendete Programm)
Benutzer:SirJective/Wartungslisten/Älteste neue Artikel die ältesten Artikel, die nach ihrer Erstellung noch nicht editiert wurden 20. Oktober 2005
Benutzer:SirJective/Wartungslisten/Doppeleinträge geschlossen
Benutzer:SirJective/Newpages verdoppelt geschlossen
Benutzer:SirJective/Wartungslisten/Vergessene Löschkandidaten Löschkandidaten älteren Datums erledigt
Wikipedia:Datenbankabfragen/IP-Diskussionen Veraltete, überflüssige IP-Diskussionen, die gelöscht werden sollen 22.11.06 bitte aktualisieren
Benutzer:APPER/ISBN fehlerhafte ISBN-Nummern 20. März 2006 nicht erledigt
Übersichten
Hier sind z.B. Kategoriebäume oder inhaltlich gegliederte Artikellisten, die durch Abfragen erneuert werden können. Die Grenze zur Wartungsliste ist natürlich fließend. Diese Seiten sollten je nach Bedarf (auf Wunsch) aktualisiert werden.
Portal:Astronomie/Index Alphabetischer Index 15. Februar 2006
Portal:Militär/Register Alphabetischer Index 2. März 2006