Wikipedia:Wikimedia Deutschland/Wikimedium/Forschung und Entwicklung (1 Seite)

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen

Wikimedium 4/12[Quelltext bearbeiten]

Wikidata wird in drei Phase entwickelt. Die Arbeit an der zweiten Phase ist jetzt in vollem Gange. In dieser Phase arbeitet das Team daran es zu ermöglichen Infoboxdaten in Wikidata zu speichern. Infoboxen sind in einer großen Anzahl Wikipedia Artikeln vorhanden und bieten dem Leser einen schnellen Überblick über die wichtigsten Daten zum gewählten Thema. Infoboxen gibt es zu vielen verschiedenen Themenbereichen wie etwa Ländern, Personen, chemischen Elementen und vielem mehr. Infoboxen enthalten ganz unterschiedliche Daten. Dies können zum Beispiel ein Datum, ein Name, eine Temperaturangabe und vieles vieles mehr sein. Allein ein Datum einzugeben und es maschinenverständlich zu machen ist aber gar nicht so trivial für Wikipedia. Es beginnt mit der Genauigkeit der Information. Man kann von einem Ereignis sprechen, welches irgendwann vor 10000 Jahren oder von einem das am 2. Mai 1605 stattgefunden hat. Und dann gibt es natürlich noch verschiedene Kalendersysteme mit denen Wikidata umgehen können muss. Andere Daten stellen ähnliche Herausforderungen. Es gilt: Der Teufel liegt im Detail. Das Wikidata Team arbeitet nun daran, es zu ermöglichen all diese Daten in Wikidata einzugeben und gleichzeitig es nicht zu aufwendig und schwierig zu machen. Am Ende der Arbeit werden Wikipedia Autoren in der Lage sein Daten in Wikidata zu speichern, in ihren Artikeln zu verwenden und über Sprachgrenzen hinweg zu teilen.

Screenshot von Ausschnitt von Infobox auf Nürburgring oder Krypton

Wikimedium 3/12[Quelltext bearbeiten]

Wikidata, Wikimedias Projekt zur Erstellung einer zentralen Wissensdatenbank, schreitet gut voran.

Die erste Phase, die Links zwischen den Sprachversionen der Wikipedia zentralisieren soll, wird demnächst in den ersten Wikipedias genutzt und kann dann recht schnell allen anderen Wikipedias angeboten werden.

Währenddessen arbeitet das Entwicklerteam an der zweiten Phase. Die zweite Phase beinhaltet die Zentralisierung von Infoboxdaten, also Daten wie das Geburstdatum einer Person, die Länge eines Flusses oder das Bruttosozialprodukt eines Landes. Das Interesse am Projekt ist sehr groß und die Community beteiligt sich rege an Diskussionen, gibt Rückmeldungen und arbeitet mit. Dies geschah zum Beispiel auf den zahlreichen Veranstaltungen, bei denen Wikidata in den letzten Wochen vertreten war. Darunter waren unter anderem Introveranstaltungen für lokale Wikipedianer in Köln, Dresden, Essen, New York und München. Und natürlich durfte Wikidata auch auf Wikimedias jährlicher Konferenz Wikimania in Washingtin, D.C. nicht fehlen. Die drei Vorträge und eine Diskussionsrunde zu Wikidata waren sehr gut besucht und es wurde rege diskutiert. Einige Administratoren der ungarischen Wikipedia äußerten auf dieser Veranstaltung den Wunsch die ungarische Wikipedia solle die erste sein, die Wikidata benutzt. Nach einer Abstimmung unter den Editoren wurde dies akzeptiert und sie werden die ersten sein die die Zentralisierung von Links zwischen den Sprachversionen nutzen können. Weitere Wikipedien werden danach hoffentlich zeitnah folgen.

Mittlerweile hat das Projekt auch ein Logo, welches von Arun Ganesh erstellt wurde. Das Logo, das er zuvor beim Logowettbewerb eingereicht hatte, gewann in der anschließenden Wahl gegen 33 andere Vorschläge. Insgesamt wurden fast 1000 Stimmen abgegeben.

Wikimedium 02/12[Quelltext bearbeiten]

Wikimedium 01/12[Quelltext bearbeiten]

Bitteschön :-)

Seit Oktober 2010 wird an dem EU-geförderten Forschungsprojekt RENDER getüftelt. Jetzt können erste Ergebnisse präsentiert werden: das RENDER-Toolkit.

Das Toolkit ist eine Ansammlung verschiedener Analyse-Werkzeuge. Diese werden im Rahmen des gleichnamigen Forschungsprojekts RENDER von Wikimedia Deutschland bzw. unseren Projektpartnern erstellt. Mit Hilfe dieser Werkzeuge analysieren wir verschiedene Aspekte der Informationsvielfalt in Wikipedia. Die wichtigsten für uns sind hierbei die Aktualität, die thematische Vollständigkeit und die Objektivität eines Artikels, welche auch aus den Qualitätskonventionen der Wikipedia selbst motiviert sind.

Diese Analyse-Werkzeuge werden einerseits als selbständige Instrumente den Nutzern zur Verfügung stehen. Andererseits sollen deren Ergebnisse in verschiedene weiterführende Werkzeuge eingebaut werden, mit denen wir Autoren und Lesern gezielt Hinweise und Verbesserungsvorschläge in der Wikipedia anbieten wollen. Derzeit sind zwei dieser weiterführenden Werkzeuge geplant:

  • ein Qualitätsübersichtswerkzeug: dieses Werkzeug zeigt für jeden WP-Artikel die Analyse-Ergebnisse an. Dieses Tool wird auch die Möglichkeit bieten verschiedene weitere Analysemetriken mit einzubeziehen und liefert einem Nutzer einen schnellen Überblick über die Qualität und den Zustand eines Artikels,
  • einen Arbeitslistengenerator: mit diesem Werkzeug kann sich ein Wikipedia-Autor für einen bestimmten Themenbereich bzw. seine bevorzugte Kategorie Listen generieren, die ihm überarbeitungsbedürftige Artikel anzeigen.

Die Menge der aktuell enthaltenen Analyse-Tools ist keineswegs abgeschlossen. Das RENDER-Toolkit befindet sich weiterhin in der Entwicklung. Gegenwärtig beinhaltete es vier Werkzeuge:

  • LEA (Link ExtrActor) - ein Tool, dass die Hauptkonzepte eines Artikelthemas extrahiert auf Basis der verwendeten Wikilinks der 3 link-reichsten Sprachversionen eines Artikels. Diese Extraktionsmenge wird mit den in einem angefragten Artikel enthaltenen Wikilinks verglichen. Der Nutzer erhält als Ergebnis Hinweise welche Verlinkungen ergänzt werden bzw. auch welche Artikel in der angefragten Sprachversion fehlen könnten.
  • Change Detector - ein Tool dass dem Nutzer für eine angefragte Sprache die Liste der Artikel anzeigt, die nicht bearbeitet wurden, ob wohl in der Mehrzahl der anderen Sprachversionen signifikante Änderungen gemessen wurden.
  • Wikipedia Map - ein Visualisierungswerkzeug, dass alle geo-getaggten Wikipedia-Artikel in einer Sprachversion auf einer Karte anzeigt,
  • Corpex (Wikipedia Corpora Explorer) - Mit Hilfe dieses Werkzeugs lässt sich für verschiedene Sprachversionen die Verteilung und Häufigkeit von bestimmten Wörtern, Buchstabenkombinationen und kurzen Zwei-Wort-Begriffen aufzeigen.

Wir freuen uns über Verbesserungsvorschläge, Fragen und weitere Anregungen unter render@wikimedia.de

Weitere Informationen zum RENDER-Projekt finden sich hier: http://render-project.eu TODO: Link zu interner Infoseite! (aa)

Magnus Manske über Zweck und Ziele des Toolservers