Wikipedia:Technik/Text/Suche

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen

Diese Projektseite gibt vertiefte technische Hintergrundinformationen zur Such-Software innerhalb der Wikis.

Wer Informationen über die Anwendung der Wiki-internen Suche benötigt, ist bei Hilfe:Suche vermutlich besser aufgehoben.

Such-Software[Quelltext bearbeiten]

Die aktuelle Software „Cirrus“ basiert auf der Suchmaschine Elasticsearch.

Bis ins Jahr 2014 wurde die Suchmaschine Lucene direkt angesprochen; mw:Extension:Lucene-search (englisch).

Suchbare Eigenschaften[Quelltext bearbeiten]

Es wird nicht nur der offenkundige (dargestellte) Text herangezogen. Die auswertbaren Bereiche sind:

  • Dargestellter Text.
    • Das sind die aneinandergereihten Inhalte aller resultierenden HTML-Elemente für normale Seiten.
    • Auch alle nur optisch unsichtbaren Elemente gehören zum „dargestellten“ Text.
    • Attribute von HTML-Elementen gehören grundsätzlich nicht dazu.
  • Quelltext
  • Seitenname, Namensraum
  • Kategorisierung
  • Eigenschaften von Mediendateien
  • Verlinkung oder Einbindung anderer Seiten, Wikidata-Aussagen
  • Geografische Nähe

Es gibt zwei Klassen, die Elementen des Wikitextes zugeordnet werden können:

  • searchaux
    Diese Information ist nachrangig und soll am Ende der Suchergebnisse angeordnet werden.
  • navigation-not-searchable
    Diese Information soll von der Suche völlig ignoriert werden.
    Markierte Elemente erscheinen auch nicht in den Schnipseln bei Präsentation der Suchergebnisse.

Eine optische Ausblendung etwa mit style="display:none" hat auf die Suche im dargestellten Text keinen Einfluss.

Systemnachrichten[Quelltext bearbeiten]

Individuelle Konfiguration pro Wiki ist möglich.

MediaWiki:Cirrussearch-ignored-headings
Überschriften, die von der Suche ignoriert werden
MediaWiki:Cirrussearch-morelikethis-settings
Parameter morelike: konfigurieren
MediaWiki:Cirrussearch-now-using
Informative Meldung; vor allem für die Migrationsphase um 2014.

Weitere Informationen[Quelltext bearbeiten]

MediaWiki: Help:CirrusSearch/de – Anleitung (deutsch/englisch)
MediaWiki: Extension:CirrusSearch – Technische Informationen (englisch)
Phabricator – Workboard: #cirrussearch – Fehlermeldungen, Direktkontakt zu den Entwicklern (englisch)