XPath

Die XML Path Language (XPath) ist eine vom W3-Konsortium entwickelte Abfragesprache, um Teile eines XML-Dokumentes zu adressieren und auszuwerten. XPath dient als Grundlage einer Reihe weiterer Standards wie XSLT, XPointer und XQuery. XPath ist derzeit in der Version 3.1 vom 21. März 2017 standardisiert.

In Webbrowsern, XSLT-Prozessoren und anderer Software wird oft nur die XPath-Version 1.0 aus dem Jahr 1999 unterstützt, vereinzelt auch die XPath-Version 2.0 von 2007.

Prinzipien[Bearbeiten | Quelltext bearbeiten]

Ein XPath-Ausdruck adressiert Teile eines XML-Dokuments, das dabei als Baum betrachtet wird, wobei einige Unterschiede zum „klassischen“ Baum der Graphentheorie zu beachten sind:

Knoten (nodes) des Baumes sind der Dokumenten-Knoten, XML-Elemente, -Attribute, -Textknoten, -Kommentare, -Namensräume und -Verarbeitungsanweisungen.
Die Achsen preceding, following, preceding-sibling und following-sibling orientieren sich nicht allein an der Baumstruktur, sondern auch an der Reihenfolge der Deklaration der Elemente im XML-Dokument (Linked-Tree).

Ein XPath-Ausdruck setzt sich aus einem oder mehreren Lokalisierungsschritten (Location Steps) zusammen. Sie werden mit dem Zeichen / getrennt.

Ein Lokalisierungsschritt axis::node-test[predicate 1][predicate 2]... besteht aus:

Achse (axis) und
Knotentest (node-test),
optional gefolgt von einem oder mehreren Prädikaten (predicates).

Beliebig viele XPath-Ausdrücke lassen sich mit dem Pipe-Zeichen | mengenmäßig vereinigen.

Es gibt stets verschiedene Möglichkeiten, eine gesuchte Knotenmenge in XPath auszudrücken.

XPath operiert auf der logischen Dokumentenstruktur. Das bedeutet beispielsweise, dass Entitäten bereits geparst wurden oder dass auch eventuelle Standard-Attribute und -Knoten, die ein Schema vorgibt, im Baum enthalten sind.

Achsen[Bearbeiten | Quelltext bearbeiten]

Durch Angabe von Achsen wird ausgehend vom aktuellen Kontextknoten in der Baumstruktur des XML-Dokuments navigiert.

Wird dabei vom Dokument-Knoten (der Wurzel des XML-Dokuments) ausgegangen, wird dem XPath-Ausdruck das Zeichen / vorangestellt.

Achse	adressierte Knoten	Abkürzung	Position im u. a. Baum (ausgehend von Element D)
	der Dokument-Knoten	`/` (am Anfang eines XPaths)	Dokument-Knoten
`child`	alle direkt untergeordneten Kindknoten	(wird weggelassen)	E, G
`parent`	der direkt übergeordnete Elternknoten	`..`	B
`self`	der Kontextknoten selbst (nützlich für zusätzliche Bedingungen)	`.`	D
`ancestor`	alle übergeordneten Knoten		B, A
`ancestor-or-self`	alle übergeordneten Knoten inklusive des Kontextknotens		D, B, A
`descendant`	alle untergeordneten Knoten	`.//`	E, F, G
	alle Knoten des Dokuments außer dem Dokument-Knoten	`//`	A, B, C, D, E, F, G, H, I, J, K, L
`descendant-or-self`	alle untergeordneten Knoten inklusive des Kontextknotens		D, E, F, G
`following`	im XML-Dokument nachfolgend (ohne untergeordnete Knoten des selektierten Knotens)		H, I, J, K, L
`following-sibling`	wie `following`, aber zugleich vom selben `parent` stammend		H, I
`preceding`	im XML-Dokument vorangehend (ohne übergeordnete Knoten)		C
`preceding-sibling`	wie `preceding`, aber zugleich vom selben `parent` stammend		C
`attribute`	Attributknoten	`@`
`namespace`	Namensraumknoten, die aus dem Attribut `xmlns` stammen

Dieser Baum visualisiert beispielhaft die Struktur eines XML Dokuments

Dokument-Knoten

A

B

L

C

(D)

H

I

E

G

J

K

F

Die fünf Achsen self, ancestor, descendant, preceding und following bilden ausgehend von einem beliebigen Knoten den Dokumentbaum vollständig und überlappungsfrei ab.^[1]

Knotentests[Bearbeiten | Quelltext bearbeiten]

Knotentests (geschrieben Achse::Knotentest) schränken die Elementauswahl einer Achse ein:

Angabe eines Elementnamens wählt alle entsprechenden Elemente.
Beispiel: /descendant-or-self::Foo wählt alle Elemente im Dokument, die den Namen „Foo“ haben.
Mit dem Zeichen * wählt man beliebige Elemente.
Beispiel: /descendant-or-self::Foo/child::* wählt alle Elemente im Dokument, die Kinder von Elementen mit dem Namen „Foo“ sind.
Mit text(), comment() und processing-instruction() lassen sich Knoten bestimmten Typs wählen.

Prädikate[Bearbeiten | Quelltext bearbeiten]

Durch Angabe von Prädikaten kann das Ergebnis weiter eingeschränkt werden. Prädikate werden in eckige Klammern eingeschlossen und können in beliebiger Zahl hintereinander geschrieben werden, wobei die Reihenfolge wesentlich ist. Prädikate können XPath-Ausdrücke enthalten, außerdem kann eine Vielzahl von Funktionen und Operatoren verwendet werden. Die sind zum Beispiel:

Zugriffsindex (Zählung beginnt bei 1)
Relationszeichen: = != and or < > <= >=
Zeichenkettenfunktionen:
- normalize-space() – Entfernen von Leerzeichen am Anfang und Ende des Strings und Reduktion aufeinanderfolgender Leerzeichen auf eines
- substring() – Einen Teilstring selektieren
- substring-before(source, splitter) – Einen Teilstring vor dem ersten Vorkommen des Trennzeichens selektieren
- substring-after(source, splitter) – Einen Teilstring nach dem ersten Vorkommen des Trennzeichens selektieren
- string-length() – Länge des Strings
Numerische Operatoren: + - * div mod
Knotenmengen-Funktionen:
- count() – Anzahl der Knoten in einer Knotenmenge
- id() – Selektiert Elemente über die DTD-ID
- name() – Name des Knotens

Beispiele:

//child::Buch/Kapitel Alle Kapitel aller Bücher.
//child::Buch/Kapitel[1] Alle ersten Kapitel aller Bücher.
//child::Buch[count(./Seite)<=100][count(./Seite)>=10] liefert alle Knoten vom Typ „Buch“, die mindestens 10 aber höchstens 100 Kindelemente vom Typ „Seite“ haben.

(das gleiche leistet //Buch[count(Seite)<=100 and count(Seite)>=10])

substring-before($variable, ':') Selektiert den Teilstring vor dem ersten Doppelpunkt aus dem Wert der Variable mit dem Namen variable

Beispiel[Bearbeiten | Quelltext bearbeiten]

Gegeben sei folgendes XML-Dokument:

<?xml version="1.0" encoding="utf-8" standalone="yes" ?>
<dok>
    <!-- ein XML-Dokument -->
    <kap title="Nettes Kapitel">
        <pa>Ein Absatz</pa>
        <pa>Noch ein Absatz</pa>
        <pa>Und noch ein Absatz</pa>
        <pa>Nett, oder?</pa>
    </kap>
    <kap title="Zweites Kapitel">
        <pa>Ein Absatz</pa>
        <pa format="bold">Erste Zeile</pa>
        <pa format="bold">Zweite Zeile</pa>
        <pa format="italic">Dritte Zeile</pa>
    </kap>
</dok>

Beispiele für XPath-Ausdrücke:

Ausdruck	selektiert …
`/dok`	das erste Element `dok`
`/*`	das äußerste Element unabhängig vom Namen (jedes wohlgeformte XML-Dokument hat genau ein äußerstes Element), hier `dok`
`//dok/kap`	alle `kap`-Elemente innerhalb aller `dok`-Elemente
`//dok/kap[1]`	alle jeweils ersten `kap`-Elemente innerhalb aller `dok`-Elemente
`//pa`	alle `pa`-Elemente auf allen Ebenen
`//kap[@title='Nettes Kapitel']/pa`	alle Absätze der Kapitel mit Titel „Nettes Kapitel“.
`//kap/pa[2]`	Jeweils das zweite pa-Element in den beiden Kapiteln.
`//kap[2]/pa[@format='bold'][2]`	Zweite Zeile mit dem Format 'bold' im 2. Kapitel.
`child::*`	alle Kindelemente des gegenwärtigen Knotens
`child::pa`	alle `pa`-Kinder des gegenwärtigen Knotens
`child::text()`	alle Textknoten des gegenwärtigen Knotens
`.`	der gegenwärtige Knoten
`./*`	alle Kindelemente des gegenwärtigen Knotens
`./pa`	alle `pa`-Kinder des gegenwärtigen Knotens
`pa`	alle `pa`-Kinder des gegenwärtigen Knotens
`attribute::*`	alle Attribute des gegenwärtigen Knotens
`namespace::*`	alle Namespaces des gegenwärtigen Knotens
`//kap[1]/pa[2]/text()`	Textinhalt des zweiten `pa`-Elements im ersten `kap`-Element (also „Noch ein Absatz“)

XPath-Visualisierer helfen, die mitunter komplizierten XPath-Abfragen auf konkrete XML-Dateien anzuwenden.

Siehe auch[Bearbeiten | Quelltext bearbeiten]

Document Object Model

Literatur[Bearbeiten | Quelltext bearbeiten]

Michael Kay: XPath 2.0 Programmer’s Reference. Wrox Press, 2004, ISBN 0-7645-6910-4 (englisch)
Margit Becher: XML – DTD, XML-Schema, XPath, XQuery, XSLT, XSL-FO, SAX, DOM. W3L Verlag, Witten 2009, ISBN 978-3-937137-69-8.

Weblinks[Bearbeiten | Quelltext bearbeiten]

Wiktionary: XPath – Bedeutungserklärungen, Wortherkunft, Synonyme, Übersetzungen

XML Path Language (XPath) Version 1.0; sowie deutsche Übersetzung
XML Path Language (XPath) Version 2.0
XML Path Language (XPath) Version 3.1
XQuery 1.0 and XPath 2.0 Functions and Operators
XPath Tutorial auf deutsch
XPath Tutorial von w3schools
ZVON: XPath Tutorial in deutscher Sprache
FH Wedel: XLink, XPath, XPointer
HTMLWorld: XPath
XPath Achsen Diagramme
XPath Visualizer stellt XPath-Ausdrücke visuell auf Basis beliebiger XML-Dateien dar.
umfangreiche XPath 2.0 Referenz mit Beispielen

Einzelnachweise[Bearbeiten | Quelltext bearbeiten]

↑ w3.org

[1] w3.org

[1]


Empfehlungen	ActivityPub \| ARIA \| Canonical XML \| CDF \| CSS \| DOM \| Geolocation API \| HTML \| HTML5 \| InkML \| ITS \| JSON-LD \| MathML \| OWL \| P3P \| PLS \| PNG \| RDF \| RDF-Schema \| RIF \| SCXML \| SISR \| SKOS \| SMIL \| SOAP \| SRGS \| SSML \| SVG \| SPARQL \| Timed Text \| Turtle \| VoiceXML \| WSDL \| XForms \| XHTML \| XHTML+RDFa \| XInclude \| XLink \| XML \| XML Base \| XML-Encryption \| XML Events \| XML Information Set \| XML Namespace \| XML Schema \| XML Signature \| XPath \| XPointer \| XProc \| XQuery \| XSL \| XSL-FO \| XSLT (Elemente)
Arbeitsentwürfe und Kandidaten	CCXML \| CURIE \| SMIL Timesheets \| sXBL \| WICD \| XFrames \| XBL \| XHTML+MathML+SVG \| XMLHttpRequest
Anmerkungen	XAdES \| XFDL \| XHTML+SMIL \| XUP
Richtlinien	Web Content Accessibility Guidelines \| Multimodal Interaction Activity \| Markup Validation Service
Initiativen	Web Accessibility Initiative

XPath

Inhaltsverzeichnis

Prinzipien[Bearbeiten | Quelltext bearbeiten]

Achsen[Bearbeiten | Quelltext bearbeiten]

Knotentests[Bearbeiten | Quelltext bearbeiten]

Prädikate[Bearbeiten | Quelltext bearbeiten]

Beispiel[Bearbeiten | Quelltext bearbeiten]

Siehe auch[Bearbeiten | Quelltext bearbeiten]

Literatur[Bearbeiten | Quelltext bearbeiten]

Weblinks[Bearbeiten | Quelltext bearbeiten]

Einzelnachweise[Bearbeiten | Quelltext bearbeiten]

Navigationsmenü

XPath

Prinzipien[Bearbeiten | Quelltext bearbeiten]

Achsen[Bearbeiten | Quelltext bearbeiten]

Knotentests[Bearbeiten | Quelltext bearbeiten]

Prädikate[Bearbeiten | Quelltext bearbeiten]

Beispiel[Bearbeiten | Quelltext bearbeiten]

Siehe auch[Bearbeiten | Quelltext bearbeiten]

Literatur[Bearbeiten | Quelltext bearbeiten]

Weblinks[Bearbeiten | Quelltext bearbeiten]

Einzelnachweise[Bearbeiten | Quelltext bearbeiten]

Navigationsmenü

Suche