Leerzeichen
aus Wikipedia, der freien Enzyklopädie
| Satzzeichen |
|---|
| - – — ― ⸗ |
| . , ; : … · |
| ¿ ? ! ¡ ‽ ⸮ |
| „…“ »…« ’ |
| / \ |
| (…) […] {…} 〈…〉 |
| ␠ |
| Sonstige Zeichen |
| • |
| @ & |
| | ¦ |
| ° ′ ″ ‴ |
| * ⁂ † ‡ |
| # № ª º |
| § ¶ |
| © ℗ ® ™ ℠ |
| _ |
| ~ ˜ |
| Rechenzeichen |
| + − × · : ∕ ÷ ± ∓ |
| = ≈ ≠ ~ ∝ < > |
| √ ∫ |
| % ‰ |
Das Leerzeichen (auch Wortzwischenraum, seltener Leerstelle, korrekte Bezeichnung laut Duden: Leerschritt, bes. schweiz. Leerschlag, engl. blank) dient der Abgrenzung von Wörtern oder anderen Informationen innerhalb eines zusammenhängenden Fließtextes. Man erhält ein Leerzeichen auf der Schreibmaschine und der Computertastatur durch Betätigen der Leertaste, der größten Taste unten auf der normalen Computertastatur. Für einen guten Schriftsatz werden Leerzeichen unterschiedlicher Breite verwendet.
Inhaltsverzeichnis |
[Bearbeiten] Breite des Leerzeichens
Schreibmaschinenschriften waren überwiegend nichtproportional, also dicktengleich – das heißt jedes Zeichen besaß die gleiche Breite, auch das Leerzeichen. Bei solchen Monospace-Schriften können daher Leerzeichen auch zur Ausrichtung von Tabellen anstelle des Tabulators verwendet werden.
Daneben gibt es auch ein schmales Leerzeichen, um für zusammengehörende Texteinheiten einen erkennbaren Unterschied gegen den normalen Wortabstand zu setzten (etwa in Abkürzungen wie »z. B.«, als Tausendertrenner oder zwischen Maßzahl und Maßeinheit).
[Bearbeiten] Entwicklung des Leerzeichens
In antiken Texten war eine Trennung der Wörter nicht üblich. Die dichte Anordnung des Textes zwang den Leser zur sorgfältigen und in den meisten Fällen lauten Lektüre. Erst im 7. Jahrhundert wurde die Wortteilung eingeführt. Die klaren Wortabstände erleichterten das schnelle Erkennen und Verstehen der Texte.
Johannes Gutenberg kannte nur einen richtigen Wortabstand. Den Randausgleich der Zeilen in seiner 42-zeiligen Bibel erzielte er mit Hilfe verschieden breiter Buchstaben. Der gute Wortabstand entsprach dem Innenraum des kleinen „n“. An ihm orientierten sich von nun an die guten Schriftsetzer.
Die Erfindung der Schreibmaschine brachte einen weiteren Wortabstand. Er entsprach der immer gleichen Buchstabenbreite und ließ das Gefühl für den richtigen Zwischenraum verschwinden.
Jan Tschichold, der Erneuerer der Typografie des 20. Jahrhunderts, griff die mittelalterliche Idee des guten Wortabstands wieder auf. Sein Biograf Werner Lemke berichtet, dass Tschichold kleine Florpapierstückchen in seiner Geldbörse aufbewahrte, um die Buchstaben- und Wortabstände ideal auszugleichen, wo die feinsten Spatien der Schriftsetzer nicht ausreichten.
Dementsprechend sollte bei Drucksachen auf den guten Wortabstand geachtet werden. Denn zu große Wortabstände erzeugen, wie der präraffaelitische Buchkünstler William Morris sagt: „Hässliche sich windende weiße Linien im Text“, die senkrecht oder schräg zu den Zeilen verlaufen. In der Sprache der Buchdrucker heißt dieser typografische Fehler „Gießbach“ oder „Gasse“. Gießbäche lassen das Auge aus dem Text irren und erschweren das Lesen.
[Bearbeiten] Verwendung von Leerzeichen
[Bearbeiten] Druckwesen
Leerzeichen sind zum einen notwendig, um eine Zeile zum Blocksatz zu strecken. Darüber hinaus werden sie in Abkürzungen wie z. B. verwendet. Auch die korrekte Schreibweise von Zahlen wird mit Hilfe der Leerzeichen erreicht (Bsp. 123 456 789). Der Wortzwischenraum entspricht bei den meisten Schriftarten etwa dem Raum, den ein kleines „i“ einnehmen würde. Die Größe der Wortzwischenräume bleibt im Flattersatz konstant, während sie im Blocksatz variieren kann.
In der modernen Textverarbeitung trifft die Schreibmaschinentastatur auf die Typographie. Der typographisch weniger geschulte Computernutzer ist mit der Verwendung der richtigen Leerzeichen meist überfordert, da sie je nach Anwendung unterschiedlich eingegeben werden müssen. Teilweise werden auch vom Textverarbeitungsprogramm selbstständig die passenden Leerzeichen erkannt. Neben den unterschiedlichen Breiten gibt es noch geschützte Leerzeichen, an deren Position am Zeilenende nicht umbrochen werden darf.
Zwei typische Fehler der Leerzeichensetzung haben eigenständige Namen bekommen:
- Plenk: überflüssiges Leerzeichen vor Satzzeichen
- „Deppenleerzeichen“ (Leerzeichen in Komposita): fehlerhaftes Leerzeichen innerhalb zusammengesetzter Substantive
[Bearbeiten] Datenverarbeitung
Leerzeichen gehören zum Whitespace, und sind damit als Steuerzeichen zu werten: Sie beeinflussen im allgemeinen in allen Belangen das Parsen beliebigen Codes, indem sie Codeblöcke abgrenzen - in diesem Sinne gilt das auch für die reine Schriftdarstellung: Die Wörter stellen für den am Computer allgemein üblichen automatischen Zeilenumbruch die einzeln zu lesenden Informationseinheiten dar. Daher sind Leerzeichen, sofern sie nicht dagegen geschützt sind, im Text immer Umbruchmarken. In vielen Programmiersprachen und Codierungen sind sie das Terminationszeichen der einzelnen Befehle – in anderen werden sie aber als Whitespace prinzipiell ignoriert : Beispiele: C verwendet sie, Java nicht, HTML ignoriert sie (außer im Text), nicht aber der URI-Code, siehe unten.
[Bearbeiten] Darstellung des Leerzeichens
[Bearbeiten] Bleisatz
Im Bleisatz wurden Leerzeichen als Form des typografischen Weißraums in verschiedenen Breiten mit Hilfe des Ausschlusses (Blindmaterials, wie Gevierte, Spatien) erzeugt.
[Bearbeiten] Desktop Publishing und Webtypographie
In der Darstellung der Datenverarbeitung ist das Leerzeichen im allgemeinen ein Leerraum (Whitespace).
Für die Zwecke des Zeilenumbruchs gibt es zwei Typen von Leerzeichen:
- Umbrechendes Leerzeichen
- Geschütztes Leerzeichen, das einen automatischen Umbruch unterbindet
[Bearbeiten] Schriftzeichen in ASCII und andere Kodierungen
Das Leerzeichen hat den ASCII-Code 32, UnicodeU+0020, . Für bestimmte Zwecke gibt es besondere Leerzeichen, zum Beispiel das nicht-umbrechende oder geschützte Leerzeichen, in ISO 8859-1 mit dem Zeichencode 160, HTML-Entity :
| Code | Kein Umbruch | HTML | Name | Codeblock | Beispiel | Beschreibung |
|---|---|---|---|---|---|---|
| U+0020 |   | Space | Basic Latin | ▕ ▏ | Normales Leerzeichen, vergleichbar mit dem ASCII-Zeichen 0x20 | |
| U+00A0 | ✓ | | No-Break Space | Latin-1 Supplement | ▕ ▏ | Wie U+0020, aber die Zeile darf hier nicht umbrochen werden. |
| U+1680 |   | Ogham Space Mark | Ogham | ▕ ▏ | Wird für Wortzwischenräume in Ogham-Texten benutzt. Benötigt eine Ogham-Schriftart. | |
| U+2002 |   | En Space, or Nut |
General Punctuation | ▕ ▏ | So breit wie ein en (halb so breit wie ein em) | |
| U+2003 |   | Em Space, or Mutton |
General Punctuation | ▕ ▏ | So breit wie ein em | |
| U+2004 |   | Three-Per-Em Space, or Thick Space |
General Punctuation | ▕ ▏ | So breit wie 1/3 des em | |
| U+2005 |   | Four-Per-Em Space, or Mid Space |
General Punctuation | ▕ ▏ | So breit wie 1/4 des em | |
| U+2006 |   | Six-Per-Em Space | General Punctuation | ▕ ▏ | So breit wie 1/6 des em. In der computergestützten Typografie oft gleich mit U+2009. | |
| U+2007 | ✓ |   | Figure Space | General Punctuation | ▕ ▏ | In Schriften mit Ziffern fester Breite entspricht Figure Space der Breite einer Ziffer. |
| U+2008 |   | Punctuation Space | General Punctuation | ▕ ▏ | So breit wie ein enger, nach einem Interpunktionszeichen wie einem Komma folgender Abstand zum nächsten Zeichen. | |
| U+2009 |   | Thin Space | General Punctuation | ▕ ▏ | So breit wie 1/5 des em (manchmal auch gleich wie U+2006) | |
| U+200A |   | Hair Space | General Punctuation | ▕ ▏ | Noch dünner als U+2009 | |
| U+200B | ​ | Zero-Width Space | General Punctuation | ▕▏ | Nicht sichtbarer Abstand. Wird für Computersysteme verwendet um Wortgrenzen anzuzeigen, wenn die Wörter nicht getrennt geschrieben werden. Daher zählt es nicht zu den Whitespace-Zeichen. Im Blocksatz können aber Leerräume zwischen den Wörtern entstehen. In HTML kann man dieses Zeichen als optionalen Umbruch in sehr langen Wörtern verwenden. Vergleichbar mit dem veralteten Tag <wbr>. Das Zeichen wird aber nicht von allen Browsern unterstützt. | |
| U+202F | ✓ |   | Narrow No-Break Space | General Punctuation | ▕ ▏ | Nicht umbrechend wie U+00A0 jedoch schmaler |
| U+205F |   | Medium Mathematical Space | General Punctuation | ▕ ▏ | Für mathematische Formeln | |
| U+2060 | ✓ | ⁠ | Word Joiner | General Punctuation | ▕▏ | Wie U+200B aber ohne Zeilenumbruch. Dieses Zeichen wurde in Unicode 3.2 eingeführt um die Funktion von U+FEFF als „Wortverbinder“ zu übernehmen. |
| U+3000 |   | Ideographic Space | CJK Symbols and Punctuation | ▕ ▏ | So breit wie ein chinesisches, japanisches bzw. koreanisches Schriftzeichen. | |
| U+FEFF | ✓ |  | Zero Width No-Break Space = Byte Order Mark (BOM) |
Arabic Presentation Forms-B | ▕▏ | Wird vorwiegend für die Darstellung der Byte Order Mark verwendet. Daher zählt es nicht zu den Whitespace-Zeichen. Die Verwendung als Leerzeichen mit Nullbreite ohne Umbruch wird seit Unicode 3.2 nicht mehr empfohlen. Siehe auch U+2060. |
Der Unicode-Block Symbole für Steuerzeichen definiert auch zwei visuelle Symbole, die Leerzeichen darstellen, selbst jedoch keine sind.
| Code | Zeichen | Name | Beschreibung |
|---|---|---|---|
| U+2422 | ␢ | blank symbol | Das kleine b mit Strich steht für blank (englisch für „Leerzeichen“). Es wurde in den 1960er Jahren von IBM eingeführt und nicht mehr verwendet. |
| U+2423 | ␣ | open box | Die offene Schachtel wird beispielsweise in Softwaredokumentation verwendet, um ein Leerzeichen grafisch darzustellen. Sie wird auch in den meisten Handytastaturen dafür verwendet. |
[Bearbeiten] Darstellung in HTML und Verwandten
In HTML ist eine Einstellung des typographischen Weißraums durch Skalierung des Leerzeichens oder eine Spationierung, also Sperrung, möglich.
Ein Umbruch eines nicht geschützten Leerzeichens kann durch das Attribut nowrap unterdrückt werden, das sich den Elementen für Text, Absatz, Tabellenzellen, oder auch CSS-Klassen zuweisen lässt.[1]
Alternativ können mithilfe von span-Tags mit der CSS-Eigenschaft margin-left Weißräume beliebiger Breite erzeugt werden:
123<span style="margin-left:0.167em">456</span><span style="margin-left:0.167em">789</span>ergibt:- 123456789
- (Darstellung eines schmalen Leerraums für die Zifferngruppierung)
[Bearbeiten] Codierung in TeX, LaTeX
Für die manuelle Einstellung der Abstände zwischen Zeichen stellt TeX bzw. LaTeX folgende Befehle zur Verfügung:
| Darzustellender Zwischenraum | Syntax | Länge | So sieht’s gerendert aus |
|---|---|---|---|
| 2 quad | a\qquad b |
2 quad | ![]() |
| 1 quad | a\quad b |
1 quad | ![]() |
| normaler Textabstand[2] | a\ b |
6/18 quad | ![]() |
| großer Zwischenraum | a\;b |
5/18 quad | ![]() |
| kleiner Zwischenraum | a\,b |
3/18 quad | ![]() |
| kein Zwischenraum | ab |
0 quad | ![]() |
| kleiner negativer Zwischenraum | a\!b |
−3/18 quad | ![]() |
Dabei stehen der große Zwischenraum a\;b und der kleine negative Zwischenraum a\!b nur im Mathematikmodus, nicht aber im Textmodus zur Verfügung.
Die Länge 1 quad (auch em genannt) wird im Deutschen mit Geviert bezeichnet.
[Bearbeiten] Leerzeichen in 8.3-Dateinamen
Im FAT-Dateisystem sind Leerzeichen in Dateinamen nicht zulässig. Die Dateinamen kürzer als acht Buchstaben (und Dateinamenserweiterungen kürzer als drei Buchstaben) werden in den Verzeichniseinträgen mit Leerzeichen aufgefüllt, welche aber nicht zum Dateinamen gehören. Im ISO-9660-Dateisystem können Leerzeichen in Dateinamen durch Unterstriche („_“) ersetzt werden.
[Bearbeiten] Leerzeichen in URIs
Da ein Leerzeichen auch in URIs als Sonderzeichen zählt (Ende der URL), werden darin vorhandene Leerzeichen umkodiert, wie auch beispielsweise deutsche Umlaute und eckige oder geschweifte Klammern. Die Kodierung besteht aus dem Zeichen % und dem Zeichencode in zwei Hexadezimal-Ziffern (bei Multibytezeichen entsprechend für jedes Byte), für das Leerzeichen wäre das (gemäß ISO 8859-1) %20.
In der älteren Codierung application/x-www-form-urlencoded wird ein Leerzeichen durch ein „+“ ersetzt.






