Was ist ein Glyph?
Ein Glyph ist die grafische Darstellung eines Zeichens in einer bestimmten Schriftart. Während ein Zeichen (Character) ein abstraktes Symbol ist (z.B. der Buchstabe „A“), ist ein Glyph dessen konkrete visuelle Form in einer spezifischen Schrift.
Zeichen vs. Glyph
| Aspekt | Zeichen (Character) | Glyph |
|---|---|---|
| Definition | Abstraktes Symbol | Visuelle Darstellung |
| Beispiel | Großbuchstabe A (U+0041) | „A“ in Times New Roman |
| Standard | Unicode | Font-spezifisch |
| Anzahl | ~150.000 in Unicode | Tausende pro Font |
Glyphen in PDFs
PDFs speichern Text als Glyph-IDs, nicht als Zeichen:
- Jeder Buchstabe wird als Glyph-Index referenziert
- Die Schrift (Font) enthält die Glyph-Definitionen
- ToUnicode mappt Glyphen zurück auf Unicode
Glyph-Varianten
Ligaturen
Mehrere Zeichen werden zu einem Glyph kombiniert: „fi“, „fl“, „ffi“. Für Barrierefreiheit brauchen diese ActualText.
Kontextuelle Formen
Arabische und andere Schriften haben verschiedene Glyphen für dasselbe Zeichen je nach Position im Wort.
Stylistic Alternates
Dekorative Varianten desselben Zeichens in OpenType-Fonts.
Barrierefreiheit und Glyphen
- ToUnicode: Mappt Glyph-IDs auf Unicode
- ActualText: Ersatztext für Ligaturen
- Alt-Text: Für Symbolglyphen ohne Unicode
Verwandte Begriffe
- CMap – Character Map
- ToUnicode – Unicode-Mapping
- Embedded Fonts – Schrifteinbettung
- Character Encoding – Zeichenkodierung
Häufige Fragen zu Glyphen
Warum werden Ligaturen falsch kopiert?
Ligaturen sind ein Glyph für mehrere Zeichen. Ohne ActualText-Attribut fehlt die Information, welche Einzelzeichen enthalten sind.
Was sind fehlende Glyphen?
Wenn eine Schrift ein benötigtes Zeichen nicht enthält, wird ein Ersatzzeichen (meist ein Kästchen) angezeigt. Lösung: Schrift wechseln oder einbetten.