Was ist eine CMap?
Eine CMap (Character Map) ist eine Zuordnungstabelle in PDF-Schriften, die Zeichencodes auf Glyph-Indizes abbildet. Sie ist entscheidend für die korrekte Darstellung und Verarbeitung von Text in PDFs.
CMap-Typen in PDFs
| CMap-Typ | Funktion | Richtung |
|---|---|---|
| Encoding CMap | Zeichencode → Glyph-ID | Eingabe → Anzeige |
| ToUnicode CMap | Glyph-ID → Unicode | Anzeige → Extraktion |
| CID CMap | Für CIDFont-Schriften | CID-basiert |
CMap vs. ToUnicode
- CMap: Allgemeiner Begriff für Zeichenzuordnungen
- Encoding CMap: Wie Zeichen im PDF gespeichert sind
- ToUnicode CMap: Spezielle CMap für Unicode-Zuordnung
Predefined CMaps
PDF definiert Standard-CMaps für verschiedene Zeichensätze:
- Identity-H/V: Horizontale/vertikale Identitätszuordnung
- WinAnsiEncoding: Windows Western European
- MacRomanEncoding: Mac Roman
- UniGB-UCS2-H: Chinesisch (vereinfacht)
CMap-Probleme erkennen
Symptome
- Falsche Zeichen bei der Anzeige
- Fehlende Glyphen (leere Kästchen)
- Falsches Kopieren von Text
Diagnose
In Acrobat Preflight unter „Schriften“ → „Encoding“ prüfen, welche CMap verwendet wird.
PDF/UA und CMaps
- ToUnicode-CMap ist Pflicht für Barrierefreiheit
- Alle Glyphen müssen Unicode-Mapping haben
- Symbolschriften benötigen ActualText als Alternative
Verwandte Begriffe
- ToUnicode – Spezielle CMap für Unicode
- Unicode-Mapping – Zeichenzuordnung
- Glyph – Schriftzeichen
- Character Encoding – Zeichenkodierung
Häufige Fragen zur CMap
Was ist der Unterschied zwischen CMap und Encoding?
Encoding ist ein einfaches Mapping für 256 Zeichen (8-Bit). CMap ist flexibler und kann komplexe Zeichenzuordnungen für Unicode und CID-Fonts abbilden.
Warum zeigt mein PDF chinesische Zeichen falsch an?
Wahrscheinlich fehlt die CJK-CMap oder die Schrift ist nicht vollständig eingebettet. Stellen Sie sicher, dass Schrift und CMap korrekt eingebettet sind.