Features Preise FAQ
Branchen
Behörden Unternehmen Bildung Gesundheit Finanzen Recht
Ressourcen
Ratgeber Glossar
Login Kostenlos starten
Features Preise FAQ
Branchen
Behörden Unternehmen Bildung Gesundheit Finanzen Recht
Ressourcen
Ratgeber Glossar
Login Kostenlos starten
Glossar-Eintrag

CMap – Character Map in PDF-Schriften

Was ist eine CMap?

Eine CMap (Character Map) ist eine Zuordnungstabelle in PDF-Schriften, die Zeichencodes auf Glyph-Indizes abbildet. Sie ist entscheidend für die korrekte Darstellung und Verarbeitung von Text in PDFs.

CMap-Typen in PDFs

CMap-Typ Funktion Richtung
Encoding CMap Zeichencode → Glyph-ID Eingabe → Anzeige
ToUnicode CMap Glyph-ID → Unicode Anzeige → Extraktion
CID CMap Für CIDFont-Schriften CID-basiert

CMap vs. ToUnicode

  • CMap: Allgemeiner Begriff für Zeichenzuordnungen
  • Encoding CMap: Wie Zeichen im PDF gespeichert sind
  • ToUnicode CMap: Spezielle CMap für Unicode-Zuordnung

Predefined CMaps

PDF definiert Standard-CMaps für verschiedene Zeichensätze:

  • Identity-H/V: Horizontale/vertikale Identitätszuordnung
  • WinAnsiEncoding: Windows Western European
  • MacRomanEncoding: Mac Roman
  • UniGB-UCS2-H: Chinesisch (vereinfacht)

CMap-Probleme erkennen

Symptome

  • Falsche Zeichen bei der Anzeige
  • Fehlende Glyphen (leere Kästchen)
  • Falsches Kopieren von Text

Diagnose

In Acrobat Preflight unter „Schriften“ → „Encoding“ prüfen, welche CMap verwendet wird.

PDF/UA und CMaps

  • ToUnicode-CMap ist Pflicht für Barrierefreiheit
  • Alle Glyphen müssen Unicode-Mapping haben
  • Symbolschriften benötigen ActualText als Alternative

Verwandte Begriffe

Häufige Fragen zur CMap

Was ist der Unterschied zwischen CMap und Encoding?

Encoding ist ein einfaches Mapping für 256 Zeichen (8-Bit). CMap ist flexibler und kann komplexe Zeichenzuordnungen für Unicode und CID-Fonts abbilden.

Warum zeigt mein PDF chinesische Zeichen falsch an?

Wahrscheinlich fehlt die CJK-CMap oder die Schrift ist nicht vollständig eingebettet. Stellen Sie sicher, dass Schrift und CMap korrekt eingebettet sind.