Features Preise FAQ
Branchen
Behörden Unternehmen Bildung Gesundheit Finanzen Recht
Ressourcen
Ratgeber Glossar
Login Kostenlos starten
Features Preise FAQ
Branchen
Behörden Unternehmen Bildung Gesundheit Finanzen Recht
Ressourcen
Ratgeber Glossar
Login Kostenlos starten
Glossar-Eintrag

Natural Language – Natürliche Sprache in PDFs

Was ist Natural Language?

Natural Language (natürliche Sprache) bezieht sich auf die menschliche Sprache, in der Textinhalte eines PDF-Dokuments verfasst sind. Im Kontext der PDF-Barrierefreiheit bezeichnet der Begriff die korrekte Kennzeichnung der Sprache für assistive Technologien.

Bedeutung für Barrierefreiheit

  • Screenreader: Wählt automatisch die richtige Sprachausgabe
  • Aussprache: Wörter werden korrekt ausgesprochen
  • Sprachsynthese: TTS-Stimme passt zur Sprache

PDF/UA-Anforderungen

Anforderung Matterhorn Beschreibung
Dokumentsprache 06-001 Hauptsprache muss definiert sein
Sprachenwechsel 06-003 Abweichungen markieren
Gültiger Code 06-002 BCP 47 Sprachcode verwenden

Sprachidentifikation auf verschiedenen Ebenen

1. Dokumentebene

Die Hauptsprache des gesamten Dokuments wird im Catalog-Dictionary gesetzt.

2. Strukturebene

Einzelne Abschnitte (Sect, Part) können eigene Sprachattribute haben.

3. Inline-Ebene

Span-Tags markieren fremdsprachige Wörter oder Phrasen im Fließtext.

Praktische Umsetzung

Wann Sprachenwechsel markieren?

  • Ja: Zitate in Fremdsprache
  • Ja: Fachbegriffe mit spezieller Aussprache
  • Nein: Eingebürgerte Fremdwörter (Computer, Software)
  • Nein: Eigennamen, Firmennamen

Mehrsprachige Dokumente

Bei Dokumenten mit mehreren Sprachen:

  1. Hauptsprache als Dokumentsprache setzen
  2. Abschnitte in anderer Sprache mit Lang-Attribut markieren
  3. Bei Bedarf Inline-Sprachenwechsel mit Span

Screenreader-Verhalten

Ohne korrekte Sprachauszeichnung:

  • Deutscher Screenreader liest englischen Text mit deutscher Phonetik
  • „Cloud“ wird zu „Klout“ statt „Klaud“
  • Nutzer verstehen den Inhalt schlechter

Verwandte Begriffe

Häufige Fragen zur natürlichen Sprache

Was passiert ohne Sprachauszeichnung?

Screenreader verwenden die Systemsprache oder raten. Fremdsprachige Inhalte werden mit falscher Aussprache vorgelesen, was das Verständnis erschwert.

Welche Sprachen unterstützt PDF/UA?

PDF/UA unterstützt alle Sprachen mit BCP 47 Sprachcode. Das sind praktisch alle lebenden Sprachen der Welt, von Afrikaans bis Zulu.