Was ist Natural Language?
Natural Language (natürliche Sprache) bezieht sich auf die menschliche Sprache, in der Textinhalte eines PDF-Dokuments verfasst sind. Im Kontext der PDF-Barrierefreiheit bezeichnet der Begriff die korrekte Kennzeichnung der Sprache für assistive Technologien.
Bedeutung für Barrierefreiheit
- Screenreader: Wählt automatisch die richtige Sprachausgabe
- Aussprache: Wörter werden korrekt ausgesprochen
- Sprachsynthese: TTS-Stimme passt zur Sprache
PDF/UA-Anforderungen
| Anforderung | Matterhorn | Beschreibung |
|---|---|---|
| Dokumentsprache | 06-001 | Hauptsprache muss definiert sein |
| Sprachenwechsel | 06-003 | Abweichungen markieren |
| Gültiger Code | 06-002 | BCP 47 Sprachcode verwenden |
Sprachidentifikation auf verschiedenen Ebenen
1. Dokumentebene
Die Hauptsprache des gesamten Dokuments wird im Catalog-Dictionary gesetzt.
2. Strukturebene
Einzelne Abschnitte (Sect, Part) können eigene Sprachattribute haben.
3. Inline-Ebene
Span-Tags markieren fremdsprachige Wörter oder Phrasen im Fließtext.
Praktische Umsetzung
Wann Sprachenwechsel markieren?
- Ja: Zitate in Fremdsprache
- Ja: Fachbegriffe mit spezieller Aussprache
- Nein: Eingebürgerte Fremdwörter (Computer, Software)
- Nein: Eigennamen, Firmennamen
Mehrsprachige Dokumente
Bei Dokumenten mit mehreren Sprachen:
- Hauptsprache als Dokumentsprache setzen
- Abschnitte in anderer Sprache mit Lang-Attribut markieren
- Bei Bedarf Inline-Sprachenwechsel mit Span
Screenreader-Verhalten
Ohne korrekte Sprachauszeichnung:
- Deutscher Screenreader liest englischen Text mit deutscher Phonetik
- „Cloud“ wird zu „Klout“ statt „Klaud“
- Nutzer verstehen den Inhalt schlechter
Verwandte Begriffe
- Lang-Attribut – Technische Umsetzung
- Span-Tag – Für Inline-Sprachenwechsel
- Screenreader – Nutzt Sprachinformation
- PDF/UA – Definiert Anforderungen
Häufige Fragen zur natürlichen Sprache
Was passiert ohne Sprachauszeichnung?
Screenreader verwenden die Systemsprache oder raten. Fremdsprachige Inhalte werden mit falscher Aussprache vorgelesen, was das Verständnis erschwert.
Welche Sprachen unterstützt PDF/UA?
PDF/UA unterstützt alle Sprachen mit BCP 47 Sprachcode. Das sind praktisch alle lebenden Sprachen der Welt, von Afrikaans bis Zulu.