box_acrobat921

XML-Strukturen in PDF – assistive Technologien

Präsentator: Markus Müller-Trabucchi & Ute Mitschke.

Die barrierefreie Aufbereitung von Publikationen beginnt häufig mit der Verfügbarkeit von ungetaggten PDF-Dateien, deren Inhalte extrahiert werden sollen. Statt der bisher häufig angewandten Form, Publikationen mittels OCR-Erkennung zu digitalisieren, kann zwischen diversen Exportformaten aus PDF gewählt werden.

An einem Beispiel soll gezeigt werden, wie XML-Daten aus einem ungetaggten und einem getaggten PDF-Dokument erzeugt werden. Um die Export-Ergebnisse sinnvoll bewerten zu können, wird vorher ein spezieller Anforderungskatalog erstellt, der sich an den Kriterien Lesbarkeit, Verständlichkeit und Handhabung der konkreten Dateninhalte orientiert.

Als Ausblick auf einen mehrkanaligen, multimedialen Publikationsworkflow werden Szenarien zu einer möglichen, vollautomatischen Aufbereitung der Inhalte für ein synthetisches Audiodokument skizziert.

Adobe Recorded eSeminar in einem neuen Fenster starten