[DHd-blog] Das DTA-Basisformat bekommt Verstärkung

[德语国家数字人文协会DHd-blog网站消息]

Die Pflege und Weiterentwicklung des DTA-Basisformats (DTABf) wird nun durch eine Steuerungsgruppe begleitet. Erweiterungen des Formats, neue Features und Korrekturen werden öffentlich diskutiert und durch das Gremium verabschiedet.

Über das DTA-Basisformat

Das DTA-Basisformat (DTABf) ist ein Format zur Auszeichnung historischer Drucke mit einer Erweiterung für Handschriften auf Basis der TEI-P5-Richtlinien, das vor allem für den Aufbau und die Erschließung historischer Volltextkorpora genutzt wird. Es schränkt die Richtlinien der TEI so ein, dass Ambiguitäten im Tagging vermieden werden, während weiterhin eine möglichst große Anzahl von Phänomenen der Vorlage modelliert werden kann. Mit der Ausarbeitung des DTABf unterbreiten wir einen Vorschlag für einen Standard zur Volltext-Aufbereitung historischer Texte.

Das DTABf soll die Kompatibilität und Interoperabilität von digitalisierten Texten stärken und so einen Beitrag leisten, um homogen aufbereitete und qualitativ hochwertige Forschungsdaten für die Wissenschaft bereitzustellen und nachnutzbar zu machen.

Abb.: Auszug aus der DTA-Basisformat-Dokumentation

Auftrag der DTABf-Steuerungsgruppe

Zunehmend wird das DTABf, das im Projektkontext des DTA entstand, auch von externen Projekten verwendet. Damit steigt der Bedarf, das Format für Kontexte außerhalb des korpuslinguistischen Fokus des DTA zusätzlich nutzbar zu machen. Um dieser Entwicklung gerecht zu werden, wurde eine Steuerungsgruppe gegründet, deren Mitglieder durch ihre Verankerung in verschiedenen Communities unterschiedliche Perspektiven und Expertisen bei der Weiterentwicklung des Formats einbringen können.

Die DTABf-Steuerungsgruppe setzt sich aus Expertinnen und Experten für TEI-Auszeichnung und -Anpassung zusammen. Sie gehörten zum Teil bereits dem ursprünglichen Team des DTA an; zum Teil repräsentieren sie andere Projekte, die ebenfalls das DTA-Basisformat einsetzen. Mitglieder sind Matthias Boenig (BBAW, OCR-D), Daniel Burckhardt (GHI Washington DC), Stefan Dumont (BBAW, Telota), Alexander Geyken (BBAW, DWDS & ZDL), Martina Goedel (textloop & CCEH), Susanne Haaf (BBAW, ZDL & t.evo), Axel Herold (BBAW, ZHistLex & DWDS/ZDL) und Christian Thomas (BBAW, CLARIN-D & edition humboldt digital).

Die DTABf-Steuerungsgruppe trifft sich regelmäßig, um Entwicklungen am DTA-Basisformat abzustimmen und über neue Vorschläge zu entscheiden. Im Fokus stehen dabei die Erweiterungs- und Änderungsvorschläge der Nutzenden, die über Tickets auf der GitHub-Präsenz des DTABf gemeldet werden. Alle Vorschläge werden vor dem Hintergrund der DTABf-Leitlinien beraten.

Literatur

Für weiterführende Publikationen zum DTA-Basisformat s. die entsprechende Publikationsliste in der DTABf-Dokumentation.