Available at http://www.zfdg.de
Sofern nicht anders angegeben
Available at http://www.zfdg.de; (c) Forschungsverbund MWW
Einreichung als Fachartikel in der ZfdG durch die Autoren
Transformation der WORD-Vorlage nach XML/TEI-P5 durch TEI-Oxgarage und XSLT-Skripten
Lektorat des Textes durch die Redaktion in Person von
Medienrechte liegen bei den Autoren
All links checked
Der Beitrag thematisiert die Entstehung und technische Umsetzung der
low
tech-Lösungen wie dem Open Source CMS »WordPress« dennoch den
gängigen Standards zu entsprechen und zeigt so beispielhaft, wie es
möglich ist, ein DH-Projekt fast kostenneutral und ohne technischen
Partner zu gestalten.
The paper deals with the creation and technical implementation of the
low tech solutions like the Open Source CMS »WordPress« and
shows how it is possible to design a DH project almost
cost-neutral and without technical partners.
Die
Die leges zusammengefasst werden können. Zu diesem Zweck
werden alle relevanten Überlieferungsträger für jeden einzelnen Rechtstext
erfasst.
Die
Unter den genannten Rechtstexten stellen die
Da die Editionen all dieser Rechtstexte zu einem großen Teil im 19. bzw. am
Anfang des 20. Jahrhunderts entstanden sind, verzeichnen sie nicht alle
Handschriften. Hier war es notwendig, auf die Forschungsliteratur
zurückzugreifen und die Liste der Textzeugen für die einzelnen Rechtstexte zu
ergänzen. Neben Mordeks leges sind z.B. die
Studien von Rudolf Buchner
Hinsichtlich der Textauszeichnung erfolgte der Rückgriff auf etablierte Standards zur langfristigen Gewährleistung programm- und plattformunabhängiger Weiterverarbeitung der Daten. Die ursprüngliche Datensammlung, die – wie bereits erwähnt – zu Beginn in Form einer Wordtabelle vorlag, wurde mittels TEI OxGarage und unter der Verwendung von Regulären Ausdrücken (RegEx) zunächst nach XML überführt und dann händisch nachbearbeitet.
Bei der Hierarchisierung und der
Wahl der Elemente wurde darauf geachtet, dass diese den in
Handschriftenbeschreibungen nach TEI P5 verwendeten schon möglichst nahekommen
sollten, um eine einfache Generierung zu gewährleisten. Der Körper der so
entstandenen Korpusdatei besteht aus einer Liste, die für jede Handschrift ein
<item>
mit einem xml:id
-Attribut enthält. Die ID basiert
dabei auf der Signatur (im Falle der <item xml:id=“admont-sb-712“ n=“1“>
) und
entspricht auch dem späteren Dateinamen der xml-Datei für diese Handschrift. Die
Korpusdatei dient zum einen als Datengrundlage für verschiedene Übersichten (und
damit als Zugänge zu den einzelnen Textzeugen). Zum anderen werden daraus
mittels XSL auch die TEI-konformen Handschriftenbeschreibungen generiert, welche
den aktuellen Forschungsstand abbilden und als Download verfügbar sind. Durch
diesen Workflow müssen Hinzufügungen und Änderungen lediglich in der Korpusdatei
vorgenommen werden. Diese schlagen sich dann automatisch in den davon abhängigen
Dateien nieder.
Auch die Graphen oder Karten, welche unter der Verwendung von Google Charts, Google Maps bzw. dem freien Geoinformationssystem QuantumGIS (QGIS) hergestellt werden, basieren auf den zentral in der Korpusdatei kompilierten Daten.
Zur Beschreibung der Handschriften wurde zunächst ein TEI-Schema unter Verwendung des TEI Roma Tools hergestellt, um diese validieren zu können. Dabei wurde neben den auf der TEI-Webseite enthaltenen Informationen zu den einzelnen Modulen bzw. Elementen auch die Dokumentation der Herzog August Bibliothek Wolfenbüttel herangezogen.
Neben der Korpusdatei, den einzelnen Dateien, welche die
Handschriftenbeschreibungen enthalten, einem Personenregister, einem
Ortsregister, einer Liste der haltenden Institutionen und einer
Projektbibliographie (alle in XML) gehören weiterhin die Transformationsskripte
(XSL), Schemadateien sowie weitere Materialien wie Karten, Textdokumente und
PDF-Dateien zum Grundbestand des Projektes. Die einzelnen Dateien sind dabei
über ein Cloud-System in einer gemeinsamen Ordnerstruktur allen beteiligten
Personen zugänglich, um sicherzustellen, dass es nicht zu Versionskonflikten
kommt und alle stets Zugriff auf die aktuellste Fassung haben.
Zu Beginn des Projektes Anfang 2012 war nicht absehbar, wie sich die damals noch
im Aufbau begriffenen Infrastrukturen langfristig entwickeln würden und ob
beispielsweise Textgrid eine
geeignete Plattform darstellen könnte. Die Absenz von Fördermitteln
determinierte die Wahl eines möglichen Frameworks. Um basale Funktionen wie eine
Volltextsuche, Nutzerverwaltung oder Mehrsprachigkeit zu ermöglichen, wurde –
nachdem verschiedene Möglichkeiten überlegt und zumindest zum Teil auch getestet
worden waren – das Open Source Content Management System »WordPress«
Fast alle Seiten bestehen ursprünglich aus XML-Daten, welche innerhalb des CMS mittels verschiedener XSL-Transformationen zu HTML verarbeitet werden. Diese Funktionalität wird durch das XSL Processor Plugin bereitgestellt. Weitergehende Funktionalitäten werden ebenfalls über Plugins realisiert. Eine Volltextsuche (mittels Relevanssi Plugin) steht ebenfalls zur Verfügung und kann über das Suchfeld betätigt werden. Neben Kategorien und Schlagwörtern, die für die Einordnung von Blogposts verwendet werden, bietet »WordPress« mittels Taxonomien auch die Möglichkeit, die einzelnen Seiten nach eigenen Kriterien einzuordnen. Über diese Taxonomien wird eine facettierte Suche ermöglicht, die auch die Kombination von verschiedenen Kriterien erlaubt.
Neben den Handschriftenbeschreibungen, die den Kern der Ressource bilden, gibt es
Einführungstexte zu den einzelnen Rechtstexten, eine umfangreiche
Projektbibliographie, verschiedene Indizes zu Personen, Orten und haltenden
Institutionen (unter Verwendung von Normdaten), Editionen und Transkriptionen von
Einzeltextenleges zu jeder Handschrift
kurz zusammengefasst.leges sowie nach Entstehungszeit und
Entstehungsort anzeigen. Die Aufstellung nach enthaltenen leges
Um Gestaltung und Funktionalitäten der Ressource zur Diskussion zu stellen und somit ggf. frühzeitig Verbesserungsmaßnahmen ergreifen zu können, wurde zu Beginn des Jahres 2013 ein mehrwöchiger User-Test durchgeführt. Weiterhin wurden Studierende gebeten, die Webseite auszutesten und Rückmeldung zu ihren Erfahrungen mit deren Umgang zu geben. Für den User-Test, der online innerhalb der Ressource bearbeitet werden konnte, wurden bewusst Personen mit unterschiedlichem Kenntnisstand und Erfahrungsschatz bezüglich mittelalterlicher Geschichte einerseits und digitalen Ressourcen andererseits angesprochen, um ein möglichst breites, potenzielles Nutzerfeld abzufragen. In erster Linie ging es darum, ob die hinterlegten Informationen auch dort zu finden sind, wo sie von Nutzerseite erwartet wurden, also um die Verständlichkeit und intuitive Bedienbarkeit der Navigation sowie um das Design der Seite. Der Test fiel – obwohl die Seite zu diesem Zeitpunkt noch nicht die vollständigen Inhalte und Funktionen enthielt – insgesamt sehr positiv aus. Die Seite wurde allgemein als übersichtlich und gut strukturiert sowie als ansprechend gestaltet bewertet.
Im Laufe der letzten Jahre ist die Webseite auch immer wieder um neue Inhalte
erweitert worden. Durch die Beschäftigung sowohl mit dem Quellenmaterial als auch mit
der Forschungsliteratur ergaben sich vielfach neue Fragestellungen, die weitere
Darstellungen und Auswertungen nötig machten oder andere Teilaspekte in den
Fokus rückten.
Eine massive Erweiterung, die – dadurch, dass sie händisch vorgenommen wurde – einige Zeit in Anspruch nahm, war die Übersetzung aller Inhalte ins Englische. Zwar war die Webpräsenz von Anfang an als mehrsprachige Seite konzipiert, doch schlug sich dies zunächst nur in der Menüführung sowie im Bedarfsfall dem Verfassen englischsprachiger Blogbeiträge nieder. Die dadurch notwendig gewordenen Änderungen führten zu einem Aufblähen des Codes in der erwähnten Korpusdatei und auch zur Ausweitung der XSL-Skripte, doch hat sich seit dieser Umstellung die Nutzung der englischsprachigen Seite nachweislich stark vermehrt, so dass diese danach weitaus häufiger frequentiert worden ist als die deutschsprachige.
Von Beginn an wurde projektbegleitend eine möglichst umfassende
Dokumentation
Die Webseite steht unter einer »Creative Commons Attribution Non-Commercial Share Alike-Lizenz«, was bedeutet, dass die hier zusammengestellten Informationen ohne Einschränkung für nicht-kommerzielle Zwecke genutzt und unter gleichen Bedingungen weitergegeben werden dürfen, sofern das Projekt ordnungsgemäß als Quelle zitiert wird.
Was die gerade angesprochene technische Umsetzung angeht, wurde und wird die
Erfreulicherweise hat die Forschungscommunity die Datenbank positiv aufgenommen,
was sich vor allem darin zeigt, dass sie in wissenschaftlichen Publikationen
genannt und zitiert wird, dies vor allem seit 2014, also bereits zwei Jahre nach
dem Launch der Webseite.
Die leges untersucht, vgl. LegIT / Online-Hilfsmittel. Darüber hinaus im Rahmen von Linksammlungen, z.B.
bei der Bodleian Library der Universität Oxford, vgl. Oxford LibGuides / 300 - 1000 AD: Roman law survival, oder der Bibliothek der Universität Kassel, vgl. Historisches Erbe / Thematische Sammlungen.
Handschriften stellen allgemein sehr geeignete Objekte dar, um in der Lehre als
zentrale Quellen mittelalterlicher Kultur thematisiert zu werden. Innerhalb von
Lehrveranstaltungen an der Universität zu Köln wurde das Projekt daher mehrfach
präsentiert und teils auch aktiv in diese miteinbezogen. So wurde die Ressource
den Teilnehmerinnen und Teilnehmern eines Oberseminares zur mittelalterlichen
Geschichte im Wintersemester 2012/2013 zunächst vorgestellt sowie grundlegend in
den Bereich der Digital Humanities eingeführt, bevor innerhalb des Seminares
dann selbst Inhalte (z.B. Übersetzungen) produziert wurden, die seitdem auf der
Webseite verfügbar sind.
Das Projekt wurde weiterhin sowohl im Rahmen von Veranstaltungen aus dem
DH-Bereich als auch mehrfach der Öffentlichkeit präsentiert, so z.B. im Rahmen
der TEI-Konferenz 2013 wie auch bei der DHd 2015,
jeweils im Rahmen der Posterausstellungen. Darüber hinaus findet es sich in einer
vom
Gerade in der Anfangsphase eines Projektes müssen bereits zahlreiche, oftmals
richtungsweisende Entscheidungen getroffen werden, die den zukünftigen Erfolg
oder Misserfolg, potenziell auftretende Probleme und Lösungsmöglichkeiten
determinieren. Auch wenn die Funktionalitäten bisher ohne größeren Aufwand fast
vollständig erhalten werden konnten und sich insbesondere das gewählte Framework
als äußerst zuverlässig und pflegeleicht erwiesen hat, ist langfristig nicht
absehbar, wie sich die technologischen Standards in Zukunft entwickeln werden.
Hinsichtlich der Entscheidungen bezüglich der verwendeten Standards und des
gewählten Präsentationframeworks kann bisher ein durchweg positives Urteil
gefällt werden. Wenn auch die Ressource an sich zunächst eine »Insellösung«
darstellt(e), so kann diese Problematik durch die Integration in größere Portale
wie beispielsweise
Die Sicherstellung der Aktualität und Konsistenz der Daten hat bisher keine größeren Schwierigkeiten verursacht, da diejenigen, die die Datenbank anfangs im Rahmen von Beschäftigungsverhältnissen als studentische Hilfskräfte inhaltlich und technisch aufgebaut haben, dem Projekt heute noch verbunden sind und es ehrenamtlich weiter pflegen. Kleinere Aufgaben können glücklicherweise an die jeweils aktuell am Lehrstuhl von Karl Ubl beschäftigten studentischen Hilfskräfte ausgelagert werden, die damit gleichzeitig einen ersten Einblick in die Arbeit an DH-Projekten erhalten wie auch grundlegende Kenntnisse in der Textauszeichnung nach TEI P5-Standard erwerben.
Die bewusst gewählten low tech-Lösungen gewährleisten
seither zuverlässig die leichte Wartbarkeit des Systems sowie personelle
Unabhängigkeit. Die hinter »WordPress« liegenden XML-Technologien funktionieren
plattformunabhängig, sodass notfalls – wenn auch mit einem gewissen zeitlichen
Aufwand – ohne größere Probleme auf eine andere Plattform gewechselt werden
könnte. Auch die URLs werden (mit Ausnahme des Blogs), direkt über innerhalb der
XML-Dateien hinterlegte Parameter mittels XSL erzeugt, so dass sich diese im
Falle eines Umzugs nicht ändern würden. Ein Umzug auf eine andere Plattform ist
zum jetzigen Zeitpunkt nicht geplant, da sich »WordPress« für das Projekt, welches
ja weder über Drittmittel noch über einen technischen Partner verfügt, gerade
wegen der einfachen Instandhaltung, der breiten Community, die an diesem CMS
partizipiert und damit dem Vorhandensein zahlreicher Plugins zur Erweiterung der
Funktionalitäten, insgesamt als sehr geeignet erwiesen hat. Hierbei sei aber
nicht verschwiegen, dass man sich durch die Verwendung dieser Erweiterungen in
eine gewisse Abhängigkeit begibt, da zahlreiche Plugins verwaist sind und nicht
mehr mit den – im Vergleich zu DrupalDrupal hat beispielsweise im
Neben den positiven Nebeneffekten der Entstehung als ursprünglich rein
lehrstuhlinterne Ressource wie der Chance, mögliche Lösungsansätze und
Umsetzungsmöglichkeiten einfach ausprobieren zu können, so dass die Datenbank
ohne den Druck durch eine festgelegte Projektlaufzeit oder strikte Vorgaben
seitens der Fördermittelgeber wachsen konnte, gibt es natürlich auch Aspekte,
die in diesem Zusammenhang als durchaus kritisch zu bewerten sind. So wurde der
Frage nach der Langzeitverfügbarkeit zu Beginn der Arbeit wenig Beachtung
geschenkt. Spätestens mit der wachsenden Nutzung und Rezeption sowie auch der
Integration in Portale wie
Ein eher zu vernachlässigendes Problem ist, dass im aktuellen technischen Setting keine XSL 2.0-Skripte verwendet werden können. Dies kann zwar durchaus lästig sein und erschwert beispielsweise das Gruppieren, bisher konnten aber immer entsprechende Workarounds gefunden werden.
Da die
Dass mit dem Akademieprojekt
Umfassendere Arbeiten, wie beispielsweise ein Relaunch nach einigen Jahren, sind
rein mit ehrenamtlicher Betreuung allerdings nur schwer zu gewährleisten. Auch
die Eingliederung in die (noch in Entstehung begriffenen) Infrastrukturen zur
Sicherung der langfristigen Verfügbarkeit wird kostenneutral wohl kaum zu
bewältigen sein. Zu Beginn des Jahres 2018 wurde die
Insgesamt kann die