Dotplots und Alignments als Untersuchungsinstrumente für Überlieferungsgemeinschaften am Beispiel von Priameln

Views
228
Downloads
6
Closed Peer Review
Kategorie
Artikel
Version
1.0
Frank Buschmann Autor*inneninformationen
Aron Fink Autor*inneninformationen

DOI: 10.17175/2023_009

Nachweis im OPAC der Herzog August Bibliothek: 1858885027

Erstveröffentlichung: 14.12.2023

Lizenz: Sofern nicht anders angegeben Creative Commons Lizenzvertrag

Medienlizenzen: Medienrechte liegen bei den Autor*innen

Letzte Überprüfung aller Verweise: 27.11.2023

GND-Verschlagwortung: Alignment (Biochemie) | Bioinformatik | Priamel | Sequenzanalyse (Chemie) | Germanistik | 

Empfohlene Zitierweise: Frank Buschmann / Aron Fink: Dotplots und Alignments als Untersuchungsinstrumente für Überlieferungsgemeinschaften am Beispiel von Priameln. In: Zeitschrift für digitale Geisteswissenschaften 8 (2023). 14.12.2023. HTML / XML / PDF. DOI: 10.17175/2023_009


Abstract

Im vorliegenden Beitrag werden zwei ursprünglich bioinformatische Verfahren, die bereits in geisteswissenschaftlicher Forschung genutzt worden sind, für die Ermittlung von (fast) identischen Reihen einzelner Texte in verschiedenen Überlieferungsträgern oder Textsammlungen genutzt: einerseits Dotplots, die eine optische Identifizierung identischer Reihungen ermöglichen, andererseits eine automatisierte Reihenermittlung durch den Smith-Waterman-Algorithmus. Es geht dabei nicht um Vergleiche der Texte selbst, sondern um die Textreihenfolgen in verschiedenen Sammlungen. Neben knappen Darstellungen zu beiden Verfahren beschreibt der Beitrag anhand von Anwendungsbeispielen aus der Überlieferung der mittelalterlichen Textgattung der Priamel die Arbeit mit Dotplots und den anhand des Smith-Waterman-Algorithmus ermittelten Textreihen.


This paper applies two methods that were originally designed as tools in bioinformatics but have been transferred to research in the humanities, to detect identical or near-identical sequences of individual texts in different manuscripts or textual compilations: thus, in order to pinpoint such sequences, the approach combines dot plots as a way of visualizing these sequences with an automated sequence alignment based on the Smith–Waterman algorithm. Rather than providing an analysis of these texts in terms of traditional or contemporary textual criticism, the aim of the paper is to compare text sequences. In addition to a short description of these methods, the paper discusses how dot plots and the Smith–Waterman algorithm can be applied for the sake of detecting sequences of texts by making reference to selected examples from the textual tradition of the medieval German literary genre of the Priamel.

1. Zu Hans Rosenplüt, den Priameln und Textreihen in der Überlieferung

[1]In einem kürzlich in der ZfdG veröffentlichten Beitrag bespricht Marco Heiles, wie sich Zusammenhänge zwischen Rezeptsammlungen anhand von Graphen abbilden lassen.[1] Heiles geht von einer einzelnen Sammlung aus, um diese mit anderen Überlieferungszeugen zu vergleichen. Er weist bei seinen Vorüberlegungen darauf hin, dass bei der Abbildung komplexer Überlieferungsverhältnisse einer großen Zahl an Einzeltexten klassische Darstellungsformen an ihre Grenzen geraten: »Listen und Tabellen sind geeignet, den Zusammenhang der Überlieferung einer kleinen Anzahl von Sammlungen darzustellen, ein Gesamtbild der Überlieferung können sie aber nicht zeigen.«[2] Dies gilt freilich nicht nur für Rezeptsammlungen, sondern letztlich auch für anders konturierte Überlieferungsgemeinschaften, die z. B. Lieder des Minne- oder Meistersangs oder verschiedene (Sang-)Sprüche vereinen.[3]

[2]Ein ähnliches Problem liegt auch bei der in diesem Beitrag zentralen Gattung vor, nämlich den Priameln. Diese paarweise gereimten Kurztexte im Umfang von 8–14 Versen[4] sind in Handschriften und Drucken des 15. und 16. Jahrhunderts erhalten; sie treten in größeren Sammlungen und als Streuüberlieferung[5] auf.[6]

[3]Priamel sind öfter in Handschriften zu finden, die eine auffällige Konzentration auf Dichtungen des Nürnberger Handwerkers Hans Rosenplüt (um 1400–1460)[7] aufweisen, weshalb er als derjenige gilt, der die Literarisierung der Gattung maßgeblich vorantrieb.[8] Zu den Handschriften notiert Hansjürgen Kiepe:

[4]»Alle älteren Sammlungen überliefern die Nürnberger Priamel im Verbund mit anderen Texten: mit Fastnachtsspielen, Mären, geistlichen und weltlichen Reimpaarsprüchen, Minnereden und Weingrüßen, großenteils aus dem Bereich der von Hans Rosenplüt verfassten oder wenigstens mit ihm in Verbindung gebrachten Dichtungen. Sie stellen damit einen besonderen Typ der Nürnberger literarischen Sammelhandschrift dar, zu dessen Charakteristik die Gattungsbreite bei den Reimpaardichtungen wie das Fehlen jeglicher Sangspruchdichtung gehört und den man geradezu als Rosenplüt-Handschrift bezeichnen kann – nicht allein wegen seines Textanteils, sondern auch, weil die Sammlungen recht genau die Ausrichtung und Breite seiner Produktion spiegeln. Und eben dieser Befund legt die Annahme nahe, er sei der Urheber der Priameldichtung.«[9]

[5]Einen weiteren Hinweis auf seine Autorschaft bietet eine Rubrik in der Handschrift Cgm 713 der Bayerischen Staatsbibliothek in München. Dort ist auf fol. 33r zu lesen: »Etliche geistliche Sneperer«, wobei »Sneperer« wahrscheinlich über einem getilgten »Priameln« notiert wurde.[10] Das Wort ›Sneperer‹ steht in enger Verbindung zu Rosenplüt; es handelt sich um eine Art Zweitnamen, den er im Laufe seines Lebens annimmt.[11] In der Forschung hat sich die Meinung durchgesetzt, dass man es bei Hans Rosenplüt und Hans Schnepper mit einer Person zu tun hat,[12] und zwar aufgrund verschiedener Autornennungen am Ende seiner Reimpaardichtungen und Lieder;[13] man erfährt dort etwa, dass der vorangehende Text von »Schnepprer hans Rosenplut«[14] stamme. Jörn Reichel wertet diese Signaturen aus, wobei er einige der mit doppeltem Namen ausgeführten Signaturen als authentisch ansieht,[15] andere hingegen als sekundär erweiterte Formen einordnet[16]. Doch auch diejenigen Fälle, in denen die Textausgänge im Laufe der Überlieferung variieren, bieten wichtige Hinweise im Hinblick auf die Frage nach dem (zeitgenössischen) Wissen um die Autorschaft: »Zugleich wird klar, daß man Rosenplüt im Nürnberger Umkreis, in dem die H[andschriften] mit wenigen Ausnahmen geschrieben wurden, auch als Autor unter seinem Nürnberger Bürgernamen und nicht unter dem in den meisten Gedichten als Signatur gesetzten Geburtsnamen Rosenplüt kannte.«[17] Dieses Wissen dürfte bei der Anlage verschiedener Handschriften ein relevantes Kriterium gewesen sein, da z. B. in einem prominenten Codex der Rosenplüt-Überlieferung (Mscr.Dresd.M.50 der SLUB Dresden)[18] neben signierten auch unsignierte Dichtungen versammelt worden sind, die heute Rosenplüt zugeschrieben werden. Im Falle der Dresdner Handschrift hat man es mit Reimpaarsprüchen und Liedern, mit Fastnachtspielen und Priameln zu tun;[19] dies sind zugleich die drei Gattungsbereiche, in denen Rosenplüt literarisch aktiv war.[20]

2. Problemstellung

[6]Es geht im Folgenden um Priamel, die Hansjürgen Kiepe aufgrund der nicht abschließend zu klärenden Frage nach der tatsächlichen Autorschaft unter dem Stichwort ›Werkkomplex Rosenplüt‹ versammelt.[21] Von wenigen Beiträgen abgesehen[22] wurden Priamel in den letzten Jahren von der Forschung eher vernachlässigt,[23] eine moderne kritische Ausgabe fehlt bislang[24].

[7]Ähnlich wie Heiles für die Rezeptüberlieferung geht Kiepe bei der Untersuchung der Priamelüberlieferung von einer einzelnen Sammlung aus (der erwähnten Dresdner Handschrift Mscr.M.50) und ermittelt über identische Textabfolgen in anderen Handschriften und Drucken Abhängigkeiten.[25] Er kommt zu dem Ergebnis, dass

[8]»die Quellen […] in mannigfachen Beziehungen zueinander [stehen], sie gehen nicht etwa unabhängig voneinander, Handschrift für Handschrift, auf Einzeldrucke von Priameln zurück. [...] Denn da die Priamel des Werkkomplexes ›Rosenplüt‹ vor 1460 entstanden sein dürften, kann es nicht verwundern, wenn Handschriften, die erst der Zeit danach angehören, auf Sammlungen zurückgehen, die auf Sammlungen zurückgehen, und wenig über die Verhältnisse der Zeit aussagen. Über die Entstehung der ältesten Sammlungen aber kann man nur spekulieren.«[26]

[9]Anhand dieses Zitates lassen sich die von ihm angenommenen Grundzüge der Priamelüberlieferung benennen: Ein Großteil der Textzeugen entstand erst um bzw. nach dem Tod des Autors.[27] Diese Priamelsammlungen würden keine umfassenden stemmatischen Abhängigkeiten im Sinne umfangreicher Sammelvorlagen anzeigen.[28] Weiterhin müssten als Vorstufe der erhaltenen Sammlungen verschollene Textensembles gelten, deren Umfang und Zuschnitt ungewiss ist. Da verschiedentlich Beziehungen zwischen Teilen von Sammlungen festgestellt werden könnten, seien rein individuelle Zusammenstellungen, die etwa auf Drucke von Einzeltexten oder Sammlungen geringeren Umfangs zurückgehen, vermutlich nicht der Ursprung der erhaltenen Ensembles.

[10]Dieser Einschätzung kann man sich insgesamt anschließen, sieht man vom letzten Punkt ab. Es ist nämlich so, dass Kiepe durchaus Fälle behandelt, die Hinweise auf die Gestalt verlorener Vorstufen bieten: Es sind Beispiele dafür erhalten, dass Rosenplüt-Dichtungen in kleineren Publikationsformen im Umlauf waren, und zwar als schmale handschriftliche Hefte im Umfang weniger Blätter.[29] Bei diesen ›Einzelheften‹ handelt es sich um selbstständige Publikationen, die lediglich eine einzelne Lage mit wenigen Blättern umfassen. Derartige Einzelhefte sind auch für die spätere Drucküberlieferung etwa des Nürnbergers Hans Folz (aktiv zwischen 1479–1488)[30] bekannt; in diesem Zusammenhang notiert Ursula Rautenberg: »Diese einzelne Lage hat den Vorteil, daß durch das Falzen eines Bogens bzw. Ineinanderstecken eines gefalzten, zerschnittenen Bogens bereits ohne Heftung eine, wenn auch fragile, buchtechnische Einheit gebildet wird.«[31] Im Rosenplüt-Kontext gibt es solche Heftchen mit einer Priamelsammlung[32], mit Reimpaardichtungen und Liedern[33] oder Fastnachtspielen[34].

[11]Die heute erhaltenen Zusammenstellungen von Priameln kann man aus guten Gründen als ›Sammlungen‹ bezeichnen, also als (vermutlich planvolle)[35] Zusammenstellungen mehrerer Einzeltexte. Es wäre im Einzelfall zu überlegen, ob es sich im Sinne Jürgen Wolfs um additive oder synthetische Sammlungen (bzw. eine der Unterformen) handelt;[36] dass in den meisten Fällen eine Sammlungsidee vorlag, wird man schon aufgrund der strukturellen Ähnlichkeiten der Einzeltexte so gut wie immer annehmen können. Der Terminus ›Sammlung‹ gilt in unserem Fall entsprechend für jegliche zusammenhängende Reihe von Priameln, sobald die untere Grenze des Einzeltextes überschritten ist.

[12]In der Drucküberlieferung gibt es mehrere Priamel-Einblattdrucke, die lediglich einen solchen Einzeltext tradieren.[37] Für sich gesehen hätte man es bei diesen offensichtlich nicht mit einer Sammlung zu tun, was sich jedoch ändert, sobald der gedruckte Text abgeschrieben und in einen neuen Kontext integriert wird.[38] Einen Sonderfall an der unteren Grenze stellen Textpaare dar. Erhalten ist ein Wandtafeldruck, welcher untereinander zwei Priamel ähnlichen Inhaltes vereint.[39] In systematischer Sicht kann man dieses Paar bereits als Sammlung bezeichnen; als Terminus bietet sich in solchen Fällen die Bezeichnung als ›Kleinstsammlung‹ an.

[13]Hier setzen die Überlegungen des vorliegenden Beitrages an. Die zugrundeliegende Hypothese akzentuiert Kiepes Befund stärker in Richtung der verlorenen Vorlagen: Auch wenn sich bei den erhaltenen Handschriften keine unmittelbaren Abhängigkeiten in größerem Umfang feststellen lassen, so gilt dies nicht für kleinere konkrete Abfolgen von Texten.[40] Anzunehmen ist, dass kleinere Publikationsformate wie Einzelhefte oder Einblattdrucke verbreitet und daher als Vorlagen der heute erhaltenen Sammlungen verfügbar waren. Da sich Abhängigkeiten von Einzeltext-Drucken nur durch textkritische Untersuchungen feststellen lassen, ist die untere Grenze des vorgeschlagenen Verfahrens die Kleinstsammlung von zwei Priameln.

[14]Es ist daher eine Methode erforderlich, die Überlieferungszusammenhänge in einem größeren Korpus darstellbar macht, ohne auf eine einzelne Handschrift oder einen einzelnen Druck als Ausgangspunkt angewiesen zu sein. Dafür ist ein Vergleich der konkreten Reihen an Einzeltexten in möglichst vielen (bestenfalls allen) Überlieferungszeugen erforderlich, um kleinere Gruppen mit identischer oder annähernd identischer Anordnung ermitteln zu können.[41] Als Untersuchungsgegenstand dienen daher Kürzel für die Einzeltexte, nicht jedoch die Texte selbst.

[15]Diese quantitative Analyse kann freilich nicht für sich stehen, sondern ihre Ergebnisse sind anhand konkreter Textanalysen, bei denen auf mögliche Abhängigkeiten zwischen den Textzeugen einzugehen wäre, zu validieren.[42] Damit bewegt sich das Vorgehen unmittelbar innerhalb des von Thomas Weitin und Ulrik Brandes entwickelten Rahmens des Reading at Scale,[43] das das Scalable Reading[44] ablöst, sich wie letzteres aber zwischen »Einzeltextlektüren und Makroanalysen«[45] bewegt.

3. Vorüberlegungen: Methodische Schnittstellen von Biologie und Philologe

[16]Wir werden im Folgenden die Verwendung einer Methode vorschlagen, die auf Werkzeuge für den Vergleich von DNA-Sequenzen zugreift und diese für philologische Fragestellungen nutzt. Interdisziplinär ausgerichtete Ansätze, die Biologie und Philologie verbinden, sind freilich nicht neu: Bereits 1977 wiesen Norman Platnick und Don Cameron auf zentrale Parallelen in den Ordnungs- und Kategorisierungsmodellen von Phylogenetik (Kladistik), Stemmatologie (Textkritik) und historischer Linguistik hin.[46] Als verbindendes Modell kann exemplarisch das Baumdiagramm (Stemma) gelten, welches Hypothesen zu Herkunft und Abhängigkeiten von z. B. Lebewesen oder handschriftlichen und gedruckten Textzeugnissen abzubilden vermag.[47] Und auch wenn Kathrin Chlench und Gabriel Viehhauser grundsätzlich konstatieren, dass sich aufgrund der Eigenheiten der mittelalterlichen volkssprachlichen Überlieferung hinsichtlich gleichwertiger Fassung und der Offenheit bzw. Varianz von Texten gewisse Vorbehalte gegen Stammbäume eingestellt haben,[48] so können sie im Anschluss doch eindrücklich zeigen, dass es durchaus auch weiterhin sinnvoll ist, auf biologische Methoden wie die flexible Darstellungsform des Phylogramms zuzugreifen.[49]

[17]Während man bei phylogenetischen Analysen in der Biologie die Abfolgen der vier Bausteine der DNA (Adenin, Guanin, Cytosin und Thymin) vergleicht, werden bei philologischen Studien verschiedene Texte als Untersuchungsgröße herangezogen. Das dafür erforderliche Vorgehen beschreiben Christopher Howe und Heather Windram:

[18]»The approach for applying phylogenetic methods to texts is simple in principle […]. The texts are aligned and then encoded as a string of characters, usually with each character corresponding to a word. The character strings are then used to build a file in exactly the same format as used by phylogenetic tree-building programs, and the file is submitted to the same programs, unaltered.«[50]

[19]Die Bezugsgröße ist also statt der DNA als Verkettung einzelner Basenpaare der Text als Verkettung einzelner Wörter. Für einen Vergleich wird er einer Tokenisierung unterzogen,[51] einer Zerlegung in kleinere Einheiten (z. B. die einzelnen Wörter)[52]. Damit die Überführung der Wörter in einen ›character‹ gelingt, ist bei mittelalterlichen und frühneuzeitlichen Texten eine Normalisierung (›regularization‹)[53] der Wortformen notwendig, da sonst aufgrund der variablen Graphematik die Ergebnisse der Analyse verzerrt würden.[54] Howe und Windram resümieren, dass in verschiedenen Studien, die auf diese Methodik zugriffen, die automatisch erzeugten Stemmata mit den Beobachtungen der klassischen Textkritik übereinstimmten.[55] Die Forschung ist in diesem Feld mittlerweile breit aufgestellt, die Zahl verschiedener Methoden ist groß.[56]

[20]Nun benötigen diese Verfahren als Material üblicherweise Text, und zwar bestenfalls digitalen Text. In der altgermanistischen Forschung ist man dabei grundsätzlich mit differierenden Ausgangsbedingungen konfrontiert: Während in einigen Fällen moderne digitale Editionen wie jene des Parzival Wolframs von Eschenbach[57] nach einer Normalisierung der variablen Graphien[58] eine Vergleichbarkeit ermöglichen, sind in anderen Fällen Textausgaben nicht digitalisiert und / oder mehr oder weniger stark durch die herausgebende Person überformt; teilweise fehlen bereits grundlegende Transkriptionen.[59]

[21]Die Priamelüberlieferung ist bisher nicht digital erschlossen, auch eine gedruckte Ausgabe bleibt ein Desiderat, auf der Textebene kann man daher nicht ansetzen. Es wäre zudem methodisch problematisch, vollständige Sammlungen in dieser Hinsicht über eine automatisierte Analyse stemmatisch zu untersuchen. In diesem Fall würden die Ergebnisse sehr wahrscheinlich verzerrt, da eine Übereinstimmung von kürzeren oder sehr kurzen Textfolgen in einer der größeren Sammlungen nur bedingt ins Gewicht fällt. Unser Ziel ist aber, genau solche überlieferungsgeschichtlichen Feinheiten feststellen zu können.

[22]Einen Ansatz, mit dem dieses Ziel zu erreichen ist, diskutiert Almuth Bedenbender: Sie verwendet für den Vergleich von frühneuhochdeutschen Rechtstexten unterschiedliche Verfahren und nutzt dabei auch sogenannte Dotplots,[60] um Gemeinsamkeiten verschiedener Textzeugen grafisch darstellbar zu machen.[61]

4. Korpusbildung und Aufbereitung der Daten

[23]Die Datenlage oberhalb der Textebene ist im Falle der Priamel gut, da Kiepe zwei umfassende Verzeichnisse vorgelegt hat. Das erste umfasst jene Priamel, bei denen die Autorschaft Rosenplüts wahrscheinlich ist,[62] das zweite (alphabetische geordnete) Verzeichnis weitere Priamel und priamelartige Stücke aus Nürnberger Handschriften und späteren Drucken sowie aus Karl Eulings Priamel-Teilausgabe[63].

[24]Für die digitale Analyse nutzen wir für die verschiedenen Priamel eindeutige Identifier, die auf diese Weise Token darstellen.[64] Sie basieren auf Kiepes Verzeichnissen, greifen also unmittelbar auf die etablierten Priamelkürzel und die von ihm jeweils gelisteten Textzeugen zu. Bei Stücken ohne Fassungen z. B. »Pr. 1«, bei Vorliegen mehrerer Fassungen z. B. »Pr. 25a/b«.[65] Dichtungen, die lediglich im nicht durchnummerierten alphabetischen Priamelverzeichnis auftauchen, sind mit dem Kürzel ›APrV‹ und einer anschließenden Nummer[66] erfasst.

Abb. 1: Ein Ausschnitt der Priamelsequenzen in unterschiedlichen Sammlungen. [Grafik: Frank Buschmann 2023]
Abb. 1: Ein Ausschnitt der Priamelsequenzen in unterschiedlichen Sammlungen. [Grafik: Frank Buschmann 2023]

[25]In einer tabellarischen Übersicht (vgl. den beispielhaften Ausschnitt in Abbildung 1) werden die Priamel-Identifier in ihrer konkreten Folge für die einzelnen Sammlungen notiert. Treten dabei kleinere Unterbrechungen durch weitere (normalerweise 1–2) Kurztexte auf, die nicht der Gattung ›Priamel‹ zuzuschlagen sind, werden diese mit ›GP‹ (= ›Gap‹) vermerkt.[67] Die in den Tabellenspalten gelisteten Textreihen bezeichnen wir im Folgenden als ›Sequenz‹.

[26]Eine Untergliederung einzelner Sammlungen in Teilsammlungen ist dann sinnvoll, wenn eine Handschrift oder ein Druck heterogen zusammengesetzt ist und verschiedene Einzeltexte und / oder Gattungen enthält, wie es im Rosenplüt-Kontext häufiger der Fall ist. In den größeren Sammelhandschriften bilden die Priamel relativ geschlossene Gruppen, die z. B. zwischen Zusammenstellungen von Reimpaarsprüchen und Liedern oder Fastnachtspielen stehen. Dieser Umstand veranlasste bereits Kiepe zur Ansetzung von Teilsammlungen, die durch hochgestellte Nummern nach den jeweiligen Siglen angezeigt werden (z. B. D1–D3 bei der Dresdner Handschrift Mscr.Dresd.M.50)[68]. Kiepes Gruppen wurden nachträglich um einige Untergruppen erweitert, die durch einen Asterisk zwischen Sigle und Nummer ausgewiesen sind.

[27]Erfasst worden sind insgesamt in diesem Schritt 57 (Teil-)Sammlungen, auf die sich die 140 im ›Werkkomplex Rosenplüt‹ verzeichneten Priamel sowie 73 Nachweise aus dem alphabetischen Priamelverzeichnis verteilen. Wir beziehen uns im Folgenden jeweils auf Ausschnitte aus diesem Korpus.

5. Analytische Zugänge: Dotplots und Smith-Waterman-Algorithmus

[28]Die Priamelsequenzen einzelner Sammlungen könnten prinzipiell händisch nach parallel verlaufenden Reihen durchsucht werden, indem man die spaltenweise geordneten Abfolgen sichtet. Naheliegender ist allerdings eine Automatisierung, die über zwei Wege erfolgen kann: (1) anhand eines grafischen Vergleiches über die bereits kurz erwähnten Dotplots, also durch eine Distant-Reading-Visualisierung, oder (2) über eine automatisierte Sequenzanalyse durch einen Algorithmus.

5.1 Priamel in Dotplots

[29]In der Molekularbiologie und Bioinformatik werden für den Vergleich verschiedener DNA-Sequenzen seit langem grafische Vergleiche spezifischer Anordnungen von Nukleotiden genutzt, nämlich sogenannte Dotplots.[69] Verglichen werden dabei paarweise DNA-Sequenzen, indem man die Nukleotide (in Form von Token, die die einzelnen Nukleotide kodieren) der einen Sequenz in die Spalten sowie die der anderen Sequenz in die Zeilen einer Matrix abträgt. Die einzelnen Elemente der Matrix werden dadurch ermittelt, dass bei einer Übereinstimmung der Spalten- und Zeileneinträge ein Punkt gesetzt wird, bei Nichtübereinstimmung nicht.[70] Wenn eine identische oder ähnliche Reihung vorliegt, ergeben sich derart abfallende diagonale Linien.[71]

[30]Im Kontext des Textvergleiches verwendete die Methode im Zusammenhang mit spätmittelalterlichen und frühneuzeitlichen Rechtstexten kürzlich Almuth Bedenbender.[72] Entsprechend vielversprechend ist eine Übertragung des Ansatzes auf den Vergleich von Priamelsequenzen: Anstelle von Nukleotiden nutzt man zur Kodierung der ›Sammlungs-DNA‹ die oben angeführten Identifier der Priamel als Token. Die Zeilen und Spalten bilden dann die jeweiligen Token der Priamelsequenzen der beiden Sammlungen, die miteinander verglichen werden sollen.

[31]Für die vorliegende Studie wurden für alle Vergleiche der Priamelsammlungen Dotplots in Excel erstellt; nach Ausschluss der Selbstvergleiche sowie der Dopplungen ergeben sich dabei 57 × 56 × 0,5 = 1596 Dotplots. Da die Durchsicht dieser Dotplots einzeln und nacheinander Zusammenhänge kaum identifizierbar macht, hat sich die Anlage einer alle Sammlungen umfassenden Matrix als sinnvoll erwiesen. Dafür werden alle Priamelsequenzen und ihre Token mit je einer freien Zelle als optischem Separator in die Spalten und Zeilen einer gemeinsamen Tabelle eingefügt. Anstelle der bei Dotplots üblichen Punkte wurden die Zellenwerte der Matrix wie folgt vergeben:

  • bei Übereinstimmung der Vergleichszellen eine 1;
  • bei Nichtübereinstimmung eine 0;
  • bei Sprüngen (›GP‹-Token) eine -1.

[32]Für die Ermittlung der Zellwerte kann in Excel mit einer Formel gearbeitet werden.[73] Die manuelle Anfertigung von Dotplots ist im kleineren Rahmen gut handhabbar, bei größeren Korpora und nachträglichen Änderungen oder Ergänzungen jedoch fehleranfällig und zeitintensiv. Eine automatisierte Lösung zur Erzeugung der Dotplots haben wir über ein Programm in der freien Programmiersprache R umgesetzt, das Dotplots im xlsx-Format erzeugt.[74]

Abb. 2: Ein Ausschnitt der Dotplots für den Vergleich unterschiedlicher Sammlungen in der Anordnung als übergreifende Matrix. [Grafik: Frank Buschmann 2023]
Abb. 2: Ein Ausschnitt der Dotplots für den Vergleich unterschiedlicher Sammlungen in der Anordnung als übergreifende Matrix. [Grafik: Frank Buschmann 2023]

[33]Die Werte dieser Matrix können durch bedingte Formatierung farblich differenziert werden (vgl. Abbildung 2).[75] Im abgebildeten Ausschnitt sind die Matrixzellen bei Nichtübereinstimmung in Gelb, bei Übereinstimmung in Grün sowie bei einer Lücke im rechten Drittel durch eine vertikale orange Linie angezeigt. Horizontale und vertikale weiße Linien trennen die verschiedenen Dotplots, grenzen also die Sequenzen voneinander ab.[76]

Abb. 3: Ein Ausschnitt der Dotplots für die Priamelüberlieferung mit Markierungen. [Grafik: Frank Buschmann 2023]
Abb. 3: Ein Ausschnitt der Dotplots für die Priamelüberlieferung mit Markierungen. [Grafik: Frank Buschmann 2023]

[34]Die kontinuierliche diagonale grüne Linie zeigt den Vergleich einer Sammlung mit sich selbst an (vgl. Abbildung 3, hier die durch den schwarzen Pfeil markierte Linie). Abseits dieser Diagonale gibt es im Beispiel einzelne Dotplots, die vollständig gelb eingefärbt sind (ein Beispiel im roten Viereck); hier deckt sich kein einziges Token, der Textbestand differiert also völlig. Mehrfach treten gepunktet wirkende Zonen auf (ein Beispiel im grünen Viereck), die parallel überlieferte, aber verschieden angeordnete Priamel anzeigen. Diagonal abfallende Linien (mehrere Beispiele in den beiden blauen Vierecken) zeigen identische oder annähernd identische Textfolgen in den verglichenen Sequenzen an.

Abb. 4: Verschiedene schematische Darstellungen zu typischen Möglichkeiten, wie Vergleichs-Dotplots angeordnet sein können. [Grafik: Frank Buschmann 2023]
Abb. 4: Verschiedene schematische Darstellungen zu typischen Möglichkeiten, wie Vergleichs-Dotplots angeordnet sein können. [Grafik: Frank Buschmann 2023]

[35]Einige grundlegende Möglichkeiten, wie kleinere Dotplots aussehen können, möchten wir anhand schematischer Darstellungen kurz erläutern (vgl. Abbildung 4).[77] Bei Vergleichen können entweder keine Übereinstimmung (Dotplot 1) sowie vollständige (Dotplot 2) oder teilweise Übereinstimmung (Dotplot 3) auftreten. Zwei Sequenzen können außerdem die gleichen Texte in völlig differierender Anordnung (Dotplot 4) oder eine vertauschte Reihenfolge aufweisen (Dotplot 5). Im Falle solcher gegenläufigen Anordnung wird im Folgenden von einer invertierten Sequenz gesprochen; diese lässt sich an einer aufsteigenden statt abfallenden Diagonale erkennen. Möglich (und häufig anzutreffen) sind Kombinationen mehrerer Varianten, etwa die Vertauschung zweier Texte am Reihenanfang, auf die identisch geordnete Elemente folgen (Dotplot 6).

[36]Kleinere Abweichungen im Textbestand zeigen sich anhand von Lücken. Sind an gleicher Position der Sequenz zwei unterschiedliche Texte in den Vergleichssammlungen enthalten (Dotplot 7, T2 und T6), während die übrige Folge übereinstimmt, entsteht eine einfache Lücke. Eine horizontale oder vertikale Verschiebung tritt auf, wenn in nur einer Sequenz ein Text hinzukommt (Dotplot 8, T6).

[37]Bevor es an späterer Stelle um beispielhafte Einblicke in einzelne Priamel-Dotplots geht, wird die zweite Methode für den Vergleich von Textsequenzen vorgestellt.

5.2 Sequenzanalyse mit dem Smith-Waterman-Algorithmus

[38]Bei größeren Korpora kann neben dem grafischen Vergleich von Sammlungen die Anwendung statistischer Methoden zur Identifikation identischer oder ähnlicher Textsequenzen von Vorteil sein, da in diesen Fällen die Anzahl der Dotplots zunimmt und eine optische Auswertung zunehmend schwieriger wird. Für umfangreiche Datensätze ist der Rückgriff auf einen Sequenzalignment-Algorithmus sinnvoll. Solche Algorithmen existieren für DNA-Sequenzanalysen seit langem, eine Entlehnung ist daher naheliegend.[78]

[39]Für die vorliegende Fragestellung erwies sich der 1981 von Temple Smith und Michael Waterman vorgestellte Algorithmus als zielführend:[79] Der Smith-Waterman-Algorithmus erzeugt für zwei Sequenzen eine möglichst optimale Reihung identischer Elemente. Er beruht auf der minimalen Editierdistanz der Sequenzen. Die Editierdistanz ist die Anzahl von Umformungsoperationen wie Ersetzen, Einfügen oder Löschen von Zeichen, die eine Sequenz in die andere überführen; die Summe dieser Umformungsoperationen wird Alignment genannt. Für den Vergleich von Priamelsequenzen ist sie besser geeignet als einfachere Ähnlichkeitsmaße wie der Jaccard-Index[80], da in unserem Fall nicht die reine Menge überlappender Elemente in zwei Sammlungen von Interesse ist, sondern explizit die Reihenfolge der Einzeltexte.

[40]Für die Berechnung der Editierdistanz werden Bewertungsmatrizen genutzt, die neben Übereinstimmungen (Matches) auch Nichtübereinstimmungen (Mismatches) und Lücken (Gaps) einbeziehen. Ein Mismatch liegt vor, wenn in einer Sequenz ein Token der Textreihe abweichend ist (z. B. bei Austausch eines Textes), eine Lücke, wenn ein Text hinzukommt, die Sequenz danach aber fortgeführt wird (z. B. bei Einschüben). Bei dem Smith-Waterman-Algorithmus handelt es sich um einen Algorithmus zur Identifikation des optimalen lokalen Alignments. Im Gegensatz zu Algorithmen für die Identifikation des optimalen globalen Alignments,[81] die darauf abzielen, den minimalen Abstand zweier kompletter Sequenzen zu bestimmen, ist Ziel des Smith-Waterman-Algorithmus, den längsten gemeinsamen Bereich von zwei Sequenzen mit der größten Ähnlichkeit zu finden.[82] Er erzeugt daher auch dann sinnvolle Ergebnisse, wenn die verglichenen Sequenzen deutlich unterschiedliche Längen aufweisen (was bei Priamelsammlungen oft der Fall ist) und lediglich kürzere identische bzw. ähnliche Teilsequenzen teilen.[83]

[41]Der Smith-Waterman-Algorithmus ist nur für paarweise Vergleiche geeignet, es werden also jeweils zwei Priamelsequenzen miteinander verglichen. Moderne Alignmentmethoden (Multiple Sequence Alignment; MSA) erlauben es hingegen, mehrere Sequenzen gleichzeitig miteinander zu vergleichen, um so das über alle verglichenen Sequenzen hinweg beste Alignment zu finden.[84] Für die Untersuchung von Überlieferungsgemeinschaften am Beispiel der Priamel sind paarweise Vergleiche jedoch besser geeignet, da es nicht zwangsläufig nur um eine einzige und möglichst lange Übereinstimmung der Textfolgen geht, sondern gerade auch um kleinere übereinstimmende Teilsequenzen.

[42]Sowohl die bereits angesprochene automatische Dotplot-Generierung als auch die Sequenzanalyse mittels Smith-Waterman-Algorithmus wurden in der freien Programmiersprache R realisiert.[85] Das Programm ist verfügbar bei GitHub.[86] Eingespeist werden die Daten über Tabellen im .xlsx- oder .csv-Format, die dem oben geschilderten Aufbau entsprechen: Im Tabellenkopf stehen die Siglen einzelner Überlieferungsträger oder Sammlungen, in den Spalten darunter die Identifier (Token) der Einzeltexte. Diese Tabelle dient als Grundlage der weiteren Verarbeitung.

[43]Bei dieser sind zwei Optionen möglich, die getrennt oder unmittelbar nacheinander berechnet werden können:

  1. Erstellung einzelner Dotplots oder aller Dotplots in einer Matrix;
  2. Ausgabe der Alignments mittels Smith-Waterman-Algorithmus.

[44]Ein Beispieldatensatz, der an späterer Stelle genauer behandelt wird, ist bei GitHub verfügbar;[87] vorerst dient er zur Erläuterung der erzeugten Tabellen (vgl. Tabelle 1).


a$a_doc_id a$b_doc_id sw similarity matches mismatches a_n b_n a_aligned b_aligned a_gaps a_from a_to b_gaps b_from b_to
B3 B3 146 1 73 0 73 73 Pr.*50a/b/c Pr.49 Pr.124 Pr.123a/b Pr.109 Pr.47 Pr.127 Pr.125 Pr.128a Pr.130a/b/c Pr.122 Pr.48 Pr.90a/b Pr.107a/b Pr.108 Pr.106 Pr.138 Pr.118a/b/c/d Pr.120 Pr.89 Pr.134a/b Pr.135 Pr.133a/b Pr.136 Pr.131a/b/c/d/e/f Pr.44 Pr.88 Pr.87a/b/c/d/e Pr.85 Pr.86 Pr.80 Pr.81 Pr.84 Pr.132a/b Pr.64 Pr.140a/b Pr.139 Pr.113a/b Pr.114a/b Pr.101 Pr.104 Pr.100 Pr.99 Pr.83 Pr.117 Pr.66 Pr.65 Pr.67 Pr.38a/b Pr.37 Pr.9 Pr.10 Pr.11 Pr.16 Pr.14 Pr.15 Pr.12 Pr.13 Pr.30 Pr.17 Pr.18 Pr.19 Pr.20 Pr.21 Pr.22 Pr.23 Pr.24 Pr.1 Pr.2 Pr.4 Pr.3 Pr.5 Pr.8 Pr.*50a/b/c Pr.49 Pr.124 Pr.123a/b Pr.109 Pr.47 Pr.127 Pr.125 Pr.128a Pr.130a/b/c Pr.122 Pr.48 Pr.90a/b Pr.107a/b Pr.108 Pr.106 Pr.138 Pr.118a/b/c/d Pr.120 Pr.89 Pr.134a/b Pr.135 Pr.133a/b Pr.136 Pr.131a/b/c/d/e/f Pr.44 Pr.88 Pr.87a/b/c/d/e Pr.85 Pr.86 Pr.80 Pr.81 Pr.84 Pr.132a/b Pr.64 Pr.140a/b Pr.139 Pr.113a/b Pr.114a/b Pr.101 Pr.104 Pr.100 Pr.99 Pr.83 Pr.117 Pr.66 Pr.65 Pr.67 Pr.38a/b Pr.37 Pr.9 Pr.10 Pr.11 Pr.16 Pr.14 Pr.15 Pr.12 Pr.13 Pr.30 Pr.17 Pr.18 Pr.19 Pr.20 Pr.21 Pr.22 Pr.23 Pr.24 Pr.1 Pr.2 Pr.4 Pr.3 Pr.5 Pr.8 0 1 73 0 1 73
D3 B3 10 0,384615385 5 0 13 73 Pr.1 Pr.2 Pr.4 Pr.3 Pr.5 Pr.1 Pr.2 Pr.4 Pr.3 Pr.5 0 1 5 0 68 72
R1 B3 8 0,111111111 5 0 36 73 Pr.1 Pr.2 #### Pr.3 Pr.5 Pr.6 Pr.8 Pr.1 Pr.2 Pr.4 Pr.3 Pr.5 #### Pr.8 1 1 6 1 68 73
S4 B3 6 0,111111111 4 0 27 73 Pr.1 Pr.2 Pr.3 Pr.4 #### Pr.5 Pr.1 Pr.2 #### Pr.4 Pr.3 Pr.5 1 1 5 1 68 72
F1 B3 6 0,088235294 4 0 34 73 Pr.1 Pr.2 Pr.3 Pr.4 #### Pr.5 Pr.1 Pr.2 #### Pr.4 Pr.3 Pr.5 1 1 5 1 68 72
D3 D3 26 1 13 0 13 13 Pr.1 Pr.2 Pr.4 Pr.3 Pr.5 Pr.6 Pr.7 Pr.8 Pr.95 Pr.93 Pr.*94 Pr.97 Pr.98 Pr.1 Pr.2 Pr.4 Pr.3 Pr.5 Pr.6 Pr.7 Pr.8 Pr.95 Pr.93 Pr.*94 Pr.97 Pr.98 0 1 13 0 1 13
F1 D3 12 0,461538462 7 0 34 13 Pr.1 Pr.2 Pr.3 Pr.4 #### Pr.5 Pr.6 Pr.7 Pr.8 Pr.1 Pr.2 #### Pr.4 Pr.3 Pr.5 Pr.6 Pr.7 Pr.8 1 1 8 1 1 8
S4 D3 12 0,461538462 7 0 27 13 Pr.1 Pr.2 Pr.3 Pr.4 #### Pr.5 Pr.6 Pr.7 Pr.8 Pr.1 Pr.2 #### Pr.4 Pr.3 Pr.5 Pr.6 Pr.7 Pr.8 1 1 8 1 1 8
B3 D3 10 0,384615385 5 0 73 13 Pr.1 Pr.2 Pr.4 Pr.3 Pr.5 Pr.1 Pr.2 Pr.4 Pr.3 Pr.5 0 68 72 0 1 5
R1 D3 10 0,384615385 6 0 36 13 Pr.1 Pr.2 #### Pr.3 Pr.5 Pr.6 #### Pr.8 Pr.1 Pr.2 Pr.4 Pr.3 Pr.5 Pr.6 Pr.7 Pr.8 2 1 6 0 1 8
F1 F1 68 1 34 0 34 34 Pr.1 Pr.2 Pr.3 Pr.4 Pr.5 Pr.6 Pr.7 Pr.8 Pr.14 Pr.11 Pr.12 Pr.21 Pr.23 Pr.22 Pr.13 Pr.18 Pr.15 Pr.16 Pr.10 Pr.9 Pr.19 Pr.20 Pr.24 Pr.17 Pr.30 Pr.37 Pr.32 Pr.41 APrV261 Pr.25a/b Pr.27 Pr.*28 Pr.26 Pr.29 Pr.1 Pr.2 Pr.3 Pr.4 Pr.5 Pr.6 Pr.7 Pr.8 Pr.14 Pr.11 Pr.12 Pr.21 Pr.23 Pr.22 Pr.13 Pr.18 Pr.15 Pr.16 Pr.10 Pr.9 Pr.19 Pr.20 Pr.24 Pr.17 Pr.30 Pr.37 Pr.32 Pr.41 APrV261 Pr.25a/b Pr.27 Pr.*28 Pr.26 Pr.29 0 1 34 0 1 34
S4 F1 50 0,925925926 25 0 27 34 Pr.1 Pr.2 Pr.3 Pr.4 Pr.5 Pr.6 Pr.7 Pr.8 Pr.14 Pr.11 Pr.12 Pr.21 Pr.23 Pr.22 Pr.13 Pr.18 Pr.15 Pr.16 Pr.10 Pr.9 Pr.19 Pr.20 Pr.24 Pr.17 Pr.30 Pr.1 Pr.2 Pr.3 Pr.4 Pr.5 Pr.6 Pr.7 Pr.8 Pr.14 Pr.11 Pr.12 Pr.21 Pr.23 Pr.22 Pr.13 Pr.18 Pr.15 Pr.16 Pr.10 Pr.9 Pr.19 Pr.20 Pr.24 Pr.17 Pr.30 0 1 25 0 1 25
D3 F1 12 0,461538462 7 0 13 34 Pr.1 Pr.2 Pr.4 Pr.3 #### Pr.5 Pr.6 Pr.7 Pr.8 Pr.1 Pr.2 #### Pr.3 Pr.4 Pr.5 Pr.6 Pr.7 Pr.8 1 1 8 1 1 8
R1 F1 10 0,147058824 6 0 36 34 Pr.1 Pr.2 Pr.3 #### Pr.5 Pr.6 #### Pr.8 Pr.1 Pr.2 Pr.3 Pr.4 Pr.5 Pr.6 Pr.7 Pr.8 2 1 6 0 1 8
B3 F1 6 0,088235294 4 0 73 34 Pr.1 Pr.2 Pr.4 Pr.3 #### Pr.5 Pr.1 Pr.2 #### Pr.3 Pr.4 Pr.5 1 68 72 1 1 5
R1 R1 72 1 36 0 36 36 Pr.1 Pr.2 Pr.3 Pr.5 Pr.6 Pr.8 Pr.4 Pr.7 Pr.11 Pr.57 Pr.38a/b Pr.59 Pr.60 Pr.63a/b Pr.62 Pr.61 Pr.40 Pr.58 Pr.54 Pr.71 Pr.93 Pr.35 Pr.34 Pr.80 Pr.53 Pr.69 Pr.70 Pr.66 Pr.65 Pr.85 Pr.84 Pr.90a/b Pr.83 Pr.48 Pr.100 Pr.108 Pr.1 Pr.2 Pr.3 Pr.5 Pr.6 Pr.8 Pr.4 Pr.7 Pr.11 Pr.57 Pr.38a/b Pr.59 Pr.60 Pr.63a/b Pr.62 Pr.61 Pr.40 Pr.58 Pr.54 Pr.71 Pr.93 Pr.35 Pr.34 Pr.80 Pr.53 Pr.69 Pr.70 Pr.66 Pr.65 Pr.85 Pr.84 Pr.90a/b Pr.83 Pr.48 Pr.100 Pr.108 0 1 36 0 1 36
D3 R1 10 0,384615385 6 0 13 36 Pr.1 Pr.2 Pr.4 Pr.3 Pr.5 Pr.6 Pr.7 Pr.8 Pr.1 Pr.2 #### Pr.3 Pr.5 Pr.6 #### Pr.8 0 1 8 2 1 6
S4 R1 10 0,185185185 6 0 27 36 Pr.1 Pr.2 Pr.3 Pr.4 Pr.5 Pr.6 Pr.7 Pr.8 Pr.1 Pr.2 Pr.3 #### Pr.5 Pr.6 #### Pr.8 0 1 8 2 1 6
F1 R1 10 0,147058824 6 0 34 36 Pr.1 Pr.2 Pr.3 Pr.4 Pr.5 Pr.6 Pr.7 Pr.8 Pr.1 Pr.2 Pr.3 #### Pr.5 Pr.6 #### Pr.8 0 1 8 2 1 6
B3 R1 8 0,111111111 5 0 73 36 Pr.1 Pr.2 Pr.4 Pr.3 Pr.5 #### Pr.8 Pr.1 Pr.2 #### Pr.3 Pr.5 Pr.6 Pr.8 1 68 73 1 1 6
S4 S4 54 1 27 0 27 27 Pr.1 Pr.2 Pr.3 Pr.4 Pr.5 Pr.6 Pr.7 Pr.8 Pr.14 Pr.11 Pr.12 Pr.21 Pr.23 Pr.22 Pr.13 Pr.18 Pr.15 Pr.16 Pr.10 Pr.9 Pr.19 Pr.20 Pr.24 Pr.17 Pr.30 Pr.41 Pr.18 Pr.1 Pr.2 Pr.3 Pr.4 Pr.5 Pr.6 Pr.7 Pr.8 Pr.14 Pr.11 Pr.12 Pr.21 Pr.23 Pr.22 Pr.13 Pr.18 Pr.15 Pr.16 Pr.10 Pr.9 Pr.19 Pr.20 Pr.24 Pr.17 Pr.30 Pr.41 Pr.18 0 1 27 0 1 27
F1 S4 50 0,925925926 25 0 34 27 Pr.1 Pr.2 Pr.3 Pr.4 Pr.5 Pr.6 Pr.7 Pr.8 Pr.14 Pr.11 Pr.12 Pr.21 Pr.23 Pr.22 Pr.13 Pr.18 Pr.15 Pr.16 Pr.10 Pr.9 Pr.19 Pr.20 Pr.24 Pr.17 Pr.30 Pr.1 Pr.2 Pr.3 Pr.4 Pr.5 Pr.6 Pr.7 Pr.8 Pr.14 Pr.11 Pr.12 Pr.21 Pr.23 Pr.22 Pr.13 Pr.18 Pr.15 Pr.16 Pr.10 Pr.9 Pr.19 Pr.20 Pr.24 Pr.17 Pr.30 0 1 25 0 1 25
D3 S4 12 0,461538462 7 0 13 27 Pr.1 Pr.2 Pr.4 Pr.3 #### Pr.5 Pr.6 Pr.7 Pr.8 Pr.1 Pr.2 #### Pr.3 Pr.4 Pr.5 Pr.6 Pr.7 Pr.8 1 1 8 1 1 8
R1 S4 10 0,185185185 6 0 36 27 Pr.1 Pr.2 Pr.3 #### Pr.5 Pr.6 #### Pr.8 Pr.1 Pr.2 Pr.3 Pr.4 Pr.5 Pr.6 Pr.7 Pr.8 2 1 6 0 1 8
B3 S4 6 0,111111111 4 0 73 27 Pr.1 Pr.2 Pr.4 Pr.3 #### Pr.5 Pr.1 Pr.2 #### Pr.3 Pr.4 Pr.5 1 68 72 1 1 5

Tab. 1: Ein Tabellenausschnitt der mit dem Smith-Waterman-Algorithmus erzeugten Daten.

[45]In den ersten beiden Spalten sind die Siglen der jeweils verglichenen Sammlungen gelistet, gefolgt von zwei statistischen Werten. Unter ›sw‹ erscheint der mit dem Smith-Waterman-Algorithmus ermittelte Reihenwert; dieser ist abhängig von der Länge der beiden Sequenzen und der Menge an übereinstimmenden und nicht übereinstimmenden Elementen. Sehr groß ist er bei zwei langen Sequenzen mit hoher Übereinstimmung, bei fehlenden Übereinstimmungen liegt er bei 0. Es folgt ein Wert zur ›similarity‹ zwischen 0 und 1, der das Verhältnis des sw-Wertes zum Produkt aus der Länge der kürzeren von beiden Sequenzen und der Gewichtung des Matches im Smith-Waterman-Algorithmus (hier standardmäßig 2) angibt. Danach wird die Anzahl der ›matches‹, der ›mismatches‹ und die Anzahl an Token pro verglichener Sequenz genannt. Unter ›a_aligned‹ und ›b_aligned‹ sind die ermittelten Textreihen bzw. Alignments notiert, jeweils ausgehend von einer der beiden Sequenzen im Vergleich mit der anderen. Wenn ein Gap vorliegt, erscheinen Bündel aus Rauten (####). Die letzten sechs Spalten nennen die Anzahl von Gaps in den Sequenzen ›a‹ und ›b‹ sowie die numerischen Positionen, an denen die ermittelten Alignments in den einzelnen Sequenzen beginnen und enden.

[46]Bei der Berechnung in R ist eine Option verfügbar, die der Suche nach invertierten Reihen dient. Dies ist im Rahmen von handschriftlichen und gedruckten Sammlungen deswegen sinnvoll, da eine Vertauschung einzelner Texte grundsätzlich nicht unwahrscheinlich ist. Ist diese Option aktiv, werden die entsprechenden Ergebnisse direkt neben den gerade beschriebenen Spalten platziert; der Aufbau dieser optionalen Datensätze ist identisch.

[47]Noch ein Hinweis zu der Darstellung der ermittelten Reihen in der Ausgabetabelle: Aufgereiht werden jeweils die einzelnen Identifier, die im Vergleich übereinstimmend sind. In einigen Fällen erscheinen die Rautenbündel, die Abweichungen markieren. Hervorgehoben wird bei einem Alignment der Sequenz ›a‹, an welcher Stelle die Vergleichssequenz ›b‹ abweicht, die Textfolge von ›a‹ wird danach dann fortgesetzt. Ein Beispiel zur Verdeutlichung wird unten im Rahmen der Einblicke in die Priamelüberlieferung geboten,[88] nachdem es zunächst um die Arbeit mit und Analyse von Dotplots gehen wird.

6. Auswertungsbeispiele und ihre Interpretation

[48]Der folgende Abschnitt widmet sich einerseits der Arbeit mit und Analyse von Dotplots, andererseits dem Zugriff auf die mittels des Smith-Waterman-Algorithmus generierten Tabellen. Es wird dabei an exemplarischen Fällen gezeigt, welche Phänomene im Einzelnen auftreten können, wie man mit beiden Ansätzen arbeitet und wie diese für die Analyse fruchtbar zu machen sind.

6.1 Exemplarische Einblicke in die Priamel-Dotplots

[49]Für die in diesem Abschnitt vorgestellte Analyse greifen wir auf den oben bei der Einführung zu den Dotplots gezeigten Ausschnitt zurück. In diesem lassen sich drei grundlegende Phänomene für einzelne Vergleiche beschreiben (vgl. Abbildung 5):

Abb. 5: Ein Ausschnitt der Dotplots für die Priamelüberlieferung mit Markierungen. [Grafik: Frank Buschmann 2023]
Abb. 5: Ein Ausschnitt der Dotplots für die Priamelüberlieferung mit Markierungen. [Grafik: Frank Buschmann 2023]
  1. keine Übereinstimmungen (Beispiele in den rosa gefärbten Rechtecken);
  2. punktuelle Übereinstimmungen oder gestreut gepunktete Zonen (Beispiele in den orangen Rechtecken);
  3. ähnliche oder identische Abfolgen, die sich anhand von Diagonalen erkennen lassen (Beispiele in den grünen Rechtecken).

[50]Keine Übereinstimmungen zwischen einzelnen Textensembles im Sinne von 1. sind im Priamelkorpus oft bei Vergleichen mit kleineren Sammlungen feststellbar, was quantitative Gründe hat; bei einer kleineren Zahl an Vergleichsobjekten sind parallele Bezeugungen schlicht unwahrscheinlicher. Verschiedentlich gibt es allerdings inhaltliche Gründe für fehlende Überschneidungen, die thematischer Natur sind, da die meisten Priamel im ›weltlichen‹ oder ›geistlichen‹ Bereich angesiedelt sind; diese Gruppen wurden in den Sammlungen öfter getrennt notiert.[89] Die Kategorien der ›weltlichen‹ und ›geistlichen‹ Priamel verwendete Euling in seiner 1905 veröffentlichten Studie zur Priameldichtung,[90] die Forschung ist ihm hierin gefolgt.[91]

[51]Betrachtet man die unter 2. genannten Bereiche mit divergierenden Anordnungen, so lassen sich ›Nester‹ erkennen, also Zonen in einzelnen Dotplots, bei denen häufiger oder ausschließlich Texte in beiden Sammlungen enthalten sind. Diese Sammlungen weisen nicht einfach bunt gemischt einen identischen Bestand an Priameln auf, der sich ausschließlich in der Anordnung unterscheiden würde, sondern differieren hinsichtlich der Anordnung verschiedener Texte sowie des Textbestandes selbst, was sich an den fehlenden Überschneidungen gegen Ende der Sequenzen zeigt. Auch dies liegt grundsätzlich an der Quantität der Texte im Korpus, da die insgesamt 140 Priamel des ›Werkkomplex Rosenplüt‹ sowie die hinzutretenden Kurztexte, die Kiepe im alphabetischen Priamelverzeichnis erfasst, in keiner Sammlung vollständig vorliegen. Zugleich lässt sich anhand dieser Beobachtung die Hypothese Kiepes stützen, welche er bei der Untersuchung einzelner Textreihen gewann, nämlich dass nicht damit zu rechnen sei, dass bei der Herstellung der verschiedenen Handschriften jeweils ausschließlich auf eine einzelne und umfangreiche Vorlage zugegriffen wurde[92] – und zwar auch nicht derart, dass die in der Vorlage enthaltenen Texte einfach (gezielt) umgeordnet worden sind.

[52]Damit zu den unter 3. erfassten identischen oder fast identischen Textreihen, für die einige Beispiele im Umfang von meist ca. acht Einzeltexten grün hervorgehoben sind. Sind diese durchlaufend, decken sich die Textfolgen beider Vergleichsobjekte komplett. Liegt eine kleine Lücke vor, so ist in einem von beiden ein Einschub vorhanden. Man sieht anhand dieser Reihen – und das ist für die Priamel-Dotplots durchaus exemplarisch – dass kleinere Gruppen im Umfang von 5–8 Texten mit identischer oder sehr ähnlicher Abfolge öfter auftreten, während sehr lange und fast identische Reihungen selten vorliegen.[93] Dieser Befund lässt sich durch die Überlieferung plausibilisieren.

[53]Erhalten ist ein oben bereits kurz erwähntes Einzelheft mit verschiedenen Priameln, das in Nürnberg um 1490 entstand (Badische Landesbibliothek Karlsruhe, Cod. Donaueschingen A III 19).[94] Diese Handschrift hat einen Umfang von sechs Blättern im Format 18,8 × 13,7 cm;[95] Heiles errechnet, dass die Blätter ursprünglich eine Größe von mindestens 27,4 × 37,6 cm hatten.[96] Für die Herstellung der Broschüre nutzte man also wahrscheinlich ganze Papierbögen, die in der Mitte zerschnitten und dann durch Faltung nochmals halbiert worden sind.

[54]Ein Blatt des Heftes war vom Titel priamel red (Blatt 1r)[97] abgesehen ursprünglich ein unbeschriebener Schutzumschlag, die 19 Priamel bzw. priamelartigen Sprüche[98] sind auf den Blättern 2r–5v fortlaufend notiert. Enthalten sind auf diesen acht Seiten sechs Priamel aus dem ›Werkkomplex Rosenplüt‹ (2r–3v) sowie zwölf Stücke, die in Kiepes alphabetischen Priamelverzeichnis nachgewiesen sind (3v–5v). Beschrieben wurden je 16–18 Zeilen, pro Seite jeweils mit zwei bis drei Leerzeilen zum Absetzen einzelner Texte.[99] Die Priamel des ›Werkkomplexes Rosenplüt‹ umfassen meist 8 Verse, wobei auch zwei längere Stücke mit 12 und 14 Versen enthalten sind.[100] Für die ersten sechs Priamel aus dem ›Werkkomplex Rosenplüt‹ benötigte der Schreiber, der auch an der Produktion weiterer Einzelhefte bzw. sekundär als Codex vereinter Lagen mit Rosenplüt-Dichtungen beteiligt war,[101] also vier Seiten – das entspricht einem zu Quartformat gefalzten Blatt, bei dem alle vier Seiten beschrieben sind. Vorstellbar wäre, dass derartige Einzelblätter mit Priameln im spätmittelalterlichen Nürnberg im Umlauf waren, womit sie als Vorlagen der heute erhaltenen Sammlungen in Frage kämen. Erhalten hat sich ein unmittelbarer Beleg für diese These allerdings nicht, was nicht sonderlich verwundert – mit Arnold Esch gesprochen ist die Überlieferungschance eines Einzelblattes in Privatbesitz äußerst gering.[102]

[55]Für die Existenz solch kleinerer Textgruppen gibt es ein weiteres Argument, das an früherer Stelle bereits anklang, nämlich thematische Ordnungen im Sinne ›weltlicher‹ und ›geistlicher‹ Priamel. Für beide Bereiche beschreibt Kiepe fünf Zyklen (vier geistliche und einen weltlichen) zu meist acht Priameln, die mehrfach gemeinsam überliefert sind[103].

[56]Anhand zweier Zyklen (Zyklus I und IV) werden nun unterschiedliche Arten von Abweichungen zwischen einzelnen Textsequenzen noch einmal beschrieben, da diese exemplarisch verschiedene Phänomene abbilden. Zur besseren Orientierung sind die Dotplots schachbrettartig alphabetisch (in Minuskeln) und numerisch gezählt, so dass auf einzelne Plots durch z. B. ›b5‹ verwiesen werden kann (vgl. Abbildung 6).

Abb. 6: Ein Ausschnitt der Dotplots für die Priamelüberlieferung mit Hervorhebung und Beschriftung der Priamel-Zyklen. [Grafik: Frank Buschmann 2023]
Abb. 6: Ein Ausschnitt der Dotplots für die Priamelüberlieferung mit Hervorhebung und Beschriftung der Priamel-Zyklen. [Grafik: Frank Buschmann 2023]

[57]Die Zyklen sind in der Abbildung farblich hervorgehoben und beschriftet; es handelt sich um einige der identischen oder ähnlichen Priamelreihen. Im Ausschnitt sind alle Zyklen mehrfach bezeugt, wobei die verglichenen Sequenzen nicht immer übereinstimmen. Wir bilden die betreffenden Areale jeweils vergrößert ab, behalten dabei aber die Referenzierung über das das alphanumerische Raster bei, damit der Bezug zu dem vorangehenden Ausschnitt der Dotplots hergestellt werden kann.

[58]Eine ähnliche Folge von Zyklus I (blau) tritt in den Zeilen a und f mehrfach auf (a6, a12, a14, a17 und f1, f12, f14, f17; vgl. Abbildung 7).[104]

Abb. 7: Ausschnitte der Dotplots für den Vergleich von Zyklus I. [Grafik: Frank Buschmann 2023]
Abb. 7: Ausschnitte der Dotplots für den Vergleich von Zyklus I. [Grafik: Frank Buschmann 2023]

[59]Bei a6 liegen vor dem letzten Priamel jeweils zwei Einschübe vor, die sich an einem Abstand von zwei Kästchen erkennen lassen; identisch ist dies bei a14 und a17. Zusätzlich sind bei a14 und a17 der dritte und vierte Text des Zyklus vertauscht. Der Dotplot in a12 zeigt einen einfachen Einschub vor dem letzten Priamel. Umgestellt ist hier das dritte Priamel, das bei der in der oberen Zeile angeordneten Sequenz nach rechts gerückt ist.

[60]In manchen Fällen ist es hilfreich, bei mehrfachem Auftreten ähnlicher Sequenzen die Dotplots nicht nur von links nach rechts durchzugehen, sondern auch von oben nach unten. Dieser Wechsel in der ›Leserichtung‹ ist dann sinnvoll, wenn man herausfinden möchte, ob eine Abweichung in der Anordnung singulär ist oder innerhalb der Überlieferung mehrfach vorkommt. Setzt man z. B. bei a14 an und vergleicht mit f14, so zeigt sich, dass erneut der dritte und vierte Text (Pr. 3 und Pr. 4) vertauscht sind – die Sammlung in Zeile f ist in diesem Fall also übereinstimmend mit jener in a. Zugleich ist der zweifache Einschub zwischen dem vorletzten und letzten Priamel in a14 in f14 nun ›gefüllt‹, was daran liegt, dass die Folge in a14 nur sechs des acht Priamel umfassenden Zyklus I enthält, diejenige in f hingegen alle acht Texte (Pr. 1–8). Ein Blick auf a17 und f17 zeigt, dass dort die Anordnung (von den zwei fehlenden Stücken abgesehen) deckungsgleich ist, während f12 ähnliche Abweichungenwie a12 aufweist. Man kann bei der Analyse daher die Vermutung anstellen, dass Sammlung R1 aus Spalte 12 von den übrigen Zeugnissen weiter entfernt ist, was sich mit Kiepes Beobachtungen deckt: »Hingegen scheint mir die Anordnung in R das Ergebnis eines Eingriffs zu sein […].«[105]

[61]Als zweites Beispiel dient Zyklus IV (hellgrün), der lediglich vier Priamel umfasst (vgl. Abbildung 8).[106]

Abb. 8: Ausschnitte der Dotplots für den Vergleich von Zyklus IV. [Grafik: Frank Buschmann 2023]
Abb. 8: Ausschnitte der Dotplots für den Vergleich von Zyklus IV. [Grafik: Frank Buschmann 2023]

[62]Diese Gruppe ist mehrfach in den Dotplots enthalten, hinsichtlich des Bestandes und der Anordnung aber sehr flexibel. Bereits die beiden ersten Bezeugungen in Zeile b (b3 und b5) unterscheiden sich trotz gleicher Folge im Textbestand, da jeweils ein Priamel am Anfang und Ende hinzukommt bzw. wegfällt (Pr. 25a/b und Pr. 29).[107] Bei b14 liegt in der Mitte ein Einschub vor, hier tritt zusätzlich Pr. *28 auf, das Kiepe als nicht ursprünglichen Teil des Zyklus (und damit auch nicht Rosenplüt als Autor zuzuschlagenden Text) einordnet.[108] Das Fehlen von Pr. *28 in mehreren Sammlungen zeigt ein Blick in Spalte 14 (Sammlung F1)[109]: Hier kommt das Priamel an dritter Stelle der in der Spalte gelisteten Reihe vor, in den übrigen Sammlungen (Zeilen b, c und e) aber fehlt es.

[63]Bei dieser Spalte der Dotplots ist in Zyklus IV regelmäßig die Anordnung der Texte vertauscht, was sich daran zeigt, dass die Diagonalen der Dotplots nicht abfallen, sondern aufsteigend angeordnet sind (b14, c14, e14). Das zeigt, dass die Reihenfolge der Vergleichssammlung in der Spalte umgekehrt ist. Diese These greift bei Zyklus IV aber nur bedingt, wenn man zusätzlich Spalte 18 prüft: In c18 liegt eine abfallende Diagonale vor, in b18 und e18 sind hingegen die ersten beiden Priamel erneut vertauscht. Die von Kiepe geäußerten Zweifel, ob man es tatsächlich mit einem Zyklus zu tun hat, sind hinsichtlich der Stabilität der Textfolge entsprechend berechtigt.[110]

[64]Die grundlegenden Änderungskategorien bei mehrfach bezeugten Textreihen betreffen entweder den Textbestand oder die Textanordnung. Der Bestand kann bei Einschüben oder Lücken abweichen, dies zeigt sich anhand von Unterbrechungen bei den Diagonalen. Ob man von ›Einschub‹ oder ›Lücke‹ spricht, ist abhängig von der Bezugsgröße, da diese Begriffe einen nachträglichen Zusatz oder den Wegfall eines oder mehrerer Texte bezeichnen. Im Zusammenhang mit den Dotplots sind beide Begriffe neutral gemeint,[111] da die Tabellen für stemmatische Zusammenhänge keine von einer textkritischen Untersuchung losgelöste Aussagequalität besitzen.

[65]Abschließend soll es noch einmal kurz um die Frage nach thematischen Schwerpunkten bei der Anlage einzelner Sammlung gehen, nämlich im Sinne der Kategorien ›weltlich‹ und ›geistlich‹. Zugegriffen wird auf diejenigen Priamel, die Euling in seiner Priamelstudie als ›geistlich‹ beschrieben hat.[112] Bei einer Markierung dieser durch blaue Felder ergibt sich das folgende Bild (vgl. Abbildung 9):

Abb. 9: Ein Ausschnitt der Dotplots für die Priamelüberlieferung mit Hervorhebung und Beschriftung der Priamel-Zyklen sowie Feldern, die geistliche Priamel ausweisen. [Grafik: Frank Buschmann 2023]
Abb. 9: Ein Ausschnitt der Dotplots für die Priamelüberlieferung mit Hervorhebung und Beschriftung der Priamel-Zyklen sowie Feldern, die geistliche Priamel ausweisen. [Grafik: Frank Buschmann 2023]

[66]Konzentriert man sich auf die blau hinterlegten Bereiche, so lassen sich zwei quantitative Kategorien erkennen: Dünnere blaue Felder weisen auf ein Auftreten einzelner Priamel oder kleinerer Gruppen hin, die gemischt mit weltlichen Texten auftreten. Derartige Mischungen liegen z. B. am Beginn von Spalte 2 oder im dritten Viertel von Spalte 8 vor. Andererseits gibt es (Teil-)Sammlungen, die einen starken Fokus auf geistliche Priamel legen, etwa das zweite Drittel von Spalte 1, das erste Drittel der Sammlung in Spalte 8 oder die fast vollständige Sequenz in Spalte 14.

[67]Bei den umfangreicheren blauen Feldern zeigt sich, dass sich diese öfter aus Zyklen zusammensetzen. Aufschlussreich ist hier das untere Drittel in Zeile a: In Spalte 8 folgt Zyklus III fast unmittelbar auf Zyklus II, wobei direkt danach dann bei der Sequenz, die in a abgebildet ist, der Zyklus I folgt; in Spalte 8 ist dieser allerdings nicht enthalten.

[68]Es zeigt sich außerdem, dass Zyklus I verschiedentlich an den Grenzen einzelner Sequenzen steht, da er in der Ecke der jeweiligen Dotplots auftritt (z. B. a6, a12, a14, a17). Dies legt nahe, dass das Textensemble für den Beginn einer anschließenden Zusammenstellung beliebt war, wohingegen es bei der Sequenz in a das Ende darstellt.

[69]Eine besondere Lage bietet sich bei den Spalten 14 und 17. Bei den Vergleichen mit a und h liegt jeweils ein fast identisches Muster vor, und zwar nicht nur bei den Abweichungen in Zyklus I, sondern auch bei den aufgelösten Zyklen II und III. Würde man in der größeren Matrix den unmittelbaren Vergleich beider Sammlungen einsehen, so ergäbe sich eine identische Folge von insgesamt 25 Priameln. Dieser Folge und dem Zyklus I widmet sich der nun folgende zweite Analyseabschnitt, der den Gebrauch der über den Smith-Waterman-Algorithmus erzeugten Datensätze thematisiert.

6.2 Beispiele für die Arbeit mit dem Smith-Waterman-Algorithmus

[70]Die Arbeit mit den Ergebnissen, die der Smith-Waterman-Algorithmus erzeugt, wird anhand des mehrfach überlieferten Zyklus I erläutert. Dabei wird es auch darum gehen, wie einzelne der ausgegebenen Angaben zu verstehen sind, da nicht alle in den Tabellen erzeugten Werte ohne Weiteres verständlich sind.

[71]Der Zyklus ist in insgesamt fünf Sammlungen überliefert:

  • Sammlung B3 in München, Bayerische Staatsbibliothek, Cgm 713[113] — Nürnberg, um 1465 — fol. 153r–171v
  • Sammlung D2 in Dresden, Sächsische Landesbibliothek – Staats- und Universitätsbibliothek, Mscr.Dresd.M.50[114] — Nürnberg, um 1460/62 — fol. 149v–159r
  • Sammlung R1 in Wolfenbüttel, Herzog August Bibliothek, Cod. Guelf. 29.6 Aug. 4°[115] — Nürnberg, um 1472 — fol. 14r–24v
  • Sammlung F1 in Nürnberg, Germanisches Nationalmuseum, Cod. 5339a[116] — Nürnberg, um 1472 — fol. 396r–404r
  • Sammlung S4 in Wolfenbüttel, Herzog August Bibliothek, Cod. Guelf. 2.4 Aug. 2°[117] — Nürnberg, um 1492 — fol. 183r–186v

[72]Für diese fünf Sammlungen wurden die optimalen Alignments über den Smith-Waterman-Algorithmus ermittelt und die Daten wie oben beschrieben ausgegeben; ergänzt sind in der Tabelle eine Formatierung und farbliche Hervorhebungen, geordnet ist sie nach den similarity-Werten (vgl. Tabelle 2).[118]


a$a_doc_id a$b_doc_id sw similarity matches mismatches a_n b_n a_aligned b_aligned a_gaps a_from a_to b_gaps b_from b_to
B3 B3 146 1 73 0 73 73 Pr.*50a/b/c Pr.49 Pr.124 Pr.123a/b Pr.109 Pr.47 Pr.127 Pr.125 Pr.128a Pr.130a/b/c Pr.122 Pr.48 Pr.90a/b Pr.107a/b Pr.108 Pr.106 Pr.138 Pr.118a/b/c/d Pr.120 Pr.89 Pr.134a/b Pr.135 Pr.133a/b Pr.136 Pr.131a/b/c/d/e/f Pr.44 Pr.88 Pr.87a/b/c/d/e Pr.85 Pr.86 Pr.80 Pr.81 Pr.84 Pr.132a/b Pr.64 Pr.140a/b Pr.139 Pr.113a/b Pr.114a/b Pr.101 Pr.104 Pr.100 Pr.99 Pr.83 Pr.117 Pr.66 Pr.65 Pr.67 Pr.38a/b Pr.37 Pr.9 Pr.10 Pr.11 Pr.16 Pr.14 Pr.15 Pr.12 Pr.13 Pr.30 Pr.17 Pr.18 Pr.19 Pr.20 Pr.21 Pr.22 Pr.23 Pr.24 Pr.1 Pr.2 Pr.4 Pr.3 Pr.5 Pr.8 Pr.*50a/b/c Pr.49 Pr.124 Pr.123a/b Pr.109 Pr.47 Pr.127 Pr.125 Pr.128a Pr.130a/b/c Pr.122 Pr.48 Pr.90a/b Pr.107a/b Pr.108 Pr.106 Pr.138 Pr.118a/b/c/d Pr.120 Pr.89 Pr.134a/b Pr.135 Pr.133a/b Pr.136 Pr.131a/b/c/d/e/f Pr.44 Pr.88 Pr.87a/b/c/d/e Pr.85 Pr.86 Pr.80 Pr.81 Pr.84 Pr.132a/b Pr.64 Pr.140a/b Pr.139 Pr.113a/b Pr.114a/b Pr.101 Pr.104 Pr.100 Pr.99 Pr.83 Pr.117 Pr.66 Pr.65 Pr.67 Pr.38a/b Pr.37 Pr.9 Pr.10 Pr.11 Pr.16 Pr.14 Pr.15 Pr.12 Pr.13 Pr.30 Pr.17 Pr.18 Pr.19 Pr.20 Pr.21 Pr.22 Pr.23 Pr.24 Pr.1 Pr.2 Pr.4 Pr.3 Pr.5 Pr.8 0 1 73 0 1 73
R1 R1 72 1 36 0 36 36 Pr.1 Pr.2 Pr.3 Pr.5 Pr.6 Pr.8 Pr.4 Pr.7 Pr.11 Pr.57 Pr.38a/b Pr.59 Pr.60 Pr.63a/b Pr.62 Pr.61 Pr.40 Pr.58 Pr.54 Pr.71 Pr.93 Pr.35 Pr.34 Pr.80 Pr.53 Pr.69 Pr.70 Pr.66 Pr.65 Pr.85 Pr.84 Pr.90a/b Pr.83 Pr.48 Pr.100 Pr.108 Pr.1 Pr.2 Pr.3 Pr.5 Pr.6 Pr.8 Pr.4 Pr.7 Pr.11 Pr.57 Pr.38a/b Pr.59 Pr.60 Pr.63a/b Pr.62 Pr.61 Pr.40 Pr.58 Pr.54 Pr.71 Pr.93 Pr.35 Pr.34 Pr.80 Pr.53 Pr.69 Pr.70 Pr.66 Pr.65 Pr.85 Pr.84 Pr.90a/b Pr.83 Pr.48 Pr.100 Pr.108 0 1 36 0 1 36
F1 F1 68 1 34 0 34 34 Pr.1 Pr.2 Pr.3 Pr.4 Pr.5 Pr.6 Pr.7 Pr.8 Pr.14 Pr.11 Pr.12 Pr.21 Pr.23 Pr.22 Pr.13 Pr.18 Pr.15 Pr.16 Pr.10 Pr.9 Pr.19 Pr.20 Pr.24 Pr.17 Pr.30 Pr.37 Pr.32 Pr.41 APrV261 Pr.25a/b Pr.27 Pr.*28 Pr.26 Pr.29 Pr.1 Pr.2 Pr.3 Pr.4 Pr.5 Pr.6 Pr.7 Pr.8 Pr.14 Pr.11 Pr.12 Pr.21 Pr.23 Pr.22 Pr.13 Pr.18 Pr.15 Pr.16 Pr.10 Pr.9 Pr.19 Pr.20 Pr.24 Pr.17 Pr.30 Pr.37 Pr.32 Pr.41 APrV261 Pr.25a/b Pr.27 Pr.*28 Pr.26 Pr.29 0 1 34 0 1 34
S4 S4 54 1 27 0 27 27 Pr.1 Pr.2 Pr.3 Pr.4 Pr.5 Pr.6 Pr.7 Pr.8 Pr.14 Pr.11 Pr.12 Pr.21 Pr.23 Pr.22 Pr.13 Pr.18 Pr.15 Pr.16 Pr.10 Pr.9 Pr.19 Pr.20 Pr.24 Pr.17 Pr.30 Pr.41 Pr.18 Pr.1 Pr.2 Pr.3 Pr.4 Pr.5 Pr.6 Pr.7 Pr.8 Pr.14 Pr.11 Pr.12 Pr.21 Pr.23 Pr.22 Pr.13 Pr.18 Pr.15 Pr.16 Pr.10 Pr.9 Pr.19 Pr.20 Pr.24 Pr.17 Pr.30 Pr.41 Pr.18 0 1 27 0 1 27
D3 D3 26 1 13 0 13 13 Pr.1 Pr.2 Pr.4 Pr.3 Pr.5 Pr.6 Pr.7 Pr.8 Pr.95 Pr.93 Pr.*94 Pr.97 Pr.98 Pr.1 Pr.2 Pr.4 Pr.3 Pr.5 Pr.6 Pr.7 Pr.8 Pr.95 Pr.93 Pr.*94 Pr.97 Pr.98 0 1 13 0 1 13
S4 F1 50 0,925925926 25 0 27 34 Pr.1 Pr.2 Pr.3 Pr.4 Pr.5 Pr.6 Pr.7 Pr.8 Pr.14 Pr.11 Pr.12 Pr.21 Pr.23 Pr.22 Pr.13 Pr.18 Pr.15 Pr.16 Pr.10 Pr.9 Pr.19 Pr.20 Pr.24 Pr.17 Pr.30 Pr.1 Pr.2 Pr.3 Pr.4 Pr.5 Pr.6 Pr.7 Pr.8 Pr.14 Pr.11 Pr.12 Pr.21 Pr.23 Pr.22 Pr.13 Pr.18 Pr.15 Pr.16 Pr.10 Pr.9 Pr.19 Pr.20 Pr.24 Pr.17 Pr.30 0 1 25 0 1 25
F1 D3 12 0,461538462 7 0 34 13 Pr.1 Pr.2 Pr.3 Pr.4 #### Pr.5 Pr.6 Pr.7 Pr.8 Pr.1 Pr.2 #### Pr.4 Pr.3 Pr.5 Pr.6 Pr.7 Pr.8 1 1 8 1 1 8
S4 D3 12 0,461538462 7 0 27 13 Pr.1 Pr.2 Pr.3 Pr.4 #### Pr.5 Pr.6 Pr.7 Pr.8 Pr.1 Pr.2 #### Pr.4 Pr.3 Pr.5 Pr.6 Pr.7 Pr.8 1 1 8 1 1 8
D3 B3 10 0,384615385 5 0 13 73 Pr.1 Pr.2 Pr.4 Pr.3 Pr.5 Pr.1 Pr.2 Pr.4 Pr.3 Pr.5 0 1 5 0 68 72
R1 D3 10 0,384615385 6 0 36 13 Pr.1 Pr.2 #### Pr.3 Pr.5 Pr.6 #### Pr.8 Pr.1 Pr.2 Pr.4 Pr.3 Pr.5 Pr.6 Pr.7 Pr.8 2 1 6 0 1 8
S4 R1 10 0,185185185 6 0 27 36 Pr.1 Pr.2 Pr.3 Pr.4 Pr.5 Pr.6 Pr.7 Pr.8 Pr.1 Pr.2 Pr.3 #### Pr.5 Pr.6 #### Pr.8 0 1 8 2 1 6
F1 R1 10 0,147058824 6 0 34 36 Pr.1 Pr.2 Pr.3 Pr.4 Pr.5 Pr.6 Pr.7 Pr.8 Pr.1 Pr.2 Pr.3 #### Pr.5 Pr.6 #### Pr.8 0 1 8 2 1 6
R1 B3 8 0,111111111 5 0 36 73 Pr.1 Pr.2 #### Pr.3 Pr.5 Pr.6 Pr.8 Pr.1 Pr.2 Pr.4 Pr.3 Pr.5 #### Pr.8 1 1 6 1 68 73
S4 B3 6 0,111111111 4 0 27 73 Pr.1 Pr.2 Pr.3 Pr.4 #### Pr.5 Pr.1 Pr.2 #### Pr.4 Pr.3 Pr.5 1 1 5 1 68 72
F1 B3 6 0,088235294 4 0 34 73 Pr.1 Pr.2 Pr.3 Pr.4 #### Pr.5 Pr.1 Pr.2 #### Pr.4 Pr.3 Pr.5 1 1 5 1 68 72

Tab. 2: Ein durch den Smith-Waterman-Algorithmus erzeugter Datensatz, geordnet nach similarity-Wert.

[73]Man erkennt bei den grau hinterlegten Spalten, dass ein similarity-Wert von 1 bei Vergleichen der Sammlungen mit sich selbst erzeugt wird. Einen sehr hohen Wert weist nach diesen ersten fünf Zeilen der anschließende Vergleich von S4 mit F1 (und umgekehrt F1 und S4) auf; dies ist die im letzten Abschnitt angesprochene längere deckungsgleiche Folge mit 25 Matches, also 25 identisch gereihten Priameln. Da der similarity-Wert unter 1 liegt, stimmen beide Sammlungen in Anordnung und Textbestand nicht völlig überein. Dies lässt sich zusätzlich daran erkennen, dass die Anzahl der Matches 25 beträgt, die Gesamtlänge der Sequenz von S4 hingegen 27 Texte umfasst, diejenige von F1 sogar 34.

[74]Wo die Sequenzen differieren, lässt sich an den ermittelten Daten erkennen, und zwar anhand der Einträge bei ›a_from‹ und ›a_to‹ sowie den Äquivalenten für die Vergleichssequenz. Bei S4 und F1 setzt das ermittelte Alignment jeweils mit Position 1 ein, also direkt am Beginn der Sammlungen, und endet an Position 25; die Abweichungen folgen also jeweils am Ende von S4 und F1.

[75]Nun ist die Frage, ob die Unterschiede den Textbestand und / oder die Anordnung der in S4 nach dem Alignment folgenden Priamel betreffen. Da der Umfang beider Sammlungen nicht identisch ist, kann man grundsätzlich davon ausgehen, dass F1 zusätzliche Texte enthält; welche dies sind, weist die Tabelle nicht aus. Sinnvoll ist an dieser Stelle ein Blick in den zugehörigen Dotplot (vgl. Abbildung 10).

Abb. 10: Der Vergleichs-Dotplot für die Sammlungen S4 und F1. [Grafik: Frank Buschmann 2023]
Abb. 10: Der Vergleichs-Dotplot für die Sammlungen S4 und F1. [Grafik: Frank Buschmann 2023]

[76]Im Dotplot bestätigen sich zunächst die mit dem Algorithmus erzeugten Daten für den Vergleich von S4 und F1. Die identische Reihung beginnt jeweils mit dem ersten Text der Sammlung und endet bei S4 vor den letzten beiden Texten (Pr. 41 und Pr. 18). Beide sind auch in F1 nachgewiesen, der Textbestand von S4 ist in der älteren Sammlung also vollständig enthalten.

[77]Das vorletzte Priamel in S4 folgt in F1 nach zwei weiteren Priameln (Pr. 37, Pr. 32). Den Abschluss bildet in S4 dann ein Text, der an früherer Stelle schon einmal auftrat, nämlich Pr. 18 – man hat es hier also mit einem doppelt abgeschriebenen Stück zu tun.[119]

[78]Als zweites Beispiel für den Gebrauch der Tabelle dienen die für die Sammlung F1 ermittelten Alignments (vgl. Tabelle 3).


a$a_doc_id a$b_doc_id sw similarity matches mismatches a_n b_n a_aligned b_aligned a_gaps a_from a_to b_gaps b_from b_to
F1 F1 68 1 34 0 34 34 Pr.1 Pr.2 Pr.3 Pr.4 Pr.5 Pr.6 Pr.7 Pr.8 Pr.14 Pr.11 Pr.12 Pr.21 Pr.23 Pr.22 Pr.13 Pr.18 Pr.15 Pr.16 Pr.10 Pr.9 Pr.19 Pr.20 Pr.24 Pr.17 Pr.30 Pr.37 Pr.32 Pr.41 APrV261 Pr.25a/b Pr.27 Pr.*28 Pr.26 Pr.29 Pr.1 Pr.2 Pr.3 Pr.4 Pr.5 Pr.6 Pr.7 Pr.8 Pr.14 Pr.11 Pr.12 Pr.21 Pr.23 Pr.22 Pr.13 Pr.18 Pr.15 Pr.16 Pr.10 Pr.9 Pr.19 Pr.20 Pr.24 Pr.17 Pr.30 Pr.37 Pr.32 Pr.41 APrV261 Pr.25a/b Pr.27 Pr.*28 Pr.26 Pr.29 0 1 34 0 1 34
F1 S4 50 0,925925926 25 0 34 27 Pr.1 Pr.2 Pr.3 Pr.4 Pr.5 Pr.6 Pr.7 Pr.8 Pr.14 Pr.11 Pr.12 Pr.21 Pr.23 Pr.22 Pr.13 Pr.18 Pr.15 Pr.16 Pr.10 Pr.9 Pr.19 Pr.20 Pr.24 Pr.17 Pr.30 Pr.1 Pr.2 Pr.3 Pr.4 Pr.5 Pr.6 Pr.7 Pr.8 Pr.14 Pr.11 Pr.12 Pr.21 Pr.23 Pr.22 Pr.13 Pr.18 Pr.15 Pr.16 Pr.10 Pr.9 Pr.19 Pr.20 Pr.24 Pr.17 Pr.30 0 1 25 0 1 25
F1 D3 12 0,461538462 7 0 34 13 Pr.1 Pr.2 Pr.3 Pr.4 #### Pr.5 Pr.6 Pr.7 Pr.8 Pr.1 Pr.2 #### Pr.4 Pr.3 Pr.5 Pr.6 Pr.7 Pr.8 1 1 8 1 1 8
F1 R1 10 0,147058824 6 0 34 36 Pr.1 Pr.2 Pr.3 Pr.4 Pr.5 Pr.6 Pr.7 Pr.8 Pr.1 Pr.2 Pr.3 #### Pr.5 Pr.6 #### Pr.8 0 1 8 2 1 6
F1 B3 6 0,088235294 4 0 34 73 Pr.1 Pr.2 Pr.3 Pr.4 #### Pr.5 Pr.1 Pr.2 #### Pr.4 Pr.3 Pr.5 1 1 5 1 68 72

Tab. 3: Der durch den Smith-Waterman-Algorithmus erzeugte Datensatz für den Zyklus I bei einem Vergleich aller diesen tradierenden Sammlungen mit F1, geordnet nach similarity-Wert.

[79]Der Vergleich der Sammlung mit sich selbst ist erneut grau hinterlegt; die daran anschließende Zeile zeigt das besprochene Alignment mit S4. Drei weitere Übereinstimmungen mit anderen Sammlungen gibt der Algorithmus aus,[120] die Länge der ermittelten Reihen variiert dabei. Im Vergleich mit D3 liegen sieben Matches vor, mit R1 sechs und mit B3 vier. Dies ist insofern bemerkenswert, als der Gesamtumfang der Vergleichssequenzen genau umgekehrt ist: D3 umfasst 13 Texte, R1 36 und B3 sogar 73 (jeweils in der Spalte ›b_n‹).

[80]Bei den ermittelten Reihen treten jeweils zwei Rautenbündel auf, diese zeigen die Position der Gaps an. Wie die ermittelten Werte für Matches und Gaps entstehen, lässt sich anhand eines manuellen Alignments nachvollziehen (vgl. Tabelle 4):


Match Match Gap Match Gap Match
F1 Pr. 1 Pr. 2 Pr. 3 Pr. 4 ### Pr. 5
B3 Pr. 1 Pr. 2 ### Pr. 4 Pr. 3 Pr. 5

Tab. 4: Alignment für den Vergleich von F1 und B3 mit Angabe der Matches und Gaps.

[81]Identische Positionen der gleichen Identifier erzeugen ein Match. Bei Abweichungen wird das optimale Alignment durch Einfügen eines Gaps erzeugt, dies erklärt die Position des Rautenbündels bei ›a_aligned‹ an 5. Stelle und bei ›b_aligned‹ an 3. Stelle. Zwischen F1 und B3 liegen also vier Matches und zwei Gaps vor; diese Werte sind auch in der Tabelle enthalten.

[82]Für die anderen Alignments kann man dies in gleicher Weise abbilden (vgl. Tabellen 5 und Tabelle 6):


Match Match Gap Match Gap Match Match Match Match
F1 Pr. 1 Pr. 2 Pr. 3 Pr. 4 ### Pr. 5 Pr. 6 Pr. 7 Pr. 8
D3 Pr. 1 Pr. 2 ### Pr. 4 Pr. 3 Pr. 5 Pr. 6 Pr. 7 Pr. 8

Tab. 5: Alignment für den Vergleich von F1 und D3 mit Angabe der Matches und Gaps.


Match Match Match Gap Match Match Gap Match
F1 Pr. 1 Pr. 2 Pr. 3 Pr. 4 Pr. 5 Pr. 6 Pr. 7 Pr. 8
R1 Pr. 1 Pr. 2 Pr. 3 ### Pr. 5 Pr. 6 ### Pr. 8

Tab. 6: Alignment für den Vergleich von F1 und R1 mit Angabe der Matches und Gaps.

[83]Der höchste similarity-Wert liegt bei dem Vergleich F1–D3 vor, da dieser die meisten Übereinstimmungen im Verhältnis zur Anzahl der maximal möglichen Matches (bezogen auf den Umfang der kürzeren der beiden Sequenzen) aufweist. Zugleich bedeutet das Alignment von F1–R1 nicht, dass R1 die übrigen Texte des Zyklus nicht tradiert; wie sich anhand der Dotplots zeigt. Koppelt man die Tabelle nämlich mit diesen, so lassen sich die statistisch ermittelten Alignments besser nachvollziehen (vgl. Abbildung 11).

Abb. 11: Oben der durch den Smith-Waterman-Algorithmus erzeugte Datensatz für den Zyklus I bei einem Vergleich aller diesen tradierenden Sammlungen mit F1, darunter die zugehörigen Dotplots. [Grafik: Frank Buschmann 2023]
Abb. 11: Oben der durch den Smith-Waterman-Algorithmus erzeugte Datensatz für den Zyklus I bei einem Vergleich aller diesen tradierenden Sammlungen mit F1, darunter die zugehörigen Dotplots. [Grafik: Frank Buschmann 2023]

[84]Eingefärbt sind die erzeugten Alignments und die zugehörigen Bereiche der Dotplots. Im Vergleich von F1 mit B3 liegt die geringste Zahl an Matches vor, dies zeigt sich im Unterschied zu den beiden folgenden Reihen deutlich im türkisen Feld. Das am Ende von B3 stehende Pr. 8 ist vom Rest des Zyklus I aufgrund zweier in F1 zusätzlicher Texte (Pr. 6 und Pr. 7) zu weit entfernt, um durch den Algorithmus noch integriert zu werden, weshalb dieses Priamel im Alignment nicht auftritt.[121] In D3 und R1 sind jeweils alle acht Priamel des Zyklus enthalten, die Anordnungen weichen dabei ab. D3 zeigt eine Invertierung des 3. und 4. Stücks, die sonst identische Textfolge deutete der im Vergleich zu den anderen beiden Sequenzen höhere similarity-Wert an.

[85]Etwas anders ist die Lage bei R1. Die stärker differierende Folge führt in diesem Fall dazu, dass die beiden letzten Priamel des Zyklus (Pr. 4 und Pr. 7) nicht in das Alignment eingehen, obwohl sie durch ihre Nähe in dieser Sammlung bei einem Blick auf den Dotplot hinzugezogen werden sollten. Betrachtet man nämlich den Inhalt der einzelnen Stücke, die sich mit den Themen Sünden, Beichte und Buße und der Gnade Gottes beschäftigen,[122] sind die Abweichungen der Anordnung durchaus nachvollziehbar. Variiert wird in diesem Komplex, an welcher Stelle über die Gnade Gottes (Pr. 4) und die Folge von Sünden (Pr. 3) gesprochen wird. Bei der kürzeren Sequenz in B3 fehlen zwei Texte mit einem Lob der Beichte (Pr. 6) und einer Ermahnung zur Beichte (Pr. 7), während in R1 das Ende der Sequenz nicht wie in den anderen Fällen eine Ermahnung bildet, dass nur die Absolution durch einen Geistlichen den Einzug in das Himmelreich ermögliche (Pr. 8), sondern eine Kombination aus der Erinnerung an die Gnade Gottes (Pr. 4) und der finalen Aufforderung zur Beichte (Pr. 7) – eine nicht ungeschickte Anordnung, die durchaus auch im Rahmen der Verschriftlichung durch gestaltende Umordnung einer Vorlage entstanden sein könnte.

[86]Diese Hinweise auf den Inhalt der Stücke greifen bereits einigen Punkten voraus, die abschließend im Rahmen einer kurzen Diskussion zu Dotplots und Alignments das bisher gesagte methodisch einrahmen sollen.

6.3 Diskussion

[87]Die Dotplots und die über den Smith-Waterman ermittelten Alignments ermöglichen Einsichten in die Parallelüberlieferung der Priamel, exemplarische Einblicke zur Analyse und möglichen Deutung sind dabei zur Sprache gekommen. Mit beiden Methoden können identische und ähnliche Sequenzen bestimmt werden.

[88]Bei den Dotplots lassen sich neben Diagonalen auch punktuelle Überschneidungen oder fehlende Bezüge rasch erkennen, und zwar jeweils im Kontext anderer Sammlungen. Dennoch wird ihre Handhabung bei größeren Korpora schwieriger; man ist in solchen Fällen etwa darauf angewiesen, einzelne Sammlungen oder Teile von Sammlungen auszublenden, da der Vergleich identischer oder ähnlicher Sequenzen über eine Vielzahl an Zeilen und Spalten hinweg nicht einfach ist. Der entscheidende Faktor ist hierbei die Zeit, die für die Analyse benötigt wird.

[89]Ein zweiter kritischer Punkt sind Dotplots, die z. B. in Excel direkt über Vergleichsformeln erzeugt werden. Bei diesen steigt die benötigte Rechenleistung stark an, je größer die übergreifende Matrix wird. Hier liegt einer der entscheidenden Vorteile des Smith-Waterman-Algorithmus: Die für die Ermittlung von Alignments benötigten Ressourcen sind auch bei größeren Datenmengen überschaubar. Die derart erzeugten Tabellen können variabel eingesetzt werden, indem man alle Alignments für einzelne Sammlungen anzeigen lässt, nach bestimmten Identifiern oder Verkettungen derselbigen sucht oder auch nach Alignments mit hohen similarity- oder sw-Werten.

[90]Bei unserem letzten Beispiel haben wir auf den similarity-Wert zugegriffen, dort wäre eine Ordnung nach sw-Wert letztlich identisch ausgefallen. Auf welche Angabe man zugreift, hängt letztlich von der Fragestellung ab. Der similarity-Wert steigt aufgrund seiner Berechnung an, je mehr Elemente einer Sequenz mit der Vergleichssequenz identisch sind. Der sw-Wert dient hingegen dazu zu ermitteln, welches von mehreren möglichen Alignments im jeweiligen Vergleich das umfangreichste ist; er hängt daher vom Umfang der Vergleichssequenzen ab. Dieser Wert dürfte daher insbesondere bei mehreren Vergleichen mit einer speziellen Sammlung aussagekräftig sein, ist es in größerem Rahmen aber nur bedingt.

[91]Eine methodische Einschränkung liegt allerdings bei dem Zugriff auf den Smith-Waterman-Algorithmus vor: Dieser ermittelt nur das jeweils längste Alignment zweier Vergleichssequenzen, weitere Übereinstimmungen werden nicht ausgegeben. Dieses Manko lässt sich dadurch abmildern, dass man bei der Untersuchung eines Korpus neben dem Algorithmus auch die Dotplots konsultiert; im Rahmen der Untersuchung von Priamelsequenzen hat sich dies zumindest als nützlich erwiesen.

[92]Generell gilt für die beiden automatisierten Verfahren, dass durch die Verwendung von R als verbreiteter und frei verfügbarer Programmiersprache eine Nachnutzung in unterschiedlichen Szenarien gewährleistet ist. Dass der Code an andere Bedürfnisse leicht angepasst werden und die Benutzung unabhängig von kommerziellen Anbietern erfolgen kann, ist dabei ein großer Vorteil.

[93]Grundsätzlich gilt: Dotplots und Alignments dienen dazu, Thesen zur Überlieferungs- und Textgeschichte einzelner Textgruppen zu bilden oder dazu, diese zu überprüfen. Die Einsichten beschränken sich daher auch auf dasjenige, was man auf der Ebene der Textanordnungen erkennen kann; abgeleitete Thesen haben daher vorläufigen Charakter. Es ist keineswegs so, dass man anhand beider Zugänge endgültige Schlüsse ziehen kann, da ein entscheidender Schritt fehlt, der in diesem Beitrag nicht eingehend beleuchtet werden konnte: Ohne anschließende textkritische Analysen lässt sich nicht entscheiden, ob die vermuteten Zusammenhänge tatsächlich plausibel sind oder nicht. Dotplots und Alignments sind also kein Selbstzweck, sondern Mittel zum Zweck – allerdings durchaus hilfreiche.

7. Zusammenfassung und Ausblick

[94]Der Ausgangspunkt der vorgestellten Überlegungen war die Frage, wie man in einem umfangreichen Korpus von Einzeltexten, die in verschiedenen größeren und kleineren Sammlungen mehrfach überliefert sind, identische oder fast identische Textsequenzen identifizieren kann. Dafür wurden zwei Verfahren genutzt: Dotplots sowie die automatische Sequenzanalyse mittels Smith-Waterman-Algorithmus.

[95]Die Voraussetzung ist in beiden Fällen ein Korpus, in dem die einzelnen Texte als Token exakt benannt sind und ihre Position im Verhältnis zu den anderen Elementen genau bestimmt ist. Denkbare Zugriffe sind für die Erstellung eines solchen Korpus z. B. der Zugriff auf Handschriften- oder Druckbeschreibungen oder auf andere (digital bereitgestellte) Datensätze[123]. Eine normierte Benennung ist deshalb wichtig, da uneinheitliche Ausgangsdaten zu einer Verfälschung der Ergebnisse führen würden. Man könnte prinzipiell statt der Identifier auch mit normierten Daten wie etwa Werktiteln arbeiten, da prinzipiell keine Beschränkung bei den Vergleichen über die Dotplots und den Smith-Waterman-Algorithmus vorliegen.

[96]Die Erschließungstiefe der herangezogenen Daten ist prinzipiell abhängig von der jeweiligen Fragestellung; ob etwa Fassungen präzise oder summarisch eingebunden werden, sollte anhand des Einzelfalles entschieden werden. Bei den Priameln lag der Entscheidung für eine summarische Erfassung der Gedanke zugrunde, dass die Frage nach der Ansetzung verschiedener Fassungen bisher nicht immer ausreichend begründet wurde und im Einzelfall erneut geprüft werden sollte.[124] Die Bewertung hängt letztlich auch vom methodischen Rahmen der textkritischen Untersuchung ab – so macht es durchaus einen Unterschied, ob man im Sinne der ›klassischen‹ Textkritik eher mit Trenn- und Bindefehlern argumentieren möchte[125] oder etwa auf das von Joachim Bumke vorgelegte analytische Instrumentarium verschiedener Arten der Textvarianz[126] zugreift.

[97]Unser Fokus lag darauf, die Methoden zu beschreiben und verschiedene Anwendungsfälle zu zeigen, um einen Eindruck über die Anwendbarkeit zu vermitteln und Hürden für eine Nachnutzung abzubauen. Denkbar wäre z. B. die Übertragung der Methoden auf andere Untersuchungsgegenstände wie die eingangs erwähnten Rezeptsammlungen, die Heiles durch einen eigenen Analysezugang neu ins Gespräch brachte, oder die (experimentelle) Einbindung des Smith-Waterman-Algorithmus in bestehende Datenbanken, bei digitalen Editionen mit flexiblen Textensembles usw.

[98]Abschließend lässt sich festhalten, dass Dotplots und automatische Sequenzanalysen mittels des Smith-Waterman-Algorithmus vielversprechende Werkzeuge bei der Arbeit mit (heterogenen) Überlieferungsgemeinschaften darstellen. Beide Methoden können zur Ermittlung identischer oder ähnlicher Textreihen genutzt werden und sind auch als Ergänzung für die Beschreibung komplexer Überlieferungsverhältnisse hilfreich. Durch die Bereitstellung des Codes inklusive eines Beispieldatensatzes hoffen wir, dass eine Anwendung auf weitere Gegenstände möglich und gewinnbringend sein wird.

[99]


Fußnoten

  • [1]

  • [2]
    Heiles 2022, Abs. 12.

  • [3]
    Vgl. für einen Überblick zum Stichwort ›Sammeln‹ Chinca et al. 2022. Zu Sammlungen von Kurztexten vgl. Wachinger 1994. Vgl. grundlegend zur Überlieferung und den Sammlungen des Minnesangs Schweikle 1995, S. 1–21.

  • [4]
    Zur Gattung vgl. Dicke 2007; Heiles 2021, S. 315 inkl. Anm. 38; Williams-Krapp 2020, S. 63–66.

  • [5]
    Der Begriff ›Streuüberlieferung‹ meint Fälle, in denen nur einzelne Priamel – etwa in Form von Nachträgen – Eingang in Handschriften fanden (vgl. die Beschreibungen bei Kiepe 1984, S. 382–388).

  • [6]
    Zu den Textzeugen vgl. Kiepe 1984, S. 308–388 und zukünftig Buschmann, Überlieferungskomplex Rosenplüt. Der Vollständigkeit halber sei erwähnt, dass auch ein einzelner (Kiepe noch unbekannter) Druck mit Priameln von um 1630 existiert (Krakau, Uniwersytet Jagiellonski, Biblioteka Jagiellonska, Yd 3223 [ehemals Berlin, Staatsbibliothek]: Freyharts Predig. Hundert schöne alte Sprüch, der Welt Lauff betreffend […], Johann Friedrich Sartorius, Nürnberg, ca. 1630), der nach derzeitigem Stand den Endpunkt der Überlieferung darstellen dürfte.

  • [7]
    Zum Lebensbeginn vgl. Reichel 1985, S. 129–130, der den Zeitraum der Geburt genauer auf zwischen 1396–1404 festlegt; zum Tod Rosenplüts vgl. Reichel 1985, S. 151.

  • [8]
    Vgl. Glier 1988, S. 140.

  • [9]
    Vgl. Kiepe 1984, S. 45.

  • [10]
    Vgl. Reichel 1985, S. 99.

  • [11]
    Vgl. Griese 2019, S. 65–66; Reichel 1985, S. 73–78.

  • [12]
    Dagegen argumentierte bisher nur Kiepe (vgl. Kiepe 1984, S. 274–304).

  • [13]
    Vgl. die Zusammenstellung bei Reichel 1985, S. 79–100, der auch Namensnennungen in Paratexten anführt.

  • [14]
    Reichel 1985, S. 87 (unter c).

  • [15]
    Vgl. Reichel 1985, S. 101–102.

  • [16]
    Vgl. z. B. Reichel 1985, S. 89.

  • [17]
    Reichel 1985, S. 99.

  • [18]
    Zur Handschrift vgl. den Eintrag im Handschriftencensus; Hoffmann 2013.

  • [19]

  • [20]

  • [21]
    Vgl. Kiepe 1984, S. 45.

  • [22]
    Vgl. Heiles 2021, der eine handschriftliche Priamelsammlung untersucht hat; zu der diachronen Untersuchung eines einzelnen Priamelvierzeilers (d. h. ein vier Verse umfassender Spruch als Vorläufer der später mit Rosenplüts Namen verbundenen Priamel) vgl. Dicke 1994, zur Gattungsfrage S. 63–64.

  • [23]
    Zumindest Klaus Graf macht verschiedentlich auf die Gattung aufmerksam, vgl. etwa Graf 2014 sowie verschiedene seiner Beiträge zur Gattung auf seinem Blog Archivalia.

  • [24]
    Karl Euling druckte verschiedene Priamel in seiner umfassenden Studie ab, vgl. Euling 1905, S. 484–579. Eine Teilausgabe mit kritischem Apparat zu einzelnen Stücken legte er bereits früher vor, vgl. Euling 1887. 1908 folgte eine umfassende Ausgabe der Handschrift Wolfenbüttel, Herzog August Bibliothek, Cod. Guelf. 2.4 Aug. 2°, vgl. Euling 1908.

  • [25]
    Vgl. Kiepe 1984, S. 80–113.

  • [26]
    Kiepe 1984, S. 103.

  • [27]
    Vgl. die Erfassung der Überlieferung bei Kiepe 1984, S. 308–388; Reichel 1985, S. 224–250; Ridder et al. (Hg.) 2022, S. 16–29; Simon 1970, S. 14–23.

  • [28]
    Zu diesem Ergebnis kam bei den Reimpaardichtungen und Liedern auch Reichel, vgl. Reichel 1985, S. 54–55. Kiepes Argumentation deutet teilweise an, dass er umfangreichere Vorlagen im Sinn hatte, wie sich u. a. anhand einer ausführlichen tabellarischen Zusammenstellung zeigt (vgl. Kiepe 1984, S. 93–94.). Er rekonstruiert eine Reihe von Priameln, die so in keiner einzigen Handschrift tatsächlich vorliegt, sondern auf verschiedenen kleinteiligeren Übereinstimmungen beruht; vgl. die beispielhaften Ausführungen zu geplanten Umstellungen bei der Abschrift einer hypothetischen Vorlage bei Kiepe 1984, S. 97–98.

  • [29]
    Vgl. für eine Übersicht der Produktion solcher Hefte durch eine*n einzelne*n Schreiber*in Kiepe 1984, S. 174–180. Vgl. zur Einzelheftüberlieferung im Kontext Rosenplüts Griese 2019, S. 81–86. Zu einem konkreten Einzelheft mit Priameln vgl. Heiles 2021. Dass Einzelhefte bzw. Einzelpublikationen als Grundlage größerer Sammelausgaben dienen konnten, hat für Sebastian Brant Nikolaus Henkel eingehend beleuchtet, vgl. Henkel 2020.

  • [30]
    Vgl. Rautenberg 1999, S. 4.

  • [31]

  • [32]
    Karlsruhe, Badische Landesbibliothek, Cod. Donaueschingen A III 19, vgl. den Eintrag im Handschriftencensus sowie Eichenberger 2014; Heiles 2021; Kiepe 1984, S. 245–246.

  • [33]
    Vgl. Reichel 1985, S. 54–55. Bereits 1967 vermutet Arend Mihm, dass kleinere Grüppchen von Einzeltexten als »Gruppenedition« (Mihm 1967, S. 34) im Umlauf gewesen sein könnten.

  • [34]
    Etwa in Cod. germ. 13 der Staats- und Universitätsbibliothek Hamburg Carl von Ossietzky; vgl. den Eintrag im Handschriftencensus; Ridder et al. (Hg.) 2022, S. 19–20; Horváth / Stork (Hg.) 2002, S. 148; Habel 1994, S. 110, 112–113, 116, 129; Nöcker / Schuler 2009, S. 365 inkl. Anm. 10 mit weiteren Hinweisen.

  • [35]
    Vgl. Heiles 2021, S. 320–321.

  • [36]
    Vgl. zuletzt Wolf 2022, hier S. 128–130.

  • [37]
    Z. B. Pr. 25, Pr. *82, Pr. *121 sowie Pr. 124, vgl. zur Überlieferung Kiepe 1984, S. 397, 402. Vgl. zu diesen Drucken die Übersicht bei Heiles 2021, S. 315, Anm. 36 mit Hinweisen zur Forschung und zu Digitalisaten.

  • [38]
    Vgl. zu Druckabschriften Kiepe 1984, S. 182–193; Wolf 2011.

  • [39]
    Vgl. zu diesem Druck Griese 2000, S. 179 (mit Textabdruck und Übersetzung) sowie Pfister 1986.

  • [40]
    Dass dies grundsätzlich denkbar ist, deuten einzelne von Kiepe versammelte Beobachtungen textkritischer Natur an, vgl. Kiepe 1984, S. 95–96.

  • [41]
    Im vorliegenden Beitrag beschränken wir uns aufgrund der Größe des derart entstehenden Korpus auf exemplarische Einblicke, die primär zur Illustration der Methodik dienen. Eine darauf aufbauende ausführliche Untersuchung der Priamelüberlieferung zukünftig bei Buschmann, Überlieferungskomplex.

  • [42]
    Eine solche Analyse kann im Rahmen der vorliegenden Arbeit nicht gewährleistet werden; wir beschränken uns auf Verfahren, mit denen potentielle Vergleichsobjekte für eine textkritische Analyse ermittelt werden können.

  • [43]
    Vgl. Weitin 2021, S. 116.

  • [44]
    Vgl. Weitin 2015, S. 654; Lechtermann / Stock 2020, S. 346.

  • [45]
    Weitin 2015, S. 654.

  • [46]
    Vgl. Platnick / Cameron 1977; Viehhauser 2017, S. 245–246. Zur Geschichte der Phylogenese und der Übertragung auf die Stemmatologie vgl. Hoenen 2020, S. 296–298.

  • [47]
    Vgl. grundlegend Roelli 2020, S. 209–214. Roelli notiert als Definition: »a stemma (codicum) is an oriented tree-like graph representing a hypothesis about genealogical realtionships between witnesses of a text« (Roelli 2020, S. 212).

  • [48]
    Vgl. Chlench / Viehhauser 2014, S. 58–59.

  • [49]
    Vgl. Chlench / Viehhauser 2014, S. 69–81; vgl. auch Viehhauser 2017.

  • [50]
    Howe / Windram 2011, S. 2. Derartige Übertragungen phylogenetischer Untersuchungsinstrumente auf philologische Gegenstände werden mit dem Stichwort der ›Phylomemetik‹ bezeichnet, vgl. Chlench / Viehhauser 2014, S. 69; Howe / Windram 2011, S. 4.

  • [51]
    Vgl. zum Begriff Carstensen et al. 2010, S. 264; Andrews 2020, S. 168–169; Dekker et al. 2015, S. 454.

  • [52]
    Denkbar sind letztlich verschiedene Bezugsgrößen, nämlich auch Silben, Phrasen oder Absätze, vgl. Dekker et al. 2015, S. 455.

  • [53]
    Vgl. Howe et al. 2012, S. 53. Zur Normalisierung von Texten für Autorschaftsattributionstests vgl. Dimpel / Wagner 2022, S. 33–34.

  • [54]
    Vgl. Andrews 2020, S. 168–169; Viehhauser 2017, S. 251–252; Chlench / Viehhauser 2014, S. 71.

  • [55]
    Vgl. Howe / Windram 2011, S. 2. Zu einer Erwiderung kritischer Positionen gegenüber ihrem Ansatz vgl. Howe et al. 2012.

  • [56]
    Diese Zugänge sind nicht mehr zwangsläufig unmittelbar an bioinformatische Ansätze angebunden; vgl. die Überblicke bei Yousef / Jänicke 2021 und Jänicke et al. 2015.

  • [57]
    Parzival-Projekt (Hg.), ›Parzival‹. Vgl. zur Nutzung der Daten im Rahmen einer phylogenetischen Analyse Viehhauser 2017 und Chlench / Viehhauser 2014.

  • [58]
    Vgl. Viehhauser 2017, S. 251.

  • [59]
    Vgl. Lechtermann / Stock 2020, S. 443, die darauf hinweisen, dass man derzeit einerseits auf maschinenlesbare Textausgaben zugreifen kann, die aber hinsichtlich ihres Alters und der zugrundeliegenden Einrichtungsprämissen differieren, sowie andererseits auf die wachsende Zahl an Handschriftendigitalisaten, die jedoch in den meisten Fällen lediglich als Bild vorhanden sind.

  • [60]
    Die Bezeichnung ›dot plot‹ ist an sich sehr offen und meint jegliche Art des Punktdiagramms, vgl. Bedenbender 2018, S. 70, Anm. 289. Wir verwenden hier die Schreibung ›Dotplot‹, um eine spezifische Form des Punktdiagramms auszuweisen, wie sie unten näher erläutert wird.

  • [61]
    Vgl. Bedenbender 2018, S. 70. Als Hilfsmittel für die Feststellung von Analyse langer Texte erwähnte auch Zbynĕk Garský Dotplots (vgl. Garský 2012, S. 8–10) und bildet einen solchen ab (vgl. Garský 2012, S. 10); dieser hat aber eher illustrativen Charakter. Garský geht es darum, dass man anhand des gezeigten Dotplots Textähnlichkeiten erkennt, die bereits nachgewiesen worden sind.

  • [62]
    Kiepe 1984, S. 390–404; unsichere Zuweisungen einzelner Priamel an Rosenplüt sind durch Asterisk markiert.

  • [63]

  • [64]
    Prinzipiell wäre auch die Verwendung anderer Datensätze denkbar, etwa normierte Textanfänge (Incipits), wie sie in der Cantus-Datenbank nachgewiesen sind.

  • [65]
    Fassungsübergreifende Identifier ermöglichen, eine Reihe einzelner Texte auch dann verfolgen zu können, wenn im textkritischen Sinne bei einzelnen Stücken unterschiedliche Fassungen vorliegen. Man würde bei vorheriger Aufsplittung der Identifier nach Fassung indirekt bereits vor der Untersuchung der Sammlung entscheiden, dass die verwendeten Vorlagen differiert hätten, wodurch bei der Abschrift entstehende Varianz überproportional gewichtet wäre. Diese Entscheidung sollte jedoch erst im Anschluss an die hier vorgestellten Analysen getroffen werden. Vgl. grundlegend zur Textkritik Maas 1957. Zur Textkritik in der germanistischen Tradition vgl. den Überblick bei Bein 2011, S. 73–97. Vgl. auch Plachta 2018. Vgl. zur Frage nach intentionalen Eingriffen in den Text durch Schreiber*innen und verschiedenen Arten solcher Änderungen Schubert 2002.

  • [66]
    Diese Nummerierung erfolgte fortlaufend anhand der von Kiepe genannten Incipits.

  • [67]
    Wir beschränken uns auf maximal vier Kurztexte, die der Gattung der Priamel üblicherweise nahestehen; in der Überlieferung üblich sind eher ein bis zwei Texte. Bei umfangreicheren Unterbrechungen werden einzelne Teilsammlungen angesetzt.

  • [68]
    Vgl. Kiepe 1984, S. 330. Bei den im Folgenden abgebildeten Tabellen wurde auf eine Hochstellung verzichtet, dort schließt die jeweilige Nummer der Sammlung ohne weitere Formatierung an die Sigle an.

  • [69]
    Vgl. Gibbs / McIntyre 1970. Die Anregung zur Verwendung dieser Methode stammt in unserem Fall von Tommy Hofmann (IDT Biologika, Dessau-Roßlau), dem an dieser Stelle noch einmal sehr herzlich gedankt sei.

  • [70]

  • [71]
    Vgl. die Abbildungen bei Gibbs / McIntyre 1970, S. 2.

  • [72]
    Vgl. Bedenbender 2018, S. 70–73 und S. 210–222. Bedenbender greift im Anschluss auf ›Projektionsdotplots‹ zu, da sie darauf hinweist, dass der Aufwand für die Erstellung der Vergleichsdotplots bei einem größeren Textkorpus sehr hoch ist, vgl. Bedenbender 2018, S. 223. Die Projektionsdotplots reduzieren die Darstellung der Vergleiche derart, dass die Spalten der Matrizen wie hier einzelne Token abbilden, die Zeilen hingegen auf einzelne Textzeugen reduziert sind, so dass für Matches »nicht die Position in einem weiteren Text, sondern nur jeweils die Existenz eines Matches in einem bestimmten Text [verzeichnet wird]« (Bedenbender 2018, S. 223).

  • [73]
    Bei den Priameltoken in Zeile 2 und Spalte B lautet eine Möglichkeit für die erste Zelle der Matrix in C3: =WENN(ODER(C$2="GP";$B3="GP");WENN(UND(C$2<>"";$B3<>"");‑1;"");WENN(UND(C$2<>"";$B3<>"");WENN(IDENTISCH(C$2;$B3);1;0);""))

  • [74]
    R Core Team 2022. Das Programm wird im folgenden Abschnitt näher beschrieben.

  • [75]
    Uns ist bewusst, dass bei den abgebildeten Ausschnitten die Details (Sammlungsbezeichnungen, Token) nicht angemessen lesbar sind. Es geht uns hier und im Folgenden primär um die Sichtbarmachung verschiedener Muster, die sich vor allem im Überblick zeigen. Für die Detailarbeit mit Dotplots müssten Anwender*innen nach anfänglicher Musterkennung im Gesamtbild dann weiter hineinzoomen und jeweils kleinere Ausschnitte im Detail analysieren (siehe z. B. Abschnitt 6).

  • [76]
    Im Beispiel sind horizontal mehr Sammlungen abgebildet als vertikal; die Diagonale endet daher etwa in der Bildmitte; nach unten würden die Dotplots der rechten Seite gespiegelt weiterlaufen.

  • [77]
    Für Erläuterungen von Dotplot-Mustern in weiteren Zusammenhängen vgl. Helfman 1996; Church / Helfman 1993.

  • [78]
    Vgl. Smith / Waterman 1981. Es gibt bereits verschiedene Ansätze, welche Sequenzanalysen für philologische Fragestellungen fruchtbar machen, vgl. z. B. Dekker et al. 2015. CollateX orientiert sich an DNA-Analysen, wird aber v. a. für Textkollationierungen und stemmatische Analysen genutzt. Vgl. zur Verwendung von Sequence Alignments zum Vergleich einzelner Texte bzw. von Korpora auf Übereinstimmungen Chaudhuri / Dexter 2017, besonders S. 3–4; Vierthaler / Gelein 2019.

  • [79]

  • [80]

  • [81]

  • [82]

  • [83]
    Für eine vollständige Darstellung des Algorithmus vgl. Smith / Waterman 1981.

  • [84]
    Vgl. den Überblick bei Kayed / Elngar 2020, S. 9170–9172; vgl. z. B. Edgar 2004; Thompson et al. 1994. Solche MSA-Methoden wurden bereits für linguistische Fragestellungen eingesetzt, vgl. z. B. Prokić et al. 2009.

  • [85]

  • [86]
    Für die Umsetzung des Smith-Waterman-Algorithmus wurden unter anderem adaptierte Routinen des text.alignment-Paketes von Jan Wijffels genutzt.

  • [87]

  • [88]

  • [89]
    Zum Begriffspaar ›geistlich‹ – ›weltlich‹ vgl. Wachinger 2000, S. 2–5. Die Dichotomie ›geistlich – weltlich‹ ist nicht immer trennscharf, wie z. B. Nicole Eichenberger im Kontext kleinepischer Dichtungen diskutiert, vgl. Eichenberger 2015, S. 15–19. Bei den Priameln ist eine derartige Untergliederung grundlegend sinnvoll und auch durch die Überlieferung gestützt (siehe unten). Zugleich gibt es Fälle, in denen einzelne Priamel zwischen beiden Bereichen changieren. Ein Beispiel dafür wäre Pr. 59, in dem es um verschiedene Arten von Leid geht, das von anderen an eine Person herangetragen wird (ein Abdruck bei Euling 1905, S. 534; vgl. auch Selmer / Goedsche 1938, S. 74, Nr. 10). Wer jemandem, der mit diesen verschiedenen Widrigkeiten geschlagen sei, zusätzlich Schlechtes gönne, der versündige sich, so lehrt es der Text (V. 13–14). Von diesen Widrigkeiten ist allerdings nur eine geistlicher Art, nämlich ein Kirchenbann. Dieser ist zudem recht weltlich gewendet, da es darum geht, dass man sich aufgrund fehlender finanzieller Mittel nicht aus diesem befreien könne (V. 7–8) und nicht etwa aus religiösen Gründen. Am Ende geht es also um Profanes, nämlich das Geld. Die weiteren Beispiele sind z. B. unwirksame Salben der Ärzte, üble Zöllner oder die Gefangennahme durch einen Räuber.

  • [90]
    Vgl. zum geistlichen Bereich Euling 1905, S. 498–541. Dieser Hinweis (allerdings mit Verweis auf S. 498–566) bereits bei Kiepe 1984, S. 103, Anm. 67. Vgl. Dicke 2007, S. 158–159.

  • [91]
    Vgl. zur Zyklenbildung der geistlichen Priamel Kiepe 1984, S. 103–104.

  • [92]
    Vgl. Kiepe 1984, S. 103.

  • [93]
    Dies gilt derart nicht für die Drucküberlieferung des 16. Jahrhunderts, da bei dieser andere Verhältnisse und deutlich ausgeprägtere Abhängigkeiten vorliegen. Vgl. dazu zukünftig Buschmann, Überlieferungskomplex.

  • [94]
    Siehe oben, Anm. 29.

  • [95]

  • [96]
    Vgl. Heiles 2021, S. 307, Anm. 2.

  • [97]
    Zur Entwicklung von Titelblättern vgl. die ausführliche Studie von Rautenberg 2008.

  • [98]
    Vgl. die Übersichten bei Heiles 2021, S. 317 und Kiepe 1984, S. 348 (Handschrift I).

  • [99]

  • [100]
    Vgl. Heiles 2021, S. 317.

  • [101]

  • [102]
    Vgl. Esch 1985, besonders S. 67.

  • [103]
    Vgl. Kiepe 1984, S. 113.

  • [104]
    Die Reihung in f1 ist die Spiegelung derjenigen in a6 und wird daher hier ausgeklammert.

  • [105]
    Kiepe 1984, S. 106.

  • [106]
    Vgl. Kiepe 1984, S. 109–110, 392.

  • [107]
    Die beiden Reihen stehen eine Position weiter oben (b3) bzw. unten (b5).

  • [108]
    Vgl. Kiepe 1984, S. 110.

  • [109]
    Vgl. zu dieser Kiepe 1984, S. 330–348. Es handelt sich um Cod. 5339a des Germanischen Nationalmuseums in Nürnberg, der um 1472 in Nürnberg entstanden ist und vom gleichen Schreiber wie das erwähnte Priamel-Einzelheft geschrieben wurde (vgl. Kiepe 1984, S. 154–181). Zur Handschrift vgl. den Eintrag im Handschriftencensus.

  • [110]
    Vgl. Kiepe 1984, S. 110.

  • [111]
    Zu dem im Rahmen von Sequenzanalysen gebrauchten Terminus gap siehe unten.

  • [112]
    Vgl. Euling 1905, S. 498–541. Als ›geistlich‹ werden folgende Priamel aus dem ›Werkkomplex Rosenplüt‹ eingeordnet: Pr. 1–33, Pr. 35, Pr. 41, Pr. 52–54, Pr. 56–58, Pr. 60, Pr. 65–67, Pr. 96, Pr. 112.

  • [113]
    Vgl. den Eintrag im Handschriftencensus; Kiepe 1984, S. 318–329, zur Sammlung B3 S. 322–323. Ein Digitalisat ist verfügbar unter urn:nbn:de:bvb:12-bsb00061175-8.

  • [114]
    Vgl. den Eintrag im Handschriftencensus; Hoffmann 2013; Kiepe 1984, S. 330. Ein Digitalisat ist verfügbar unter urn:nbn:de:bsz:14-db-id2768198536.

  • [115]
    Vgl. den Eintrag im Handschriftencensus; Kiepe 1984, S. 359–362, zur Sammlung R1 S. 360–361. Ein Digitalisat ist online verfügbar.

  • [116]
    Vgl. den Eintrag im Handschriftencensus; Kiepe 1984, S. 330–348, zur Sammlung F2 S. 346–347. Ein Digitalisat ist online verfügbar.

  • [117]
    Vgl. den Eintrag im Handschriftencensus; Bodemann 2012; Kiepe 1984, S. 362–366, zur Sammlung S4 S. 366. Ein Digitalisat ist online verfügbar.

  • [118]
    Der Datensatz ist als Beispiel bei den in GitHub veröffentlichten Daten abrufbar. Diese Tabelle wurde um doppelte Vergleiche bereinigt, da jeweils untereinander z. B. S4 mit F1 und dann F1 mit S4 verglichen wird.

  • [119]
    In diesem Fall dürfte die Doppelung dadurch entstanden sein, dass der Textbeginn nicht identisch ist. Vgl. den Abdruck bei Euling 1905, S. 509 und den Hinweis zur Identität beider Priamel bei Euling 1908, S. 110, 630 (Eulings Hinweis auf Deckung ab »2ff.« ist nicht ganz richtig, erst ab V. 3 stimmen beide grundsätzlich überein).

  • [120]
    Was im Beispiel wenig überraschend ist, da ja genau jene Sammlungen herangezogen werden, die Zyklus I enthalten.

  • [121]
    Man könnte solche Fälle durch Anpassung des Gap-Parameters im Smith-Waterman-Algorithmus erfassen, worauf hier aber verzichtet worden ist.

  • [122]
    Vgl. die Zusammenfassung bei Kiepe 1984, S. 103–105.

  • [123]
    Im Rahmen des laufenden Projektes zum Handschriftenportal werden etwa für deutschsprachige Texte die im Handschriftencensus verzeichneten Werktitel erfasst, für Werke in lateinischer Sprache hingegen Werknormdokumente aus Manuscripta Mediaevalia, vgl. den von der DFG bewilligten Fortsetzungsantrag des Handschriftenportals, S. 22. Allerdings haben diese Ansetzungen Grenzen, da eine Normierung weiterer Werktitel nicht unproblematisch ist; zu klären ist etwa, wo die der jeweilige Begriff von ›Werk‹ seine Grenzen hat. Für diesen freundlichen Hinweis danken wir Christoph Mackert (Universitätsbibliothek Leipzig, Handschriftenzentrum) sehr herzlich.

  • [124]
    Kiepe setzt Fassungen bei Ersetzung und Einfügung ganzer Verspaare an, klammert Umstellungen und Auslassungen aber aus (vgl. Kiepe 1984, S. 389).

  • [125]
    Vgl. Maas 1957.

  • [126]
    Vgl. zu den drei von ihm gebrauchten Kategorien zur Analyse der Textvarianz und ihrem Ausmaß Bumke 1996, S. 391–394.


Bibliografische Angaben

  • Tara Andrews: Transcription and Collation. In: Philipp Roelli (Hg.): Handbook of Stemmatology. History, Methodology, Digital Approaches. Berlin u. a. 2020, S. 160–175. DOI: 10.1515/9783110684384-004

  • Almuth Bedenbender: Wörtliche Übereinstimmungen und Übernahmen in frühneuhochdeutschen Rechtstexten. Erkennung und Auswertung. Dissertation, Universität zu Köln. 2018. URN: urn:nbn:de:hbz:38-76965

  • Thomas Bein: Textkritik. Eine Einführung in die Grundlagen germanistisch-mediävistischer Editionswissenschaft. Lehrbuch mit Übungsteil. 2. Auflage. Frankfurt / Main u. a. 2011. [Nachweis im GVK]

  • Ulrike Bodemann: Fabeln. Ulrich Boner, ›Der Edelstein‹. Handschrift Nr. 37.1.20. Wolfenbüttel, Herzog August Bibliothek, Cod. Guelf. 2.4 Aug. 2°. In: Ulrike Bodemann / Kristina Freienhagen-Baumgardt / Pia Rudolph / Peter Schmidt / Christine Stöllinger-Löser / Nicola Zotz (Hg.): Katalog der deutschsprachigen illustrierten Handschriften des Mittelalters (KdiH). 10 Bde. München 1991–2023. Bd. 4/1 (2012). Letzte Aktualisierung: 26.04.2023. HTML. [online]

  • Joachim Bumke: Die vier Fassungen der »Nibelungenklage«. Untersuchungen zur Überlieferungsgeschichte und Textkritik der höfischen Epik im 13. Jahrhundert. Berlin u. a. 1996. (= Quellen und Forschungen zur Literatur- und Kulturgeschichte, 8 [242]). DOI: 10.1515/9783110812923 [Nachweis im GVK]

  • Frank Buschmann: Der Überlieferungskomplex Rosenplüt. Literarische Produktion und Distribution im 15. und 16. Jahrhundert. Leipzig. [Im Erscheinen]

  • Kai-Uwe Carstensen / Christian Ebert / Cornelia Ebert / Susanne Johanna Jekat / Ralf Klabunde / Hagen Langer: Computerlinguistik und Sprachtechnologie. Eine Einführung. 3. Auflage. Heidelberg 2010. DOI: 10.1007/978-3-8274-2224-8

  • Pramit Chaudhuri / Joseph P. Dexter: Bioinformatics and Classical Literary Study. In: Marco Büchler / Laurence Mellerin (Hg.): Computer-Aided Processing of Intertextuality in Ancient Languages (= Journal of Data Mining and Digital Humanities / Special Issues). (Lyon, 02.–04.06.2014) 19.08.2017. DOI: 10.46298/jdmdh.1386

  • Mark Chinca / Manfred Eikelmann / Michael Stolz / Christopher Young: Einleitung: Konzepte, Praktiken und Poetizität des Wort- und Textsammelns in der Literatur des Mittelalters und der Frühen Neuzeit. In: Mark Chinca / Manfred Eikelmann / Michael Stolz / Christopher Young (Hg.): Sammeln als literarische Praxis im Mittelalter und in der Frühen Neuzeit. Konzepte, Praktiken, Poetizität. (XXVI. Anglo-German Colloquium, Ascona, 26.–30.08.2019) Tübingen 2022, S. 11–20. [Nachweis im GVK]

  • Kathrin Chlench / Gabriel Viehhauser: Phylogenese und Textkritik der Parzival-Überlieferung. Bioinformatische Anregungen zur Lösung genealogischer Klassifizierungsprobleme in der Editionsphilologie. In: Michael Stolz / Yen-Chun Chen (Hg.): Internationalität und Interdisziplinarität der Editionswissenschaft (= Beihefte zu Editio, 38). Berlin u. a. 2014, S. 65–90. DOI: 10.1515/9783110367317.65

  • Kenneth Ward Church / Jonathan Isaac Helfman: Dotplot: A Program for Exploring Self-Similarity in Millions of Lines of Text and Code. In: Journal of Computational and Graphical Statistics 2 (1993), H. 2, S. 153–174. DOI: 10.1080/10618600.1993.10474605

  • Ronald Haentjens Dekker / Dirk van Hulle / Gregor Middell / Vincent Neyt / Joris van Zundert: Computer-Supported Collation of Modern Manuscripts. CollateX and the Beckett Digital Manuscript Projekt. In: Digital Scholarship in the Humanities 30 (2015), H. 3, S. 452–470. DOI: 10.1093/llc/fqu007

  • Gerd Dicke: Mich wundert, das ich so frölich pin. Ein Spruch im Gebrauch. In: Walter Haug / Burghart Wachinger (Hg.): Kleinstformen der Literatur (= Fortuna Vitrea, 14). (Reisensburger Arbeitsgespräch, Günzburg, 12.-14.06.1994) Tübingen 1994, S. 56–90. [Nachweis im GVK]

  • Gerd Dicke: Priamel. In: Georg Braungart / Harald Fricke / Klaus Grubmüller / Jan-Dirk Müller / Friedrich Vollhardt / Klaus Weimar (Hg.): Reallexikon der deutschen Literaturwissenschaft. Neubearbeitung des Reallexikons der deutschen Literaturgeschichte. 3 Bde. 3. Auflage. Berlin u. a. 2007. Bd. 3: P–Z, S. 157–159. DOI: 10.1515/9783110914672

  • Friedrich Michael Dimpel / Silvan Wagner: Rosenplüt als Autor der Nürnberger Weingrüße. Philologische und computerphilologische Analysen. In: Sylvia Jurchen / Silvan Wagner (Hg.): Schlechtes Wetter und Grenzüberschreitungen (= Beiträge zur mediävistischen Erzählforschung / Sonderhefte: Brevitas, 2). Oldenburg 2022, S. 1–53. DOI: 10.25619/BmE20221165

  • Robert C. Edgar: MUSCLE. A Multiple Sequence Alignment Method with Reduced Time and Space Complexity. In: BMC Bioinformatics 5 (2004), Artikel 113. 19.08.2004. DOI: 10.1186/1471-2105-5-113

  • Nicole Eichenberger: Geistliches Erzählen. Zur deutschsprachigen religiösen Kleinepik des Mittelalters (= Hermaea, 136). Berlin u. a. 2015. DOI: 10.1515/9783110400816

  • Nicole Eichenberger: Karlsruhe, Badische Landesbibliothek - Cod. Donaueschingen A III 19. Priamelsammlung. In: Manuscripta Mediaevalia. Letzte Aktualisierung: 13.02.2014. HTML. [online]

  • Arnold Esch: Überlieferungs-Chance und Überlieferungs-Zufall als methodisches Problem des Historikers. In: Historische Zeitschrift 240 (1985), H. 3, S. 529–570. DOI: 10.1524/hzhz.1985.240.3.529

  • Karl Euling (Hg.): Hundert noch ungedruckte Priameln des fünfzehnten Jahrhunderts (= Göttinger Beiträge zur deutschen Philologie, 2). Paderborn u. a. 1887. [online]

  • Karl Euling: Das Priamel bis Hans Rosenplüt. Studien zur Volkspoesie (= Germanistische Abhandlungen, 25). Breslau 1905. [online]

  • Karl Euling (Hg.): Die Wolfenbüttler Handschrift 2. 4. Aug. 2° (= Deutsche Texte des Mittelalters / Kleinere mittelhochdeutsche Erzählungen, Fabeln und Lehrgedichte, 2). Berlin 1908. [online]

  • Zbynĕk Garský: Das Wirken Jesu in Galiläa bei Johannes. Eine strukturale Analyse der Intertextualität des vierten Evangeliums mit den Synoptikern (= Wissenschaftliche Untersuchungen zum Neuen Testament 2. Reihe, 325). Tübingen 2012. [Nachweis im GVK]

  • Adrian J. Gibbs / George A. McIntyre: The Diagram, a Method for Comparing Sequences. Its Use with Amino Acid and Nucleotide Sequences. In: European Journal of Biochemistry 16 (1970), H. 1, S. 1–11. DOI: 10.1111/j.1432-1033.1970.tb01046.x

  • Ingeborg Glier: Hans Rosenplüt als Märendichter. In: Klaus Grubmüller / Leslie Peter Johnson / Hans-Hugo Steinhoff (Hg.): Kleinere Erzählformen im Mittelalter. Paderborner Colloquium 1987 (= Schriften der Universität-Gesamthochschule Paderborn / Reihe Sprach- und Literaturwissenschaft, 10). Paderborn u. a. 1988, S. 137–149. [Nachweis im GVK]

  • Ingeborg Glier: Rosenplüt, Hans. In: Kurt Ruh / Gundolf Keil / Werner Schröder / Burghart Wachinger / Franz Josef Worstbrock (Hg.): Die deutsche Literatur des Mittelalters. Verfasserlexikon. 14 Bde. 2. Auflage. Berlin u. a. 1978–2008. Bd. 8 (1992): ›Revaler Rechtsbuch‹ – Sittich, Erhard, Sp. 195–211. DOI: 10.1515/9783110889123

  • Klaus Graf: Wie alt ist die Priamel »Hette ich Venediger macht«? In: Frühneuzeit-Blog der RWTH. 20.07.2014. HTML. [online]

  • Sabine Griese: Gebrauchsformen und Gebrauchsräume von Einblattdrucken des 15. und frühen 16. Jahrhunderts. In: Volker Honemann / Sabine Griese / Falk Eisermann / Marcus Ostermann (Hg.): Einblattdrucke des 15. und frühen 16. Jahrhunderts. Probleme, Perspektiven, Fallstudien. Tübingen 2000, S. 179–208. DOI: 10.1515/9783110943382.179

  • Sabine Griese: Rosenplüt im Kontext. In: Seraina Plotke / Stefan Seeber (Hg.): Schwanksammlungen im frühneuzeitlichen Medienumbruch. Transformationen eines sequentiellen Erzählparadigmas (= Germanisch-Romanische Monatsschrift / Beihefte, 96). Heidelberg 2019, S. 61–90. DOI: 10.33675/2019-82537905

  • Thomas Habel: Vom Zeugniswert der Überlieferungsträger. Bemerkungen zum frühen Nürnberger Fastnachtspiel. In: Stephan Füssel / Gert Hübner / Joachim Knape (Hg.): Artibus. Kulturwissenschaft und Philologie des Mittelalters und der frühen Neuzeit. Festschrift für Dieter Wuttke zum 65. Geburtstag. Wiesbaden 1994, S. 103–134. [Nachweis im GVK]

  • Marco Heiles: Media Systems and Genre Conventions in Transition: A German Priamel Booklet from Nuremberg, c. 1490. In: Jörg Borgias Quenzer (Hg.): Exploring Written Artefacts. Objects, Methods, and Concepts (= Studies in Manuscript Cultures, 25). 2 Bde. Berlin u. a. 2021. Bd. 1, S. 307–331. DOI: 10.1515/9783110753301-016

  • Marco Heiles: Überlieferungsgeschichte als Graph. Zur Identifizierung und Darstellung von Überlieferungsnetzen handschriftlich tradierter Rezepte in Datenbanken. In: Zeitschrift für digitale Geisteswissenschaften 7 (2022). 28.01.2022. DOI: 10.17175/2022_001

  • Jonathan Helfman: Dotplot Patterns: A Literal Look at Pattern Languages. In: Theory and Practice of Object Systems 2 (1996), H. 1, S. 31–41. [Nachweis im GVK]

  • Nikolaus Henkel: Die Basler Sammelausgaben von Sebastian Brants Dichtungen. Genese und Programmatik der ›Carmina in laudem beatae Mariae virginis‹ (1494) und der ›Varia carmina‹ (1498). In: Johanna Thali / Nigel Fenton Palmer (Hg.): Raum und Medium. Literatur und Kultur in Basel in Spätmittelalter und Früher Neuzeit (= Kulturtopographie des alemannischen Raums, 9). Berlin u. a. 2020, S. 403–441. DOI: 10.1515/9783110532647-013

  • Armin Hoenen: History of Computer-Assisted Stemmatology. In: Philipp Roelli (Hg.): Handbook of Stemmatology. History, Methodology, Digital Approaches. Berlin u. a. 2020, S. 294–315. DOI: 10.1515/9783110684384-006

  • Werner Hoffmann: Dresden, Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden - Mscr.Dresd.M.50. Sammlung von Dichtungen des Hans Rosenplüt und seines Umkreises. In: Manuscripta Mediaevalia. 2013. HTML. [online]

  • Eva Horváth / Hans-Walter Stork (Hg.): Von Rittern, Bürgern und von Gottes Wort. Volkssprachige Literatur in Handschriften und Drucken aus dem Besitz der Staats- und Universitätsbibliothek Hamburg (= Schriften aus dem Antiquariat Dr. Jörn Günther, Hamburg, 2). (Ausstellung: Staats- und Universitätsbibliothek Hamburg, 26.09.–23.11.2002) Kiel 2002. PDF. [online]

  • Christopher J. Howe / Ruth Connolly / Heather F. Windram: Responding to Criticisms of Phylogenetic Methods in Stemmatology. In: Studies in English Literature 1500–1900 52 (2012), H. 1, S. 51–67. DOI: 10.1353/sel.2012.0008

  • Christopher J. Howe / Heather F. Windram: Phylomemetics. Evolutionary Analysis beyond the Gene. In: PLOS Biology 9 (2011), H. 5, S. 1–5. 31.05.2011. DOI: 10.1371/journal.pbio.1001069

  • Paul Jaccard: Lois de distribution florale dans la zone alpine. In: Bulletin de la Société Vaudoise des Sciences Naturelles 38 (1902), S. 69–130. DOI: 10.5169/seals-266762

  • Stefan Jänicke / Greta Franzini / Muhammad Faisal Cheema / Gerik Scheuermann: On Close and Distant Reading in Digital Humanities. A Survey and Future Challenges. In: Rita Borgo / Fabio Ganovelli / Ivan Viola (Hg.): Eurographics Conference on Visualization (EuroVis) 2015. State of the Art Reports. (Cagliari, 25.–29.05.2015). DOI: 10.2312/eurovisstar.20151113

  • Mohammed Kayed / Ahmed A. Elngar: NestMSA. A New Multiple Sequence Alignment Algorithm. In: The Journal of Supercomputing 76 (2020), S. 9168–9188. 19.02.2020. DOI: 10.1007/s11227-020-03206-0

  • Hansjürgen Kiepe: Die Nürnberger Priameldichtung. Untersuchungen zu Hans Rosenplüt und zum Schreib- und Druckwesen im 15. Jahrhundert (= Münchener Texte und Untersuchungen zur deutschen Literatur des Mittelalters, 74). München u. a. 1984. [Nachweis im GVK]

  • Christina Lechtermann / Markus Stock: Virtuelle Philologie. In: Dawid Kasprowicz / Stefan Rieger (Hg.): Handbuch Virtualität. Wiesbaden 2020, S. 425–454. [Nachweis im GVK]

  • Paul Maas: Textkritik. 3. Auflage. Leipzig 1957. [Nachweis im GVK]

  • Arend Mihm: Überlieferung und Verbreitung der Märendichtung im Spätmittelalter (= Germanische Bibliothek / 3. Reihe: Untersuchungen und Einzeldarstellungen). Heidelberg 1967. [Nachweis im GVK]

  • Saul Ben Needleman / Christian Dennis Wunsch: A General Method Applicable to the Search for Similarities in the Amino Acid Sequence of Two Proteins. In: Journal of Molecular Biology 48 (1970), H. 3, S. 443–453. DOI: 10.1016/0022-2836(70)90057-4

  • Rebekka Nöcker / Martina Schuler: Überlieferung, Edition, Interpretation. Zur Neuausgabe der Nürnberger Fastnachtspiele des 15. und beginnenden 16. Jahrhunderts. In: Klaus Ridder (Hg.): Fastnachstspiele. Weltliches Schauspiel in literarischen und kulturellen Kontexten. Tübingen 2009, S. 363–379. DOI: 10.1515/9783110230178.6.363

  • Parzival-Projekt (Hg.): Wolfram von Eschenbach: ›Parzival‹. Digitale Edition. Letzter Zugriff: 11.08.2023. HTML. [online]

  • Silvia Pfister: Sind Priameln ›Bildgedichte‹? Hinweis auf einen unbekannten Priamel-Einblattdruck. In: Zeitschrift für deutsches Altertum und deutsche Literatur 115 (1986), H. 3, S. 228–233. [online]

  • Bodo Plachta: Der ›edierte‹ Text: Grundpfeiler der Edition oder ›Zugeständnis‹ an den Leser? In: Roland S. Kamzelak / Timo Steyer (Hg.): Digitale Metamorphose: Digital Humanities und Editionswissenschaft (= Zeitschrift für digitale Geisteswissenschaften / Sonderbände, 2). Wolfenbüttel 2018. 15.03.2018. DOI: 10.17175/sb002_002

  • Norman Ira Platnick / Howard Don Cameron: Cladistic Methods in Textual, Linguistic, and Phylogenetic Analysis. In: Systematic Biology 26 (1977), H. 4, S. 380–385. DOI: 10.1093/sysbio/26.4.380

  • Jelena Prokić / Martijn Wieling / John Nerbonne: Multiple Sequence Alignments in Linguistics. In: Proceedings of the EACL 2009 Workshop on Language Technology and Resources for Cultural Heritage, Social Sciences, Humanities, and Education. (Athen, 30.03.2009) Stroudsburg, US-PA 2009, S. 18–25. PDF. [online]

  • R Core Team: R. A Language and Environment for Statistical Computing. Version 4.2.2 vom 31.10.2022. HTML. [online]

  • Ursula Rautenberg: Das Werk als Ware. Der Nürnberger Kleindrucker Hans Folz. In: Internationales Archiv für Sozialgeschichte der deutschen Literatur 24 (1999), H. 1, S. 1–40. DOI: 10.1515/iasl.1999.24.1.1

  • Ursula Rautenberg: Die Entstehung und Entwicklung des Buchtitelblatts in der Inkunabelzeit in Deutschland, den Niederlanden und Venedig. Quantitative und qualitative Studien. In: Archiv für Geschichte des Buchwesens 62 (2008), S. 1–105. [Nachweis im GVK]

  • Jörn Reichel: Der Spruchdichter Hans Rosenplüt. Literatur und Leben im spätmittelalterlichen Nürnberg. Stuttgart 1985. [Nachweis im GVK]

  • Klaus Ridder / Rebekka Nöcker / Beatrice von Lüpke (Hg.): Rosenplütsche Fastnachtspiele. Edition und Kommentar von Nürnberger Spieltexten des 15. Jahrhunderts (einschließlich der Fastnachtspiele in der Handschrift Dresden, SLUB, Mscr.Dresd.M.183). Berlin 2022. DOI: 10.31267/978-3-7574-0085-9

  • Philipp Roelli: Definition of Stemma and Archetype. In: Philipp Roelli (Hg.): Handbook of Stemmatology. History, Methodology, Digital Approaches. Berlin u. a. 2020, S. 209–225. DOI: 10.1515/9783110684384-005

  • Martin J. Schubert: Versuch einer Typologie von Schreibereingriffen. In: Das Mittelalter 7 (2002), H. 2, S. 125–144. DOI: 10.1524/mial.2002.7.2.125

  • Günther Schweikle: Minnesang (= Sammlung Metzler, 244). 2. Auflage. Stuttgart u. a. 1995. [Nachweis im GVK]

  • Carl Selmer / Curt Rudolf Goedsche: The Priamel Manuscript of the Newberry Library, Chicago. In: Publications of the Modern Language Association of America 53 (1938), H. 1, S. 64–77. DOI: 10.2307/458402

  • Gerd Simon: Die erste deutsche Fastnachtsspieltradition. Zur Überlieferung, Textkritik und Chronologie der Nürnberger Fastnachtsspiele des 15. Jahrhunderts (mit kurzen Einführungen in Verfahren der quantitativen Linguistik) (= Germanische Studien, 240). Lübeck u. a. 1970. [Nachweis im GVK]

  • Temple Ferris Smith / Michael Spencer Waterman: Identification of Common Molecular Subsequences. In: Journal of Molecular Biology 147 (1981), H. 1, S. 195–197. DOI: 10.1016/0022-2836(81)90087-5

  • Julie Dawn Thompson / Desmond Gerard Higgins / Toby James Gibson: CLUSTAL W: Improving the Sensitivity of Progressive Multiple Sequence Alignment through Sequence Weighting, Position-specific Gap Penalties and Weight Matrix Choice. In: Nucleic Acids Research 22 (1994), H. 22, S. 4673–4680. 11.11.1994. DOI: 10.1093/nar/22.22.4673

  • Gabriel Viehhauser: Philologie und Phylogenese. Interdisziplinäre Berührungspunkte zwischen Biologie und Germanistik. In: Alessandra Molinari (Hg.): Mittelalterphilologien heute. Eine Standortbestimmung. (Mittelalterphilologien heute / Medieval Philologies Today, Urbino, 02.–04.12.2013) Bd. 1: Die germanischen Philologien. Würzburg 2017, S. 245–264. [Nachweis im GVK]

  • Paul Vierthaler / Mees Gelein: A BLAST-based, Language-agnostic Text Reuse Algorithm with a MARKUS Implementation and Sequence Alignment Optimized for Large Chinese Corpora. In: Journal of Cultural Analytics 4 (2019), H. 2. 23.03.2019. DOI: 10.22148/16.034

  • Burghart Wachinger: Kleinstformen der Literatur. Sprachgestalt – Gebrauch – Literaturgeschichte. In: Walter Haug / Burghart Wachinger (Hg.): Kleinstformen der Literatur (= Fortuna Vitrea, 14). Tübingen 1994, S. 1–37. [Nachweis im GVK]

  • Burghart Wachinger: Einleitung. In: Christoph Huber / Burghart Wachinger / Hans-Joachim Ziegeler (Hg.): Geistliches in weltlicher und Weltliches in geistlicher Literatur des Mittelalters. Tübingen 2000, S. 1–15. [Nachweis im GVK]

  • Thomas Weitin: Digitale Literaturwissenschaft. In: Deutsche Vierteljahresschrift für Geistesgeschichte und Literaturwissenschaft 89 (2015), H. 4, S. 651–656. [Nachweis im GVK]

  • Thomas Weitin: Digitale Literaturgeschichte. Eine Versuchsreihe mit sieben Experimenten (= Digitale Literaturwissenschaft). Berlin 2021. DOI: 10.1007/978-3-662-63663-3

  • Werner Williams-Krapp: Die Literatur des 15. und frühen 16. Jahrhunderts (= Geschichte der deutschen Literatur von den Anfängen bis zum Beginn der Neuzeit III: Vom späten Mittelalter zum Beginn der Neuzeit, 2). Teilband 1: Modelle literarischer Interessenbildung. Berlin u. a. 2020. DOI: 10.1515/9783110703375

  • Jürgen Wolf: Von geschriebenen Drucken und gedruckten Handschriften. Irritierende Beobachtungen zur zeitgenössischen Wahrnehmung des Buchdrucks in der 2. Hälfte des 15. und des beginnenden 16. Jahrhunderts. In: Andreas Gardt / Mireille Schnyder / Jürgen Wolf (Hg.): Buchkultur und Wissensvermittlung in Mittelalter und Früher Neuzeit. Berlin u. a. 2011, S. 3–21. DOI: 10.1515/9783110268799.3

  • Jürgen Wolf: Alles in Einem. Sammeln als literarische Praxis im Mittelalter und in der Frühen Neuzeit. Werk – Handschrift – Sammlung – Bibliothek. In: Mark Chinca / Manfred Eikelmann / Michael Stolz / Christopher Young (Hg.): Sammeln als literarische Praxis im Mittelalter und in der Frühen Neuzeit. Konzepte, Praktiken, Poetizität. (XXVI. Anglo-German Colloquium, Ascona, 26.–30.08.2019) Tübingen 2022, S. 121–139. [Nachweis im GVK]

  • Tariq Yousef / Stefan Jänicke: A Survey of Text Alignment Visualization. In: IEEE Transactions on Visualization and Computer Graphics 27 (2021), H. 2, S. 1149–1159. DOI: 10.1109/TVCG.2020.3028975



    Abbildungs- und Tabellenverzeichnis

  • Abb. 1: Ein Ausschnitt der Priamelsequenzen in unterschiedlichen Sammlungen. [Grafik: Frank Buschmann 2023]
  • Abb. 2: Ein Ausschnitt der Dotplots für den Vergleich unterschiedlicher Sammlungen in der Anordnung als übergreifende Matrix. [Grafik: Frank Buschmann 2023]
  • Abb. 3: Ein Ausschnitt der Dotplots für die Priamelüberlieferung mit Markierungen. [Grafik: Frank Buschmann 2023]
  • Abb. 4: Verschiedene schematische Darstellungen zu typischen Möglichkeiten, wie Vergleichs-Dotplots angeordnet sein können. [Grafik: Frank Buschmann 2023]
  • Tab. 1: Ein Tabellenausschnitt der mit dem Smith-Waterman-Algorithmus erzeugten Daten.
  • Abb. 5: Ein Ausschnitt der Dotplots für die Priamelüberlieferung mit Markierungen. [Grafik: Frank Buschmann 2023]
  • Abb. 6: Ein Ausschnitt der Dotplots für die Priamelüberlieferung mit Hervorhebung und Beschriftung der Priamel-Zyklen. [Grafik: Frank Buschmann 2023]
  • Abb. 7: Ausschnitte der Dotplots für den Vergleich von Zyklus I. [Grafik: Frank Buschmann 2023]
  • Abb. 8: Ausschnitte der Dotplots für den Vergleich von Zyklus IV. [Grafik: Frank Buschmann 2023]
  • Abb. 9: Ein Ausschnitt der Dotplots für die Priamelüberlieferung mit Hervorhebung und Beschriftung der Priamel-Zyklen sowie Feldern, die geistliche Priamel ausweisen. [Grafik: Frank Buschmann 2023]
  • Tab. 2: Ein durch den Smith-Waterman-Algorithmus erzeugter Datensatz, geordnet nach similarity-Wert.
  • Abb. 10: Der Vergleichs-Dotplot für die Sammlungen S4 und F1. [Grafik: Frank Buschmann 2023]
  • Tab. 3: Der durch den Smith-Waterman-Algorithmus erzeugte Datensatz für den Zyklus I bei einem Vergleich aller diesen tradierenden Sammlungen mit F1, geordnet nach similarity-Wert.
  • Tab. 4: Alignment für den Vergleich von F1 und B3 mit Angabe der Matches und Gaps.
  • Tab. 5: Alignment für den Vergleich von F1 und D3 mit Angabe der Matches und Gaps.
  • Tab. 6: Alignment für den Vergleich von F1 und R1 mit Angabe der Matches und Gaps.
  • Abb. 11: Oben der durch den Smith-Waterman-Algorithmus erzeugte Datensatz für den Zyklus I bei einem Vergleich aller diesen tradierenden Sammlungen mit F1, darunter die zugehörigen Dotplots. [Grafik: Frank Buschmann 2023]