Versionen vergleichen von : Automatisiertes Record Linkage in prosopographischen Datenbeständen am Beispiel historischer Quellen Leipzigs
Alt | Neu | ||
---|---|---|---|
1 | Automatisiertes Record Linkage in prosopographischen Datenbeständen am Beispiel historischer Quellen Leipzigs | 1 | Automatisiertes Record Linkage in prosopographischen Datenbeständen am Beispiel historischer Quellen Leipzigs |
2 | <body> | 2 | <div id="caption"><span class="Z3988" title="url_ver=Z39.88-2004&ctx_ver=Z39.88-2004&rfr_id=info%3Asid%2Fzotero.org%3A2&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Abook&rft.genre=article&rft.atitle=Automatisiertes%20Record%20Linkage%20in%20prosopographischen
%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20Datenbeständen%20am%20Beispiel%20historischer%20Quellen%20Leipzigs&rft.au=Jan Michael%20Goldberg&rft.au=Marcel%20Mernitz&rft.series=Zeitschrift%20f%C3%BCr%20digitale%20Geisteswissenschaften&rft.date=2023-01-26&rft_id=https://doi.org/10.17175/2023_001&rft.language=de&rft.rights=CC BY-SA 4.0"></span><div> |
3 | <div id="caption"><span class="Z3988" title="url_ver=Z39.88-2004&ctx_ver=Z39.88-2004&rfr_id=info%3Asid%2Fzotero.org%3A2&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Abook&rft.genre=article&rft.atitle=Automatisiertes%20Record%20Linkage%20in%20prosopographischen
%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20Datenbeständen%20am%20Beispiel%20historischer%20Quellen%20Leipzigs&rft.au=Jan Michael%20Goldberg&rft.au=Marcel%20Mernitz&rft.series=Zeitschrift%20f%C3%BCr%20digitale%20Geisteswissenschaften&rft.date=2023-01-26 2023-09-29&rft_id=https://doi.org/10.17175/2023_001&rft.language=de&rft.rights=CC BY-SA 4.0"></span><div> | 3 | <div style="margin: 1em 0 1em 0;">Jan Michael Goldberg <a href="javascript:switchlayer('author1');"><img style="margin-left: 1%" src="/sites/default/files/arrow-down.png" alt="Autoreninformationen"></a></div> |
4 | <div style="margin: 1em 0 1em 0;">Jan Michael Goldberg <a href="javascript:switchlayer('author1');"><img style="margin-left: 1%" src="/sites/default/files/arrow-down.png" alt="Autor*inneninformationen"></a></div> | ||
5 | <div style="display:none; width:100%; background-color: #fafafa;" id="author1"> Kontakt: <a href="mailto:jan.goldberg@wiwi.uni-halle.de">jan.goldberg@wiwi.uni-halle.de</a><br>Institution: Martin-Luther-Universität Halle Wittenberg, Lehrstuhl für empirische Makroökonomik <br>GND: <a href=" http://d-nb.info/gnd/1240406630" target="_blank:">1240406630</a><br>ORCID: <a href="https://orcid.org/0000-0002-4817-4283" target="_blank:">0000-0002-4817-4283</a><br></div> | 4 | <div style="display:none; width:100%; background-color: #fafafa;" id="author1"> Kontakt: <a href="mailto:jan.goldberg@wiwi.uni-halle.de">jan.goldberg@wiwi.uni-halle.de</a><br>Institution: Martin-Luther-Universität Halle Wittenberg, Lehrstuhl für empirische Makroökonomik <br>GND: <a href=" http://d-nb.info/gnd/1240406630" target="_blank:">1240406630</a><br>ORCID: <a href="https://orcid.org/0000-0002-4817-4283" target="_blank:">0000-0002-4817-4283</a><br></div> |
6 | <div style="margin: 1em 0 1em 0;">Marcel Mernitz <a href="javascript:switchlayer('author2');"><img style="margin-left: 1%" src="/sites/default/files/arrow-down.png" alt=" | 5 | <div style="margin: 1em 0 1em 0;">Marcel Mernitz <a href="javascript:switchlayer('author2');"><img style="margin-left: 1%" src="/sites/default/files/arrow-down.png" alt="Autoreninformationen"></a></div> |
7 | <div style="display:none; width:100%; background-color: #fafafa;" id="author2"> Kontakt: <a href="mailto:marcel.mernitz@informatik.uni-halle.de">marcel.mernitz@informatik.uni-halle.de</a><br>Institution: Martin-Luther-Universität Halle Wittenberg, Institut für Informatik <br>GND: <a href=" http://d-nb.info/gnd/1275436560" target="_blank:">1275436560</a><br>ORCID: <a href="https://orcid.org/0000-0001-6464-2844" target="_blank:">0000-0001-6464-2844</a><br></div> | 6 | <div style="display:none; width:100%; background-color: #fafafa;" id="author2"> Kontakt: <a href="mailto:marcel.mernitz@informatik.uni-halle.de">marcel.mernitz@informatik.uni-halle.de</a><br>Institution: Martin-Luther-Universität Halle Wittenberg, Institut für Informatik <br>GND: <a href=" http://d-nb.info/gnd/1275436560" target="_blank:">1275436560</a><br>ORCID: <a href="https://orcid.org/0000-0001-6464-2844" target="_blank:">0000-0001-6464-2844</a><br></div> |
10 | <hr class="one"> | 9 | <hr class="one"> |
11 | <p><span class="bolder">DOI: </span><a href="https://doi.org/10.17175/2023_001 | 10 | <p><span class="bolder">DOI: </span><a href="https://doi.org/10.17175/2023_001">10.17175/2023_001</a></p> |
12 | <p><span class="bolder">Nachweis im OPAC der Herzog August Bibliothek: </span><a href="http://opac.lbs-braunschweig.gbv.de/DB=2/XMLPRS=N/PPN?PPN= | 11 | <p><span class="bolder">Nachweis im OPAC der Herzog August Bibliothek: </span><a href="http://opac.lbs-braunschweig.gbv.de/DB=2/XMLPRS=N/PPN?PPN=1819370283" target="_blank">1819370283</a></p> |
13 | <p><span class="bolder">Erstveröffentlichung: </span>26.01.2023</p> | 12 | <p><span class="bolder">Erstveröffentlichung: </span>26.01.2023</p> |
14 | <p><span class="bolder">Version 2.0: </span>29.09.2023</p> | ||
15 | <p><span class="bolder">Lizenz:</span> Sofern nicht anders angegeben <a href="http://creativecommons.org/licenses/by-sa/4.0/" rel="license" target="_blank"><img alt="Creative Commons Lizenzvertrag" src="https://licensebuttons.net/l/by-sa/4.0/80x15.png"><br></a></p> | 13 | <p><span class="bolder">Lizenz:</span> Sofern nicht anders angegeben <a href="http://creativecommons.org/licenses/by-sa/4.0/" rel="license" target="_blank"><img alt="Creative Commons Lizenzvertrag" src="https://licensebuttons.net/l/by-sa/4.0/80x15.png"><br></a></p> |
18 | <p><span class="bolder">Medienlizenzen: </span>Medienrechte liegen bei den Autor*innen</p> | 16 | <p><span class="bolder">Medienlizenzen: </span>Medienrechte liegen bei den Autor*innen</p> |
19 | <p><span class="bolder">Letzte Überprüfung aller Verweise: </span> | 17 | <p><span class="bolder">Letzte Überprüfung aller Verweise: </span>12.01.2023</p> |
20 | <p><span class="bolder">GND-Verschlagwortung: </span><a href="http://d-nb.info/gnd/1263539092" target="_blank">Duplikaterkennung</a> | <a href="http://d-nb.info/gnd/4788710-2" target="_blank">Datenverknüpfung</a> | <a href="http://d-nb.info/gnd/4173908-5" target="_blank">Personenbezogene Daten</a> | <a href="http://d-nb.info/gnd/4001183-5" target="_blank">Algorithmus</a> | <a href="http://d-nb.info/gnd/4020097- | 18 | <p><span class="bolder">GND-Verschlagwortung: </span><a href="http://d-nb.info/gnd/1263539092" target="_blank">Duplikaterkennung</a> | <a href="http://d-nb.info/gnd/4788710-2" target="_blank">Datenverknüpfung</a> | <a href="http://d-nb.info/gnd/4173908-5" target="_blank">Personenbezogene Daten</a> | <a href="http://d-nb.info/gnd/4001183-5" target="_blank">Algorithmus</a> | <a href="http://d-nb.info/gnd/4020097-" target="_blank">Genealogie</a> | <a href="http://d-nb.info/gnd/4020535-6" target="_blank">Geschichtswissenschaft</a> | </p> |
21 | <p><span class="bolder">Empfohlene Zitierweise: </span>Jan Michael Goldberg | 19 | <p><span class="bolder">Empfohlene Zitierweise: </span>Jan Michael Goldberg, Marcel Mernitz: Automatisiertes Record Linkage in prosopographischen |
22 | Datenbeständen am Beispiel historischer Quellen Leipzigs. In: Zeitschrift für digitale Geisteswissenschaften 8 (2023). | 20 | Datenbeständen am Beispiel historischer Quellen Leipzigs. In: Zeitschrift für digitale Geisteswissenschaften 8 (2023). HTML / XML / PDF. DOI: <a href="https://doi.org/10.17175/2023_001">10.17175/2023_001</a></p> |
23 | <hr class="one"> | 21 | <hr class="one"> |
26 | <div class="content"><a name="div2"> </a><div id="abstract"> | 24 | <div class="content"><a name="div2"> </a><div id="abstract"> |
25 | <div id="abstract_de" class="abstract"> | ||
27 | <h1>Abstract</h1> | 26 | <h1>Abstract</h1> |
28 | <div id="abstract_de" class="abstract"> | 27 | <p>In dieser Studie wird ein automatisierter Ansatz zum <span style="color:#035151"><i>Record Linkage</i></span> in |
29 | <p>In dieser Studie wird ein automatisierter Ansatz zum <span style="color:#035151" id=""><i>Record Linkage</i></span> in | ||
30 | prosopographischen Datenbeständen vorgestellt. In ihm sind zahlreiche | 28 | prosopographischen Datenbeständen vorgestellt. In ihm sind zahlreiche |
43 | <div id="abstract_en" class="abstract"> | 41 | <div id="abstract_en" class="abstract"> |
44 | <p>In this study, an automated approach to <span style="color:#035151" | 42 | <p>In this study, an automated approach to <span style="color:#035151"><i>record linkage</i></span> in prosopographic |
45 | datasets is presented. It implements numerous genealogical rules for linking | 43 | datasets is presented. It implements numerous genealogical rules for linking |
55 | </div> | 53 | </div> |
56 | </div> | ||
57 | <hr class="one"> | 54 | <hr class="one"> |
58 | <div id="versionsbox"> | ||
59 | <h3>Version 2.0 (29.09.2023)</h3> | ||
60 | <p>Inhaltliche Ergänzungen an mehreren Stellen gemäß Gutachten.</p> | ||
61 | </div> | ||
62 | <div id="headings"><br><br><hr class="two"><br><ul> | 55 | <div id="headings"><br><br><hr class="two"><br><ul> |
85 | <li><a href="#hd23">Bibliografische Angaben</a></li> | 78 | <li><a href="#hd23">Bibliografische Angaben</a></li> |
86 | <li><a href=" | 79 | <li><a href="#hd24">Abbildungs- und Tabellenverzeichnis</a></li> |
87 | </ul> | 80 | </ul> |
88 | </div><a name="div3"> </a><div id="chapter"><a name="hd1"> </a><h2> | 81 | </div><br></div><a name="div3"> </a><div id="chapter"><a name="hd1"> </a><h2> |
89 | <div style="position:relative;width:90%;">1. Einleitung</div> | 82 | <div style="position:relative;width:90%;">1. Einleitung</div> |
95 | Datenmengen sorgen zudem zunehmend dafür, dass eine manuelle Bearbeitung erschwert | 88 | Datenmengen sorgen zudem zunehmend dafür, dass eine manuelle Bearbeitung erschwert |
96 | wird. Dadurch besteht ein Bedarf an automatisierten <span style="color:#035151" | 89 | wird. Dadurch besteht ein Bedarf an automatisierten <span style="color:#035151"><i>Record-Linkage</i></span>-Lösungen. Neben den klassischen wissenschaftlichen |
97 | Anwendungen betrifft das unter anderem auch Projekte wie <span style="color:#035151 | 90 | Anwendungen betrifft das unter anderem auch Projekte wie <span style="color:#035151"><i>Time-Machine</i></span>-Anwendungen.<a id="fna1" class="fn" href="#fn1" title="Time Machines sind Konstrukte, in denen historische Daten verschiedenster Quellen zusammengeführt werden. Dadurch werden beispielsweise individuelle Biografien, politisch-städtische Dynamiken und die Veränderung der Bausubstanz verknüpft auf einer Plattform sichtbar. Diese werden öffentlich zur Verfügung gestellt und können zur Forschung und Bildung genutzt werden. Vgl. Kaplan 2015, S. 73.">[1]</a> Im deutschen Sprachraum sind |
98 | derzeit beispielsweise die Projekte in Leipzig, Jena und Köln zu nennen.<a id="fna2" class="fn" href="#fn2" title="Vgl. Time Machine Organisation 2022.">[2]</a> Perspektivisch ist denkbar, dass in vielen deutschsprachigen Städten solche Time | 91 | derzeit beispielsweise die Projekte in Leipzig, Jena und Köln zu nennen.<a id="fna2" class="fn" href="#fn2" title="Vgl. Time Machine Organisation 2022.">[2]</a> Perspektivisch ist denkbar, dass in vielen deutschsprachigen Städten solche Time |
109 | heranzuziehende Bevölkerung, zur Wahlrechtverteilung oder zur Erhebung von | 102 | heranzuziehende Bevölkerung, zur Wahlrechtverteilung oder zur Erhebung von |
110 | Steuern.<a id="fna3" class="fn" href="#fn3" title="Vgl. Hin | 103 | Steuern.<a id="fna3" class="fn" href="#fn3" title="Vgl. Hin et al. 2016, S. 50.">[3]</a> Die meisten |
111 | historischen Informationen über Individuen der Neuzeit befinden sich in | 104 | historischen Informationen über Individuen der Neuzeit befinden sich in |
117 | vor Fehlern oder Verlust. Daraus ergibt sich eine enorme Ungenauigkeit ebendieser | 110 | vor Fehlern oder Verlust. Daraus ergibt sich eine enorme Ungenauigkeit ebendieser |
118 | Daten.<a id="fna4" class="fn" href="#fn4" title="Vgl. Feigenbaum 2016; Hin | 111 | Daten.<a id="fna4" class="fn" href="#fn4" title="Vgl. Feigenbaum 2016; Hin et al. 2016, S. 50, 52; Massey 2017, S. 129, 131.">[4]</a> Zudem sind große Datenbestände unübersichtlich |
119 | oder gar nicht überschaubar. Das zeigt sich beispielsweise, wenn Personen in einem | 112 | oder gar nicht überschaubar. Das zeigt sich beispielsweise, wenn Personen in einem |
120 | Zensus händisch im darauffolgenden Zensus anhand der Angaben zur Stadt oder Gegend | 113 | Zensus händisch im darauffolgenden Zensus anhand der Angaben zur Stadt oder Gegend |
121 | beziehungsweise zum Land gesucht werden.<a id="fna5" class="fn" href="#fn5" title="Vgl. Massey 2017, S. | 114 | beziehungsweise zum Land gesucht werden.<a id="fna5" class="fn" href="#fn5" title="Vgl. Massey 2017, S. 130.">[5]</a> Problematisch an diesem Ansatz ist, dass verzogene Menschen in |
122 | dem folgenden Zensus aufgrund des Ortswechsels nicht gefunden werden. Die | 115 | dem folgenden Zensus aufgrund des Ortswechsels nicht gefunden werden. Die |
142 | historischen Leipziger Quellen unterzieht. Abschließend wird das Ergebnis | 135 | historischen Leipziger Quellen unterzieht. Abschließend wird das Ergebnis |
143 | zusammengefasst. Der Algorithmus selbst wird in der Programmiersprache Python 3. | 136 | zusammengefasst. Der Algorithmus selbst wird in der Programmiersprache Python 3.6 |
144 | umgesetzt und ist im <a href="https://git.hab.de/forschungsdaten/zeitschrift-fuer-digitale-geisteswissenschaften/goldberg-record" target="_blank">Online-Repositorium</a> zu finden.</p> | 137 | umgesetzt und ist im <a href="https://git.hab.de/forschungsdaten/zeitschrift-fuer-digitale-geisteswissenschaften/goldberg-record" target="_blank">Online-Repositorium</a> zu finden.</p> |
154 | werden können. Diese Darstellung fokussiert sich explizit | 147 | werden können. Diese Darstellung fokussiert sich explizit |
155 | auf den Stand der Forschung bei der Anwendung auf historische Daten.<a id="fna8" class="fn" href="#fn8" title="Als Einführung in die Grundlagen des Themas vgl. Gu | 148 | auf den Stand der Forschung bei der Anwendung auf historische Daten.<a id="fna8" class="fn" href="#fn8" title="Als Einführung in die Grundlagen des Themas vgl. Gu et al. 2003.">[8]</a> Zweck ist es, einen Überblick über verschiedene Verfahren und |
156 | Ideen zu geben, ohne dabei jedoch einen Anspruch auf Vollständigkeit zu | 149 | Ideen zu geben, ohne dabei jedoch einen Anspruch auf Vollständigkeit zu |
157 | erheben. Das Record Linkage historischer Daten hat sich in den vergangenen | 150 | erheben. Das Record Linkage historischer Daten hat sich in den vergangenen |
158 | Jahrzehnten stetig verändert, wie beispielsweise Massey aufzeigt.<a id="fna9" class="fn" href="#fn9" title="Sie selbst prüft verschiedene Record-Linkage-Verfahren und kommt beispielsweise zu dem Schluss, dass Ergebnisse besser werden, wenn die Altersangaben zwischen zwei zeitlich auseinanderliegenden Quellen in Bezug auf die zeitliche Differenz zwischen diesen umgerechnet werden. Die besten Resultate erzielt sie mit probabilistischen Matching-Techniken. Vgl. Massey 2017, S. | 151 | Jahrzehnten stetig verändert, wie beispielsweise Massey aufzeigt.<a id="fna9" class="fn" href="#fn9" title="Sie selbst prüft verschiedene Record-Linkage-Verfahren und kommt beispielsweise zu dem Schluss, dass Ergebnisse besser werden, wenn die Altersangaben zwischen zwei zeitlich auseinanderliegenden Quellen in Bezug auf die zeitliche Differenz zwischen diesen umgerechnet werden. Die besten Resultate erzielt sie mit probabilistischen Matching-Techniken. Vgl. Massey 2017, S. 129, 140.">[9]</a> Übergreifend werden von Gellatly als wesentliche |
159 | Herausforderungen zum einen die Skalierbarkeit auf große Datenbestände, zum | 152 | Herausforderungen zum einen die Skalierbarkeit auf große Datenbestände, zum |
160 | anderen die Genauigkeit und Effizienz der Algorithmen identifiziert.<a id="fna10" class="fn" href="#fn10" title="Vgl. Gellatly 2015, S. | 153 | anderen die Genauigkeit und Effizienz der Algorithmen identifiziert.<a id="fna10" class="fn" href="#fn10" title="Vgl. Gellatly 2015, S. 114, 122.">[10]</a> Als dritte große |
161 | Herausforderung werden Datenschutzaspekte genannt.<a id="fna11" class="fn" href="#fn11" title="Vgl. Christen | 154 | Herausforderung werden Datenschutzaspekte genannt.<a id="fna11" class="fn" href="#fn11" title="Vgl. Christen et al. 2015, S. 87.">[11]</a> Der Datenschutzaspekt wird im Weiteren |
162 | vernachlässigt, da der Algorithmus auf Daten ausgelegt werden soll, die | 155 | vernachlässigt, da der Algorithmus auf Daten ausgelegt werden soll, die |
165 | Herausforderungen auf, beispielsweise in der Standardisierung von | 158 | Herausforderungen auf, beispielsweise in der Standardisierung von |
166 | Namensschreibweisen oder der generellen Datenerfassung.<a id="fna12" class="fn" href="#fn12" title="Vgl. Georgala | 159 | Namensschreibweisen oder der generellen Datenerfassung.<a id="fna12" class="fn" href="#fn12" title="Vgl. Georgala et al. 2015, S. 173.">[12]</a></p> |
167 | <p id="pid6"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid6">6</a>]</span>Zum Record Linkage können verschiedenste Variablen herangezogen werden. | 160 | <p id="pid6"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid6">6</a>]</span>Zum Record Linkage können verschiedenste Variablen herangezogen werden. |
168 | Grundlegend dabei ist, dass | 161 | Grundlegend dabei ist, dass Variablen / Attribute zur Verfügung stehen, die |
169 | einen identischen Schlüssel aufweisen.<a id="fna13" class="fn" href="#fn13" title="Vgl. Baxter | 162 | einen identischen Schlüssel aufweisen.<a id="fna13" class="fn" href="#fn13" title="Vgl. Baxter et al. 2003, S. 2.">[13]</a> Dies kann beispielsweise der Name, das Geburtsdatum |
170 | oder die Sozialversicherungsnummer sein. Auch können Graphen genutzt werden, um | 163 | oder die Sozialversicherungsnummer sein. Auch können Graphen genutzt werden, um |
171 | die Ähnlichkeit der Records untereinander darzustellen.<a id="fna14" class="fn" href="#fn14" title="Die Qualität der Verknüpfungen wird dabei besser, wenn man zeitliche Restriktionen einbeziehe, beispielsweise des möglichen Schwangerschaftszeitraums der Frau. Vgl. Nanayakkara | 164 | die Ähnlichkeit der Records untereinander darzustellen.<a id="fna14" class="fn" href="#fn14" title="Die Qualität der Verknüpfungen wird dabei besser, wenn man zeitliche Restriktionen einbeziehe, beispielsweise des möglichen Schwangerschaftszeitraums der Frau. Vgl. Nanayakkara et al. 2018.">[14]</a> Um die Daten zu vergleichen, ist eine vorhergehende |
172 | Bereinigung notwendig.<a id="fna15" class="fn" href="#fn15" title="Vgl. Gellatly 2015, S. | 165 | Bereinigung notwendig.<a id="fna15" class="fn" href="#fn15" title="Vgl. Gellatly 2015, S. 116.">[15]</a></p> |
173 | <p id="pid7"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid7">7</a>]</span>Gellatly testet einen Ansatz, bei dem er verschiedene Variablen kombiniert und | 166 | <p id="pid7"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid7">7</a>]</span>Gellatly testet einen Ansatz, bei dem er verschiedene Variablen kombiniert und |
177 | Brüdern und Schwestern zusammensetzt, und den ersten drei Buchstaben des | 170 | Brüdern und Schwestern zusammensetzt, und den ersten drei Buchstaben des |
178 | Vornamens.<a id="fna16" class="fn" href="#fn16" title="Vgl. Gellatly 2015, S. | 171 | Vornamens.<a id="fna16" class="fn" href="#fn16" title="Vgl. Gellatly 2015, S. 122f.">[16]</a></p> |
179 | <p id="pid8"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid8">8</a>]</span>Efremova | 172 | <p id="pid8"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid8">8</a>]</span>Efremova et al. nutzen dahingegen ein ›disjunctive blocking‹.<a id="fna17" class="fn" href="#fn17" title="Vgl. Efremova et al. 2015.">[17]</a> Darin werden die ersten |
180 | Buchstaben eines Namens einer phonetischen Analyse unterzogen. Nur, wenn diese | 173 | Buchstaben eines Namens einer phonetischen Analyse unterzogen. Nur, wenn diese |
185 | Distanz.</p> | 178 | Distanz.</p> |
186 | <p id="pid9"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid9">9</a>]</span>Statt einer binären Verknüpfung ( | 179 | <p id="pid9"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid9">9</a>]</span>Statt einer binären Verknüpfung (Zuordnung / keine Zuordnung) gibt es auch |
187 | Systeme, die Abstufungen verwenden. Sichere Verknüpfungen werden darin anders | 180 | Systeme, die Abstufungen verwenden. Sichere Verknüpfungen werden darin anders |
188 | bewertet als unsichere.<a id="fna18" class="fn" href="#fn18" title="Vgl. Thorvaldsen | 181 | bewertet als unsichere.<a id="fna18" class="fn" href="#fn18" title="Vgl. Thorvaldsen et al. 2015, S. 163f.">[18]</a> Thorvaldsens automatisierte Anwendung auf norwegische Daten |
189 | nimmt viele Verknüpfungen aufgrund von Ungewissheit nicht automatisch vor und | 182 | nimmt viele Verknüpfungen aufgrund von Ungewissheit nicht automatisch vor und |
190 | lässt einen beträchtlichen Spielraum für die (nachfolgende) manuelle | 183 | lässt einen beträchtlichen Spielraum für die (nachfolgende) manuelle |
191 | Verknüpfung.<a id="fna19" class="fn" href="#fn19" title="Vgl. Thorvaldsen | 184 | Verknüpfung.<a id="fna19" class="fn" href="#fn19" title="Vgl. Thorvaldsen et al. 2015, S. 168.">[19]</a></p> |
192 | <p id="pid10"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid10">10</a>]</span>Anhand englischer Daten zeigen Georgala | 185 | <p id="pid10"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid10">10</a>]</span>Anhand englischer Daten zeigen Georgala et al., dass String-Metriken wie die |
193 | Levenshtein- oder Jaro-Winkler-Distanz besser als phonetische | 186 | Levenshtein- oder Jaro-Winkler-Distanz besser als phonetische |
194 | Ähnlichkeitsanalysen funktionieren, diese jedoch wiederum deutlich bessere | 187 | Ähnlichkeitsanalysen funktionieren, diese jedoch wiederum deutlich bessere |
195 | Ergebnisse aufweisen als eine absolute Gleichheit der Namen.<a id="fna20" class="fn" href="#fn20" title="Vgl. Georgala | 188 | Ergebnisse aufweisen als eine absolute Gleichheit der Namen.<a id="fna20" class="fn" href="#fn20" title="Vgl. Georgala et al. 2015, S. 187.">[20]</a></p> |
196 | <p id="pid11"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid11">11</a>]</span>Zur Unterstützung des Record Linkage existieren verschiedene Programme. In | 189 | <p id="pid11"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid11">11</a>]</span>Zur Unterstützung des Record Linkage existieren verschiedene Programme. In |
197 | diese | 190 | diese soll hier nicht im Detail eingeführt werden. Beispielhaft genannt wird |
198 | | 191 | eine Lösung, die explizit auf das Record Linkage von genealogischen |
199 | GEDCOM-Dateien (GEnealogical Data COMmunication, siehe unten) ausgelegt ist: <i>GedTool</i>.<a id="fna21" class="fn" href="#fn21" title="Vgl. Schulz 2017.">[21]</a> Zur | 192 | GEDCOM-Dateien (GEnealogical Data COMmunication, siehe unten) ausgelegt ist: <i>GedTool</i>.<a id="fna21" class="fn" href="#fn21" title="Vgl. Schulz 2017.">[21]</a> Zur Verschmelzung |
200 | Kriterien wie der Vorname, der Nachname | 193 | von Personen können darin bis zu acht Kriterien wie der Vorname, der Nachname |
201 | oder eine ID bestimmt werden | 194 | oder eine ID bestimmt werden, die übereinstimmen müssen, damit Personen |
202 | | 195 | verschmolzen werden können. Die Einträge, auf die die Kriterien zutreffen, |
203 | werden gemeinsam angezeigt und können nachfolgend manuell zusammengeführt | 196 | werden gemeinsam angezeigt und können dann nachfolgend manuell zusammengeführt |
204 | werden. Eine phonetische Suche mit den Algorithmen Soundex, Kölner | 197 | werden. Eine phonetische Suche mit den Algorithmen Soundex, Kölner |
205 | Phonetik und Double Metaphone kann ebenfalls ausgeführt werden.<a id="fna22" class="fn" href="#fn22" title="Die Programmierung dieser Funktionen ist jedoch nicht nachvollziehbar, da es sich um ein kommerzielles Produkt handelt und der Code des Programms (es handelt sich um Excel-Makros) nicht einsehbar ist.">[22]</a> Hierbei handelt es | 198 | Phonetik und Double Metaphone kann ebenfalls ausgeführt werden.<a id="fna22" class="fn" href="#fn22" title="Die Programmierung dieser Funktionen ist jedoch nicht nachvollziehbar, da es sich um ein kommerzielles Produkt handelt und der Code des Programms (es handelt sich um Excel-Makros) nicht einsehbar ist.">[22]</a> Hierbei handelt es |
206 | sich demnach um eine semi-automatisierte Lösung.</p> | 199 | sich also um eine semi-automatisierte Lösung.</p> |
207 | <p id="pid12"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid12">12</a>]</span>Ein weiteres Record-Linkage-Programm stellt <i>Demolink</i> dar. Eli Fure evaluiert dieses anhand norwegischer Daten. Sie kommt zu dem | 200 | <p id="pid12"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid12">12</a>]</span>Ein weiteres Record-Linkage-Programm stellt <i>Demolink</i> dar. Fure evaluiert dieses anhand norwegischer Daten und kommt zu dem |
208 | Schluss, dass für die Anwendung eine Vorstellung über den historischen Kontext einer | 201 | Schluss, dass eine Vorstellung über den historischen Kontext einer Quelle |
209 | Quelle | 202 | notwendig ist, um – im Vergleich mit einer automatisierten Lösung – gute |
210 | notwendig ist, um bessere Ergebnisse als eine automatisierte Lösung zu erzielen. Damit | 203 | Ergebnisse zu erzielen. Damit meint sie, dass die Forschenden z. B. Wissen |
211 | meint sie, dass die Forschenden u. a. Wissen | ||
212 | darüber haben müssen, welche Namen im untersuchten Gebiet gleich sind, ohne | 204 | darüber haben müssen, welche Namen im untersuchten Gebiet gleich sind, ohne |
213 | dass ein Algorithmus sie zuordnen kann. Hierzu seien | 205 | dass ein Algorithmus sie zuordnen kann. Ein Beispiel dafür ist, dass die Namen |
214 | menschliche Eigenschaften notwendig.<a id="fna23" class="fn" href="#fn23" title="Vgl. Fure 2000.">[23]</a> Ein Beispiel dafür sind die Namen | 206 | Goldberg und Goldbrich in Nordböhmen und der südlichen Oberlausitz bis etwa zur |
215 | Goldberg und Goldbrich, die in Nordböhmen und der südlichen Oberlausitz bis etwa zur | 207 | zweiten Hälfte des 18. Jahrhunderts synonym verwendet werden. Hierzu seien |
216 | zweiten Hälfte des 18. Jahrhunderts synonym verwendet werden.</p> | 208 | menschliche Eigenschaften notwendig.<a id="fna23" class="fn" href="#fn23" title="Vgl. Fure 2000.">[23]</a></p> |
217 | <p id="pid13"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid13">13</a>]</span>Zuletzt genannt wird <i>OpenRefine</i>. Zwar hat <i>OpenRefine</i> ein breiteres Anwendungsgebiet, kann jedoch auch zum Rekord Linkage verwendet werden. | 209 | <p id="pid13"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid13">13</a>]</span>Abramitzky et al. zeigen jedoch auf, dass auch automatisierte Vorgehensweisen |
218 | Ein Vorteil ist, dass hierdurch eigene Daten mit Referenzressourcen wie Wikidata abgeglichen | 210 | zufriedenstellende Ergebnisse erzielen können.<a id="fna24" class="fn" href="#fn24" title="Vgl. Abramitzky et al. 2021.">[24]</a> Da nie mit Sicherheit bestimmt werden kann, |
219 | und verbunden werden können. Auch unterstützt <i>OpenRefine</i> die <span style="color:#035151" id=""><i>Reconciliation Service API</i></span>, ein Protokoll zum Datenmatching im Web.<a id="fna24" class="fn" href="#fn24" title="Vgl. Delpeuch et al. 2023.">[24]</a></p> | ||
220 | <p id="pid14"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid14">14</a>]</span>Abramitzky et al. zeigen jedoch auf, dass auch automatisierte Vorgehensweisen | ||
221 | zufriedenstellende Ergebnisse erzielen können.<a id="fna25" class="fn" href="#fn25" title="Vgl. Abramitzky et al. 2021.">[25]</a> Da nie mit Sicherheit bestimmt werden kann, | ||
222 | ob zwei Records tatsächlich dieselbe Entität beschreiben, sind solche Vorgehen | 211 | ob zwei Records tatsächlich dieselbe Entität beschreiben, sind solche Vorgehen |
223 | probabilistisch. Bei einem Vergleich verschiedener Methoden durch Abramitzky | 212 | probabilistisch. Bei einem Vergleich verschiedener Methoden durch Abramitzky et al. |
224 | erreichen auch automatisierte Ansätze Falschpositivraten von unter fünf Prozent. Zudem | 213 | erreichen auch automatisierte Ansätze Falschpositivraten von unter fünf Prozent. Zudem |
225 | zeigen sie, dass auch Menschen nicht frei von Fehlern sind und ebenfalls falschpositive | 214 | zeigen sie, dass auch Menschen nicht frei von Fehlern sind und ebenfalls falschpositive |
226 | Ergebnisse erzeugen.<a id=" | 215 | Ergebnisse erzeugen.<a id="fna25" class="fn" href="#fn25" title="Vgl. Abramitzky et al. 2021, S. 865.">[25]</a> In ihrem |
227 | automatischen Ansatz demonstrieren Abramitzky | 216 | automatischen Ansatz demonstrieren Abramitzky et al. ein dreischrittiges |
228 | Verfahren: Zunächst sind (1.) Variablen für die Verknüpfung auszuwählen, dann | 217 | Verfahren: Zunächst sind (1.) Variablen für die Verknüpfung auszuwählen, dann |
231 | ein, schließlich wird (3.) die Wahrscheinlichkeit der Übereinstimmung | 220 | ein, schließlich wird (3.) die Wahrscheinlichkeit der Übereinstimmung |
232 | bewertet.<a id=" | 221 | bewertet.<a id="fna26" class="fn" href="#fn26" title="Vgl. Abramitzky et al. 2020, S. 94.">[26]</a> |
233 | Die hohe Verlässlichkeit ihrer Vorgehensweise zeigt sich darin, dass sie bei | 222 | Die hohe Verlässlichkeit ihrer Vorgehensweise zeigt sich darin, dass sie bei |
235 | Verknüpfungen ihrer Daten ähnliche Resultate wie in bereits bestehenden, | 224 | Verknüpfungen ihrer Daten ähnliche Resultate wie in bereits bestehenden, |
236 | manuellen Verknüpfungen erhalten.<a id="fna28" class="fn" href="#fn28" title="Dieses stellt zugleich ein geeignetes Beispiel für die Anwendung und den Nutzen von Record-Linkage-Algorithmen in der ökonomischen Forschung dar. Vgl. Abramitzky et al. 2020, S. 106f.">[28]</a></p> | 225 | manuellen Verknüpfungen erhalten.<a id="fna27" class="fn" href="#fn27" title="Dieses stellt zugleich ein geeignetes Beispiel für die Anwendung und den Nutzen von Record-Linkage-Algorithmen in der ökonomischen Forschung dar. Vgl. Abramitzky et al. 2020, S. 106f.">[27]</a></p> |
237 | <p id="pid15"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid15">15</a>]</span>Da der Algorithmus mit der Programmiersprache Python umgesetzt wird, liegt auch die | ||
238 | Verwendung Python-spezifischer Bibliotheken nahe (z. B. <i><a href="https://pypi.org/project/recordlinkage/" target="_blank">RecordLinkage</a></i> von Jonathan de Bruin). Zunächst jedoch wird der Algorithmus fernab von den Möglichkeiten | ||
239 | oder Restriktionen programmiersprachenspezifischer Bibliotheken entwickelt. Deswegen | ||
240 | findet keine Vorfestlegung auf solche statt. Zugleich aber sind solche Bibliotheken | ||
241 | sinnvolle Werkzeuge, um Record-Linkage-Herausforderungen praktisch zu begegnen; auch | ||
242 | zur Umsetzung des Algorithmus in diesem Fall.</p> | ||
243 | <p id="pid16"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid16">16</a>]</span>Grundsätzlich ist es zudem möglich, Methoden des maschinellen Lernens auf Record-Linkage-Herausforderungen | ||
244 | anzuwenden. So könnte beispielsweise die Ähnlichkeit manuell verknüpfter Datensätze | ||
245 | ausgewertet werden, um die Systematik der Verknüpfungen zu erkennen auch auf weitere | ||
246 | Daten anzuwenden. Solchen Ansätzen gemein ist jedoch, dass das erzeugte Modell – und | ||
247 | somit das Ergebnis – von den Trainingsdaten abhängig ist. Aus diesem Grund wird in | ||
248 | diesem Algorithmus bewusst darauf verzichtet, da bekannte genealogische Heuristiken | ||
249 | zunächst in einem statischen Modell formalisiert werden sollen. Darauf aufbauend kann | ||
250 | nachfolgende Forschung diese Ergebnisse nutzen, Verfahren maschinellen Lernens zu | ||
251 | implementieren. | ||
252 | </p> | ||
253 | </div><a name="div6"> </a><div id="subchapter"><a name="hd4"> </a><h3> | 226 | </div><a name="div6"> </a><div id="subchapter"><a name="hd4"> </a><h3> |
255 | </h3> | 228 | </h3> |
256 | <p id=" | 229 | <p id="pid14"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid14">14</a>]</span>Besonders interessant erscheint die Anwendung eines automatisierten Record |
257 | Linkage auf große Datenbestände mit genealogisch relevanten Daten. Das Record | 230 | Linkage auf große Datenbestände mit genealogisch relevanten Daten. Das Record |
266 | zu den Eltern und Kindern ergänzt.</p> | 239 | zu den Eltern und Kindern ergänzt.</p> |
267 | <p id=" | 240 | <p id="pid15"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid15">15</a>]</span>Quellen, die genealogisch relevante Daten enthalten, sind sehr unterschiedlich |
268 | strukturiert. Die zugrundeliegenden Primärquellen sind oftmals Manuskripte. | 241 | strukturiert. Die zugrundeliegenden Primärquellen sind oftmals Manuskripte. |
269 | Hier sind vorwiegend Kirchenbücher zu nennen. Verschiedene prosopographische | 242 | Hier sind vorwiegend Kirchenbücher zu nennen. Verschiedene prosopographische |
270 | Quellen enthalten dabei unterschiedliche Informationen.<a id=" | 243 | Quellen enthalten dabei unterschiedliche Informationen.<a id="fna28" class="fn" href="#fn28" title="Efremova et al. nennen beispielsweise Variablen, die sie aus der Analyse von Geburts-, Todes- und Heiratsdokumenten erhalten. Vgl. Efremova et al. 2015, S. 132.">[28]</a> Allerdings existiert auch eine große Menge an |
271 | Sekundärquellen, die bereits aufgearbeitete Daten präsentieren. Solche Daten | 244 | Sekundärquellen, die bereits aufgearbeitete Daten präsentieren. Solche Daten |
276 | entwickelt.</p> | 249 | entwickelt.</p> |
277 | <p id=" | 250 | <p id="pid16"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid16">16</a>]</span>Für diese Studie wird davon ausgegangen, dass einzelne Quellen so aufgearbeitet |
278 | werden können, dass sie in einer Tabelle vorliegen. Jeder Eintrag der Quelle | 251 | werden können, dass sie in einer Tabelle vorliegen. Jeder Eintrag der Quelle |
281 | Weiteren als Record bezeichnet. Herausforderung hierbei ist, dass die | 254 | Weiteren als Record bezeichnet. Herausforderung hierbei ist, dass die |
282 | | 255 | Datenfelder / Spalten tatsächlich vergleichbare Informationen enthalten müssen. Die |
283 | Zuordnung von Informationen aus einer Quelle in die korrekten Datenfelder ist | 256 | Zuordnung von Informationen aus einer Quelle in die korrekten Datenfelder ist |
289 | Definition des Inhalts der Datenfelder unerlässlich.</p> | 262 | Definition des Inhalts der Datenfelder unerlässlich.</p> |
290 | <p id=" | 263 | <p id="pid17"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid17">17</a>]</span>Als wesentlicher Standard zum Austausch genealogischer Informationen hat sich |
291 | das GEDCOM-Format herausgebildet.<a id=" | 264 | das GEDCOM-Format herausgebildet.<a id="fna29" class="fn" href="#fn29" title="Vgl. Gellatly 2015, S. 112; Harviainen / Björk 2018, S. 4.">[29]</a> In diesem werden einzelne |
292 | Informationen sogenannten Tags zugewiesen, die eine ähnliche Funktion wie | 265 | Informationen sogenannten Tags zugewiesen, die eine ähnliche Funktion wie |
293 | | 266 | Datenfelder / Spalten haben (z. B. beschreibt der Tag OCCU eine Berufsangabe). |
294 | Aber auch aus GEDCOM-Daten ergeben sich Probleme: Zwar sind diese strukturiert, | 267 | Aber auch aus GEDCOM-Daten ergeben sich Probleme: Zwar sind diese strukturiert, |
295 | doch gibt es nicht für alle Informationen eigene Tags. Auch wenn mit GEDCOM 5.5.1 | 268 | doch gibt es nicht für alle Informationen eigene Tags. Auch wenn mit GEDCOM 5.5.1 |
296 | ein Standard existiert,<a id=" | 269 | ein Standard existiert,<a id="fna30" class="fn" href="#fn30" title="Vgl. The Church of Jesus Christ of Latter-day Saints 2019.">[30]</a> legt dieser nicht immer fest, welcher Inhalt den Tags zugeordnet werden darf. Im |
297 | Standard ist | 270 | Standard ist |
301 | ausfüllen, wie es ihnen beliebt und wie sie diese interpretieren.</p> | 274 | ausfüllen, wie es ihnen beliebt und wie sie diese interpretieren.</p> |
302 | <p id=" | 275 | <p id="pid18"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid18">18</a>]</span>Einen weiteren Standard stellt Gedbas4all dar.<a id="fna31" class="fn" href="#fn31" title="Vgl. Verein für Computergenealogie 2016a.">[31]</a> Anders als GEDCOM, in der die |
303 | einzelnen Informationen zu einer Person zwar zusammengeführt, die | 276 | einzelnen Informationen zu einer Person zwar zusammengeführt, die |
307 | konkret definiert wurden. Besonders für die Zeitangaben gibt es eine | 280 | konkret definiert wurden. Besonders für die Zeitangaben gibt es eine |
308 | detaillierte Normierung.<a id=" | 281 | detaillierte Normierung.<a id="fna32" class="fn" href="#fn32" title="Vgl. Verein für Computergenealogie 2016b.">[32]</a> Das Datenmodell enthält jedoch nicht zu |
309 | allen möglichen Variablen eine detaillierte Erläuterung. Zudem hat es noch | 282 | allen möglichen Variablen eine detaillierte Erläuterung. Zudem hat es noch |
310 | keine weite Verbreitung gefunden.</p> | 283 | keine weite Verbreitung gefunden.</p> |
311 | <p id=" | 284 | <p id="pid19"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid19">19</a>]</span>Es zeigt sich, dass kein allgemeingültiges und ausreichend detailliertes System |
312 | zur Definition vieler möglicher Schlüssel für ein Record Linkage auf Basis | 285 | zur Definition vieler möglicher Schlüssel für ein Record Linkage auf Basis |
318 | </h2> | 291 | </h2> |
319 | <p id=" | 292 | <p id="pid20"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid20">20</a>]</span>Die oben aufgeführten Algorithmen scheinen auf ihre jeweiligen Anwendungen bezogen |
320 | zwar effektiv zu sein, doch können sie nicht auf alle | 293 | zwar effektiv zu sein, doch können sie nicht auf alle |
338 | Lösungen als tauglich erwiesen haben.</p> | 311 | Lösungen als tauglich erwiesen haben.</p> |
339 | <p id=" | 312 | <p id="pid21"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid21">21</a>]</span>Der Algorithmus wird im Folgenden textuell erklärt. Die Erläuterung orientiert |
340 | sich am Aufbau der programmtechnischen Umsetzung. Es ist insbesondere auch ein | 313 | sich am Aufbau der programmtechnischen Umsetzung. Es ist insbesondere auch ein |
343 | Programmiersprache Python 3.8 umgesetzt. Dieser ist im <a href="https://git.hab.de/forschungsdaten/zeitschrift-fuer-digitale-geisteswissenschaften/goldberg-record" target="_blank">Online-Repositorium</a> verfügbar.</p> | 316 | Programmiersprache Python 3.8 umgesetzt. Dieser ist im <a href="https://git.hab.de/forschungsdaten/zeitschrift-fuer-digitale-geisteswissenschaften/goldberg-record" target="_blank">Online-Repositorium</a> verfügbar.</p> |
344 | <p id=" | 317 | <p id="pid22"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid22">22</a>]</span>Wesentliche Herausforderungen bestehen in der Normierung, Strukturierung und |
345 | Bereinigung von Eingangsdaten sowie der Prüfung einer Similarität zwischen | 318 | Bereinigung von Eingangsdaten sowie der Prüfung einer Similarität zwischen |
350 | wird eine Normalform der Daten definiert (im Weiteren Normform), in die die | 323 | wird eine Normalform der Daten definiert (im Weiteren Normform), in die die |
351 | Eingangsdaten gebracht werden müssen. Dies geschieht, damit die | 324 | Eingangsdaten gebracht werden müssen. Dies geschieht, damit die Datenfelder / |
352 | Spalten gleichartige Daten enthalten. Daran anschließend wird die Datenbereinigung | 325 | Spalten gleichartige Daten enthalten. Daran anschließend wird die Datenbereinigung |
357 | </h3> | 330 | </h3> |
358 | <p id=" | 331 | <p id="pid23"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid23">23</a>]</span>Der Algorithmus ist auf prosopographische Quellen angepasst, die genealogisch |
359 | relevante Daten enthalten. Es ist denkbar, dass es viele prosopographische | 332 | relevante Daten enthalten. Es ist denkbar, dass es viele prosopographische |
360 | Quellen gibt, die Daten enthalten, welche durch die Normform nicht adäquat | 333 | Quellen gibt, die Daten enthalten, welche durch die Normform nicht adäquat |
361 | abgebildet werden (z. | 334 | abgebildet werden (z. B. Immatrikulationslisten). Hier wird deutlich, dass |
362 | nicht alle erdenklichen (und praktisch auch irgendwo vorkommenden) Attribute | 335 | nicht alle erdenklichen (und praktisch auch irgendwo vorkommenden) Attribute |
367 | ergänzt werden.</p> | 340 | ergänzt werden.</p> |
368 | <p id=" | 341 | <p id="pid24"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid24">24</a>]</span>Der grundlegende Ablauf zur Verarbeitung der Daten ist in <a title="" href="#record_2022_001"><span class="medium">Abbildung 1</span></a> ersichtlich. Um den Algorithmus |
369 | ausführen zu können, müssen die Daten aufbereitet werden. Das kann manuell, | 342 | ausführen zu können, müssen die Daten aufbereitet werden. Das kann manuell, |
370 | aber auch durch ein gesondertes Programm geschehen.<a id=" | 343 | aber auch durch ein gesondertes Programm geschehen.<a id="fna33" class="fn" href="#fn33" title="In vielen Fällen werden die Spaltenüberschriften anzupassen und deren Inhalt entsprechend zuzuordnen sein. Mit tabellarisch vorliegenden Informationen ist die Umsetzung dieses Schrittes vergleichsweise einfach durchführbar. Liegen die Daten als Fließtext vor, so müssen diese zunächst in ein tabellarisches Format überführt werden. Anders sieht das jedoch bei GEDCOM-Dateien aus, die zwar auch Fließtext darstellen, jedoch gut genug strukturiert sind, um sie in ein entsprechendes tabellarisches Format zu überführen. Dazu bietet sich ein GEDCOM-Parser an, welcher in gängigen Genealogieprogrammen enthalten ist.">[33]</a> Der Algorithmus ist darauf |
371 | ausgelegt, zwei in der Normform vorliegende Datensätze dem Record Linkage zu | 344 | ausgelegt, zwei in der Normform vorliegende Datensätze dem Record Linkage zu |
372 | unterziehen.<a id=" | 345 | unterziehen.<a id="fna34" class="fn" href="#fn34" title="Sollten mehr als zwei Datensätze verglichen werden, so sind zunächst zwei auszuwählen und zusammenzuführen. Da das aus dem Record Linkage resultierende Ergebnis ebenfalls der Normform entspricht, kann das Ergebnis mit weiteren Dateien verglichen werden. Dadurch können theoretisch unendlich viele Datensätze miteinander verbunden werden.">[34]</a> Nach der Zusammenführung kann der entstandene, verknüpfte |
373 | Datensatz dann in weitere, übliche Formate wie z. | 346 | Datensatz dann in weitere, übliche Formate wie z. B. GEDCOM übertragen werden. |
374 | Zur Erstellung einer GEDCOM-Datei aus dem Ergebnis des Algorithmus kann | 347 | Zur Erstellung einer GEDCOM-Datei aus dem Ergebnis des Algorithmus kann |
376 | GEDCOM-Datei findet hier jedoch keine weitere Erläuterung, sondern ist der | 349 | GEDCOM-Datei findet hier jedoch keine weitere Erläuterung, sondern ist der |
377 | Bedienungsanleitung des Programms zu entnehmen.<a id=" | 350 | Bedienungsanleitung des Programms zu entnehmen.<a id="fna35" class="fn" href="#fn35" title="Vgl. Schulz 2017.">[35]</a></p> |
378 | <div class="medium"> | 351 | <div class="medium"> |
379 | <div class="field-item even" rel="og:image rdfs:seeAlso" resource="../medium1"><a href="https://www.zfdg.de/sites/default/files/medien/record_2022_001.png" title="Abb. | 352 | <div class="field-item even" rel="og:image rdfs:seeAlso" resource="../medium1"><a href="https://www.zfdg.de/sites/default/files/medien/record_2022_001.png" title="Abb. 1: Ablauf der Datenverarbeitung. [Goldberg / Mernitz 2023]" rel="gallery-node" class="colorbox"><img style="max-height:450px!important" class="artikel" alt="Abb. 1: Ablauf der
 Datenverarbeitung. [Goldberg / Mernitz 2023]" id="record_2022_001" src="https://www.zfdg.de/sites/default/files/styles/medium_in_artikel/record_2022_001.png"></a></div> |
380 | <div class="img_desc"><a href="#abb1">Abb. | 353 | <div class="img_desc"><a href="#abb1">Abb. 1</a>: Ablauf der |
381 | Datenverarbeitung. [ | 354 | Datenverarbeitung. [Goldberg / Mernitz 2023]<a href="#record_2022_001"></a></div> |
382 | </div> | 355 | </div> |
383 | <p id=" | 356 | <p id="pid25"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid25">25</a>]</span>Nach der Transformation in die Normform wird eine Bereinigung und weitere |
384 | Strukturierung der Informationen vorgenommen. Dieser Schritt ist notwendig, | 357 | Strukturierung der Informationen vorgenommen. Dieser Schritt ist notwendig, |
386 | korrigieren.</p> | 359 | korrigieren.</p> |
387 | <p id=" | 360 | <p id="pid26"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid26">26</a>]</span>Nachfolgend wird ein Vergleich zwischen einzelnen Records erzeugt. Für jede |
388 | Zeile in der ersten Tabelle wird dazu geprüft, ob die einzelnen Records der | 361 | Zeile in der ersten Tabelle wird dazu geprüft, ob die einzelnen Records der |
391 | ausschließen sollen (z. B. ist eine Taufe nach dem Tod nicht möglich).</p> | 364 | ausschließen sollen (z. B. ist eine Taufe nach dem Tod nicht möglich).</p> |
392 | <p id=" | 365 | <p id="pid27"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid27">27</a>]</span>Danach wird für die nichtdisjunkten Records eine Similaritätsprüfung |
393 | durchgeführt. Hierdurch soll herausgefunden werden, ob die Personen similär | 366 | durchgeführt. Hierdurch soll herausgefunden werden, ob die Personen similär |
394 | | 367 | sind – also diese beiden Records dieselbe historisch existierende Person |
395 | beschreiben und die Informationen entsprechend zu verknüpfen sind. Hierzu | 368 | beschreiben und die Informationen entsprechend zu verknüpfen sind. Hierzu |
402 | Sicherheit von einer Similarität ausgegangen werden kann.</p> | 375 | Sicherheit von einer Similarität ausgegangen werden kann.</p> |
403 | <p id=" | 376 | <p id="pid28"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid28">28</a>]</span>Der grundlegende Ablauf ist in <a title="" href="#record_2022_002"><span class="medium">Abbildung 2</span></a> dargestellt. Eine ausführliche Erläuterung der einzelnen |
404 | Schritte findet in den folgenden Abschnitten statt.</p> | 377 | Schritte findet in den folgenden Abschnitten statt.</p> |
405 | <div class="medium"> | 378 | <div class="medium"> |
406 | <div class="field-item even" rel="og:image rdfs:seeAlso" resource="../medium1"><a href="https://www.zfdg.de/sites/default/files/medien/record_2022_002.png" title="Abb. | 379 | <div class="field-item even" rel="og:image rdfs:seeAlso" resource="../medium1"><a href="https://www.zfdg.de/sites/default/files/medien/record_2022_002.png" title="Abb. 2: Funktionsweise des Algorithmus als Nassi-Shneiderman-Diagramm. [Goldberg / Mernitz 2023]" rel="gallery-node" class="colorbox"><img style="max-height:450px!important" class="artikel" alt="Abb. 2: Funktionsweise des
 Algorithmus als Nassi-Shneiderman-Diagramm. [Goldberg / Mernitz 2023]" id="record_2022_002" src="https://www.zfdg.de/sites/default/files/styles/medium_in_artikel/record_2022_002.png"></a></div> |
407 | <div class="img_desc"><a href="#abb2">Abb. | 380 | <div class="img_desc"><a href="#abb2">Abb. 2</a>: Funktionsweise des |
408 | Algorithmus als Nassi-Shneiderman-Diagramm. [ | 381 | Algorithmus als Nassi-Shneiderman-Diagramm. [Goldberg / Mernitz 2023]<a href="#record_2022_002"></a></div> |
409 | </div> | 382 | </div> |
412 | </h3> | 385 | </h3> |
413 | <p id=" | 386 | <p id="pid29"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid29">29</a>]</span>Um Daten in eine Normform zu überführen, ist die Definition einer solchen |
414 | notwendig. Das umfasst (1.) die Definition eines Formats und (2.) die | 387 | notwendig. Das umfasst (1.) die Definition eines Formats und (2.) die |
415 | Definition des Inhalts (die möglichen Schlüssel der | 388 | Definition des Inhalts (die möglichen Schlüssel der Variablen / Attribute). Zum |
416 | Format wird festgelegt, dass es sich bei der Normform um eine CSV-Datei | 389 | Format wird festgelegt, dass es sich bei der Normform um eine CSV-Datei |
426 | <tr> | 399 | <tr> |
427 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969; background-color: #eee; font-weight: bold" | 400 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969; background-color: #eee; font-weight: bold">Bezeichnung</td> |
428 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969; background-color: #eee; font-weight: bold" | 401 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969; background-color: #eee; font-weight: bold">Inhalt</td> |
429 | </tr> | 402 | </tr> |
430 | <tr> | 403 | <tr> |
431 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 404 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">id</td> |
432 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 405 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">Diese Spalte enthält eine Abfolge von Zeichen, die innerhalb des |
433 | Datensatzes einmalig je Eintrag ist. Falls die Spalte in einem Datensatz | 406 | Datensatzes einmalig je Eintrag ist. Falls die Spalte in einem Datensatz |
439 | <tr> | 412 | <tr> |
440 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 413 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">firstnameGiven</td> |
441 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 414 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">Diese Spalte enthält die Vornamen. Sind mehrere Vornamen vorhanden, so |
442 | sind diese mit einem Leerzeichen voneinander zu trennen. </td> | 415 | sind diese mit einem Leerzeichen voneinander zu trennen. </td> |
444 | <tr> | 417 | <tr> |
445 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 418 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">firstnameChange</td> |
446 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 419 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">Diese Spalte enthält Informationen über die Änderung des Vornamens. Es |
447 | handelt sich also um einen alternativen Vornamen.</td> | 420 | handelt sich also um einen alternativen Vornamen.</td> |
449 | <tr> | 422 | <tr> |
450 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 423 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">sex</td> |
451 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 424 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">Diese Spalte enthält eine Information über das Geschlecht (›F‹ für |
452 | weiblich, ›M‹ für männlich und eine leere Zelle für unbestimmte | 425 | weiblich, ›M‹ für männlich und eine leere Zelle für unbestimmte |
455 | <tr> | 428 | <tr> |
456 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 429 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">surnameGiven</td> |
457 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 430 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">Diese Spalte enthält die Information über den Nachnamen bei der |
458 | Geburt.</td> | 431 | Geburt.</td> |
460 | <tr> | 433 | <tr> |
461 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 434 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">surnameChange</td> |
462 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 435 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">Diese Spalte enthält die Information über eine Änderung des Nachnamens |
463 | nach der Geburt, aber vor der Heirat. Das kann beispielsweise dadurch | 436 | nach der Geburt, aber vor der Heirat. Das kann beispielsweise dadurch |
467 | <tr> | 440 | <tr> |
468 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 441 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">surnameMarriage1, surnameMarriage2, surnameMarriage3</td> |
469 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 442 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">Diese Spalte enthält die Änderung des Nachnamens im Zuge einer ersten, |
470 | zweiten oder dritten Hochzeit. Wenn im Zuge der Heirat keine | 443 | zweiten oder dritten Hochzeit. Wenn im Zuge der Heirat keine |
473 | <tr> | 446 | <tr> |
474 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 447 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">surnameUnknown</td> |
475 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 448 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">Diese Spalte enthält den Nachnamen, wenn nicht klar ist, zu welchem |
476 | Ereignis diesen jemand erlangt hat.</td> | 449 | Ereignis diesen jemand erlangt hat.</td> |
478 | <tr> | 451 | <tr> |
479 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 452 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">birthday</td> |
480 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 453 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">Diese Spalte enthält den Tag der Geburt. Hier ist nur der Tag in dem |
481 | Format DD.MM.YYYY einzutragen, ohne eine weitere Spezifikation der | 454 | Format DD.MM.YYYY einzutragen, ohne eine weitere Spezifikation der |
482 | Uhrzeit. Die GEDCOM-Systematik zur Beschreibung ungenauer Zeitpunkte ist | 455 | Uhrzeit. Die GEDCOM-Systematik zur Beschreibung ungenauer Zeitpunkte ist |
483 | anzuwenden (z. | 456 | anzuwenden (z. B. ›BET … AND …‹ für ein Ereignis in einer |
484 | Zeitspanne).</td> | 457 | Zeitspanne).</td> |
486 | <tr> | 459 | <tr> |
487 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 460 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">birthplace</td> |
488 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 461 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">Diese Spalte enthält den Ort der Geburt. Hier ist nur die Stadt |
489 | anzugeben, keine weiteren Adressen.</td> | 462 | anzugeben, keine weiteren Adressen.</td> |
491 | <tr> | 464 | <tr> |
492 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 465 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">birthplaceGOV</td> |
493 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 466 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">Diese Spalte enthält die GOV-Kennung (Geschichtliches |
494 | Orts-Verzeichnis, siehe unten) des Geburtsortes.</td> | 467 | Orts-Verzeichnis, siehe unten) des Geburtsortes.</td> |
496 | <tr> | 469 | <tr> |
497 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 470 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">growthUpPlace</td> |
498 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 471 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">Diese Spalte enthält Informationen über die Herkunft einer Person, |
499 | wenn der Geburtsort nicht näher zu bestimmen ist. Beispielhaft dafür sind | 472 | wenn der Geburtsort nicht näher zu bestimmen ist. Beispielhaft dafür sind |
503 | <tr> | 476 | <tr> |
504 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 477 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">growthUpPlaceGOV</td> |
505 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 478 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">Diese Spalte enthält die GOV-Kennung des Herkunftsortes.</td> |
506 | </tr> | 479 | </tr> |
507 | <tr> | 480 | <tr> |
508 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 481 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">baptismday</td> |
509 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 482 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">Diese Spalte enthält den Tag der Taufe. Hier ist nur der Tag in dem |
510 | Format DD.MM.YYYY einzutragen, ohne eine weitere Spezifikation der | 483 | Format DD.MM.YYYY einzutragen, ohne eine weitere Spezifikation der |
511 | Uhrzeit. Die GEDCOM-Systematik zur Beschreibung ungenauer Zeitpunkte ist | 484 | Uhrzeit. Die GEDCOM-Systematik zur Beschreibung ungenauer Zeitpunkte ist |
512 | anzuwenden (z. | 485 | anzuwenden (z. B. ›BET … AND …‹ für ein Ereignis in einer |
513 | Zeitspanne).</td> | 486 | Zeitspanne).</td> |
515 | <tr> | 488 | <tr> |
516 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 489 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">baptismplace</td> |
517 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 490 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">Diese Spalte enthält den Ort der Geburt. Hier ist ein Ort einzutragen |
518 | und nicht die entsprechende Kirche. Hier ist nur die Stadt anzugeben, | 491 | und nicht die entsprechende Kirche. Hier ist nur die Stadt anzugeben, |
521 | <tr> | 494 | <tr> |
522 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 495 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">baptismplaceGOV</td> |
523 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 496 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">Diese Spalte enthält die GOV-Kennung des Taufortes.</td> |
524 | </tr> | 497 | </tr> |
525 | <tr> | 498 | <tr> |
526 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 499 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">marriageday1, marriageday2, marriageday3</td> |
527 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 500 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">Diese Spalte enthält den Tag der ersten, zweiten oder dritten |
528 | Hochzeit. Hier ist nur der Tag in dem Format DD.MM.YYYY einzutragen, ohne | 501 | Hochzeit. Hier ist nur der Tag in dem Format DD.MM.YYYY einzutragen, ohne |
529 | eine weitere Spezifikation der Uhrzeit. Die GEDCOM-Systematik zur | 502 | eine weitere Spezifikation der Uhrzeit. Die GEDCOM-Systematik zur |
530 | Beschreibung ungenauer Zeitpunkte ist anzuwenden (z. | 503 | Beschreibung ungenauer Zeitpunkte ist anzuwenden (z. B. ›BET … AND …‹ für |
531 | ein Ereignis in einer Zeitspanne).</td> | 504 | ein Ereignis in einer Zeitspanne).</td> |
533 | <tr> | 506 | <tr> |
534 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 507 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">marriageplace1, marriageplace2, marriageplace3</td> |
535 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 508 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">Diese Spalte enthält den Ort der ersten, zweiten oder dritten Heirat. |
536 | Hier ist nur die Stadt anzugeben, keine weiteren Adressen.</td> | 509 | Hier ist nur die Stadt anzugeben, keine weiteren Adressen.</td> |
538 | <tr> | 511 | <tr> |
539 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 512 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">marriageplaceGOV1, marriageplaceGOV2, marriageplaceGOV3</td> |
540 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 513 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">Diese Spalte enthält die GOV-Kennung des ersten, zweiten oder dritten |
541 | Heiratsorts. </td> | 514 | Heiratsorts. </td> |
543 | <tr> | 516 | <tr> |
544 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 517 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">ageAtMarriage1, ageAtMarriage2, ageAtMarriage3</td> |
545 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 518 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">Diese Spalte enthält Angaben zum Alter bei der ersten, zweiten oder |
546 | dritten Hochzeit in Jahren.</td> | 519 | dritten Hochzeit in Jahren.</td> |
548 | <tr> | 521 | <tr> |
549 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 522 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">idSpouse1, idSpouse2, idSpouse3</td> |
550 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 523 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">Diese Spalte enthält die ID des*der ersten, zweiten oder dritten |
551 | Ehepartner*in in dem gleichen Datensatz.</td> | 524 | Ehepartner*in in dem gleichen Datensatz.</td> |
553 | <tr> | 526 | <tr> |
554 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 527 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">divorceday1, divorceday2, divorceday3</td> |
555 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 528 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">Diese Spalte enthält den Tag der ersten, zweiten oder dritten |
556 | Scheidung. Hier ist nur der Tag in dem Format DD.MM.YYYY einzutragen, | 529 | Scheidung. Hier ist nur der Tag in dem Format DD.MM.YYYY einzutragen, |
560 | <tr> | 533 | <tr> |
561 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 534 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">deathday</td> |
562 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 535 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">Diese Spalte enthält den Tag des Todes. Hier ist nur der Tag in dem |
563 | Format DD.MM.YYYY einzutragen, ohne eine weitere Spezifikation der | 536 | Format DD.MM.YYYY einzutragen, ohne eine weitere Spezifikation der |
564 | Uhrzeit. Die GEDCOM-Systematik zur Beschreibung ungenauer Zeitpunkte ist | 537 | Uhrzeit. Die GEDCOM-Systematik zur Beschreibung ungenauer Zeitpunkte ist |
565 | anzuwenden (z. | 538 | anzuwenden (z. B. ›BET … AND …‹ für ein Ereignis in einer |
566 | Zeitspanne).</td> | 539 | Zeitspanne).</td> |
568 | <tr> | 541 | <tr> |
569 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 542 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">deathplace</td> |
570 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 543 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">Diese Spalte enthält den Ort des Todes. Hier ist nur die Stadt |
571 | anzugeben, keine weiteren Adressen.</td> | 544 | anzugeben, keine weiteren Adressen.</td> |
573 | <tr> | 546 | <tr> |
574 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 547 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">deathplaceGOV</td> |
575 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 548 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">Diese Spalte enthält die GOV-Kennung des Todesorts.</td> |
576 | </tr> | 549 | </tr> |
577 | <tr> | 550 | <tr> |
578 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 551 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">causeOfDeath</td> |
579 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 552 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">Diese Spalte enthält die Todesursache. Verschiedene Todesursachen sind |
580 | mit Komma und nachfolgendem Leerzeichen oder einem ›und‹ mit vor- und | 553 | mit Komma und nachfolgendem Leerzeichen oder einem ›und‹ mit vor- und |
583 | <tr> | 556 | <tr> |
584 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 557 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">maritalStatusAtDeath</td> |
585 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 558 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">Diese Spalte enthält eine Information über den Familienstand beim Tod. |
586 | Eine Benennung als Witwer beispielsweise kann darauf hindeuten, dass die | 559 | Eine Benennung als Witwer beispielsweise kann darauf hindeuten, dass die |
589 | <tr> | 562 | <tr> |
590 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 563 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">ageAtDeath</td> |
591 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 564 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">Diese Spalte enthält eine Information über das Lebensalter beim |
592 | Tod.</td> | 565 | Tod.</td> |
594 | <tr> | 567 | <tr> |
595 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 568 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">burialday</td> |
596 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 569 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">Diese Spalte enthält den Tag der Beerdigung. Hier ist nur der Tag in |
597 | dem Format DD.MM.YYYY einzutragen, ohne eine weitere Spezifikation der | 570 | dem Format DD.MM.YYYY einzutragen, ohne eine weitere Spezifikation der |
598 | Uhrzeit. Die GEDCOM-Systematik zur Beschreibung ungenauer Zeitpunkte ist | 571 | Uhrzeit. Die GEDCOM-Systematik zur Beschreibung ungenauer Zeitpunkte ist |
599 | anzuwenden (z. | 572 | anzuwenden (z. B. ›BET … AND …‹ für ein Ereignis in einer |
600 | Zeitspanne).</td> | 573 | Zeitspanne).</td> |
602 | <tr> | 575 | <tr> |
603 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 576 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">burialplace</td> |
604 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 577 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">Diese Spalte enthält den Ort der Beerdigung. Hier ist nur die Stadt |
605 | anzugeben, keine weiteren Adressen.</td> | 578 | anzugeben, keine weiteren Adressen.</td> |
607 | <tr> | 580 | <tr> |
608 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 581 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">burialplaceGOV</td> |
609 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 582 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">Diese Spalte enthält die GOV-Kennung des Beerdigungsortes.</td> |
610 | </tr> | 583 | </tr> |
611 | <tr> | 584 | <tr> |
612 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 585 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">occupation</td> |
613 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 586 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">Diese Spalte enthält Informationen zum Beruf. Verschiedene |
614 | Berufsangaben sind mit Komma und nachfolgendem Leerzeichen oder einem | 587 | Berufsangaben sind mit Komma und nachfolgendem Leerzeichen oder einem |
617 | <tr> | 590 | <tr> |
618 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 591 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">idFather</td> |
619 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 592 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">Diese Spalte enthält die ID des Vaters innerhalb dieses |
620 | Datensatzes.</td> | 593 | Datensatzes.</td> |
622 | <tr> | 595 | <tr> |
623 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 596 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">idMother</td> |
624 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 597 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">Diese Spalte enthält die ID der Mutter innerhalb dieses |
625 | Datensatzes.</td> | 598 | Datensatzes.</td> |
627 | </table> | 600 | </table> |
628 | <hr class="one"> | 601 | <hr class="one"><span class="img_desc" id="tab01"><a title="" href="#tab1">Tab. 1</a>: Definition von Datenfeldern. |
629 | <div class="img_desc" id="tab01"><a title="" href="#tab1">Tab. 1</a>: Definition von Datenfeldern. | 602 | [Goldberg / Mernitz 2023]<a title="" href="#record_2022_t1"><span class="medium"></span></a></span><br></div> |
630 | [Goldberg / Mernitz 2023]<a title="" href="#record_2022_t1"><span class="medium"></span></a></div><br></div> | 603 | <p id="pid30"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid30">30</a>]</span>Die Normform enthält dabei nicht alle möglichen Bestandteile prosopographischer |
631 | <p id="pid33"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid33">33</a>]</span>Die Normform enthält dabei nicht alle möglichen Bestandteile prosopographischer | ||
632 | Quellen. Daneben sind weitere Charakteristika denkbar, die sich auf das Leben | 604 | Quellen. Daneben sind weitere Charakteristika denkbar, die sich auf das Leben |
633 | von Personen beziehen und in prosopographischen Quellen vorkommen (u. | 605 | von Personen beziehen und in prosopographischen Quellen vorkommen (u. a. |
634 | Taufpaten, Trauzeugen, Täufer, weitere Bezugspersonen, Adressen zu bestimmten | 606 | Taufpaten, Trauzeugen, Täufer, weitere Bezugspersonen, Adressen zu bestimmten |
644 | </h3> | 616 | </h3> |
645 | <p id=" | 617 | <p id="pid31"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid31">31</a>]</span>Trotz der Normform können die Daten nicht immer direkt miteinander in einen |
646 | Vergleich gesetzt werden. Es ist eine weitere Bereinigung des Inhalts | 618 | Vergleich gesetzt werden. Es ist eine weitere Bereinigung des Inhalts |
647 | notwendig. Darunter gehört z. | 619 | notwendig. Darunter gehört z. B. die Veränderung des Datumsformats. Ferner |
648 | betrifft die Bereinigung insbesondere die Vornamen (siehe <a title="" href="#hd9">Abschnitt 3.3.1</a>, ›Aufbereitung der | 620 | betrifft die Bereinigung insbesondere die Vornamen (siehe <a title="" href="#hd9">Abschnitt 3.3.1</a>, ›Aufbereitung der |
653 | Zeitangaben‹). Die Bereinigung von Ortsangaben dahingegen ist derzeit nicht | 625 | Zeitangaben‹). Die Bereinigung von Ortsangaben dahingegen ist derzeit nicht |
654 | implementiert, kann aber ergänzt werden.<a id=" | 626 | implementiert, kann aber ergänzt werden.<a id="fna36" class="fn" href="#fn36" title="Ortsangaben unterliegen einer breit gefächerten Variation. Insbesondere, ob und wie übergeordnete administrative Einheiten in die Angabe mit eingebunden werden, ist in der Praxis uneinheitlich. Hierbei ist die Verwendung von eindeutigen Identifikatoren für Orte sehr hilfreich. Als Identifikatoren für Orte sind die IDs des Geschichtlichen Orts-Verzeichnis (GOV) zu empfehlen. Vgl. Verein für Computergenealogie 2021. Die Datenbank des Vereins für Computergenealogie bildet hier insbesondere für den deutschen Sprachraum eine geeignete Repräsentation tatsächlich (vormals) vorhandener Orte. Aufgrund einer langen Zeit geringer Mobilität insbesondere der ländlichen Bevölkerung ist es wahrscheinlicher, dass Lebensereignisse in einer begrenzten geografischen Distanz stattgefunden haben. Vgl. Bähr et al. 1992; Kocka et al. 1980. Für den Erfolg eines Record Linkage kann es also auch relevant sein, ob Orte geografisch nah beieinander zu finden sind. Vgl. Efremova et al. 2015, S. 135, 139–141. Die Aufbereitung der Ortsangaben kann an den von Goldberg definierten, auf den deutschen Sprachraum abgestimmten Kriterien orientiert sein. Vgl. Goldberg 2022. Über das von Goldberg beschriebene Programm kann auch eine automatische Zuweisung der GOV-IDs stattfinden.">[36]</a></p><a name="div11"> </a><div id="subchapter"><a name="hd9"> </a><h3> |
655 | <div style="position:relative;width:90%;">3.3.1 Aufbereitung der Namen</div> | 627 | <div style="position:relative;width:90%;">3.3.1 Aufbereitung der Namen</div> |
656 | </h3> | 628 | </h3> |
657 | <p id=" | 629 | <p id="pid32"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid32">32</a>]</span>Namensbezeichnungen können verschiedene Eigenschaften besitzen, die ein |
658 | Record Linkage erschweren. Ein Beispiel dafür sind Abkürzungen | 630 | Record Linkage erschweren. Ein Beispiel dafür sind Abkürzungen |
668 | Vornamen werden durch Leerzeichen separiert als Liste gespeichert.</p> | 640 | Vornamen werden durch Leerzeichen separiert als Liste gespeichert.</p> |
669 | <p id=" | 641 | <p id="pid33"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid33">33</a>]</span>Um den Nutzen der Vornamen für das Record Linkage zu erhöhen, wird aus den |
670 | Angaben zum Vornamen das Geschlecht | 642 | Angaben zum Vornamen das Geschlecht erkannt – sofern diese Information nicht |
671 | gesondert vorliegt. Hierzu werden die Vornamen, die auf ein A oder E enden, | 643 | gesondert vorliegt. Hierzu werden die Vornamen, die auf ein A oder E enden, |
672 | als weiblich erkannt. Dazu wird jeweils der erste Vorname herangezogen.<a id=" | 644 | als weiblich erkannt. Dazu wird jeweils der erste Vorname herangezogen.<a id="fna37" class="fn" href="#fn37" title="In der deutschen Sprache enden Frauennamen traditionell auf A oder E. Zwar tragen auch vereinzelte Männer Frauennamen, häufig Maria, diesen jedoch kaum als ersten Vornamen. Auf die moderne Namensgebung passt dieses Muster nicht mehr. Da sich dieser Algorithmus aber auf historische Daten bezieht, stellt das an dieser Stelle kein entscheidendes Problem dar.">[37]</a> Etliche Ausnahmen sind gesondert |
673 | definiert (z. B. Ingeborg, Elisabeth).</p> | 645 | definiert (z. B. Ingeborg, Elisabeth).</p> |
676 | </h3> | 648 | </h3> |
677 | <p id=" | 649 | <p id="pid34"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid34">34</a>]</span>Ähnlich wie bei den Namen können auch Berufsangaben eine Abkürzung erfahren. |
678 | Auch diese werden mit Hilfe einer initial definierten Liste aufgelöst und | 650 | Auch diese werden mit Hilfe einer initial definierten Liste aufgelöst und |
685 | Tätigkeit, sondern weitergehende Informationen über den Rechtsstatus, | 657 | Tätigkeit, sondern weitergehende Informationen über den Rechtsstatus, |
686 | Wohnsitz oder einen Zeitbezug enthalten.<a id=" | 658 | Wohnsitz oder einen Zeitbezug enthalten.<a id="fna38" class="fn" href="#fn38" title="Zur Separierung solcher berufsfernen Angaben kann auf Goldberg / Moeller 2022 hingewiesen werden, die Kriterien zur Bereinigung von Berufsangaben aufstellen.">[38]</a> Mehrere Berufsangaben werden |
687 | anhand des Kommas oder eines ›und‹ aufgesplittet als Liste gespeichert.</p> | 659 | anhand des Kommas oder eines ›und‹ aufgesplittet als Liste gespeichert.</p> |
690 | </h3> | 662 | </h3> |
691 | <p id=" | 663 | <p id="pid35"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid35">35</a>]</span>Zeitangaben können verschiedene Formate aufweisen. Das liegt vor allem in |
692 | dem Umstand begründet, dass Zeitangaben nicht immer ein konkretes, | 664 | dem Umstand begründet, dass Zeitangaben nicht immer ein konkretes, |
702 | </h3> | 674 | </h3> |
703 | <p id=" | 675 | <p id="pid36"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid36">36</a>]</span>Genealogische Heuristiken helfen dabei, die Records zu identifizieren, die |
704 | dieselbe Entität beschreiben. Ihre Formalisierung führt zu Logikoperationen, | 676 | dieselbe Entität beschreiben. Ihre Formalisierung führt zu Logikoperationen, |
706 | auf den vorhandenen Variablen. Jedoch können schon bei einem Datensatz mit 30 | 678 | auf den vorhandenen Variablen. Jedoch können schon bei einem Datensatz mit 30 |
707 | verschiedenen zu vergleichenden Variablen (Variable | 679 | verschiedenen zu vergleichenden Variablen (Variable vorhanden / nicht |
708 | vorhanden) insgesamt etwa eine Milliarde mögliche Kombinationen auftreten.<a id=" | 680 | vorhanden) insgesamt etwa eine Milliarde mögliche Kombinationen auftreten.<a id="fna39" class="fn" href="#fn39" title="2_30 = 1.073.741.824.">[39]</a> Der |
709 | Vergleich von zwei Datensätzen erhöht diese Zahl der möglichen Kombinationen | 681 | Vergleich von zwei Datensätzen erhöht diese Zahl der möglichen Kombinationen |
710 | auf mehr als eine Trillion.<a id=" | 682 | auf mehr als eine Trillion.<a id="fna40" class="fn" href="#fn40" title="1.073.741.824_2 = 1.152.921.504.606.850.000.">[40]</a> Für diese Anzahl an |
711 | Kombinationen ist eine manuelle Definition von Verarbeitungsfolgen nicht | 683 | Kombinationen ist eine manuelle Definition von Verarbeitungsfolgen nicht |
715 | keinen Schluss auf den Zusammenhang von Records zu.</p> | 687 | keinen Schluss auf den Zusammenhang von Records zu.</p> |
716 | <p id=" | 688 | <p id="pid37"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid37">37</a>]</span>Hierzu können zunächst verschiedene Variablen zusammengefasst werden, die |
717 | ähnliche Merkmale aufweisen (z. | 689 | ähnliche Merkmale aufweisen (z. B. Datumsangaben, Ortsangaben, Namen). |
718 | Vergleiche sind nur innerhalb dieser Gruppen sinnhaft. Diese Definition | 690 | Vergleiche sind nur innerhalb dieser Gruppen sinnhaft. Diese Definition |
721 | beschrieben: Wenn z. B. eine Taufe nach dem Tod stattfindet, dann ist eine | 693 | beschrieben: Wenn z. B. eine Taufe nach dem Tod stattfindet, dann ist eine |
722 | Similarität auszuschließen.<a id=" | 694 | Similarität auszuschließen.<a id="fna41" class="fn" href="#fn41" title="Sonderformen bei einzelnen Glaubensgemeinschaften, z. B. die Totentaufe der Mormonen, bleiben unberücksichtigt.">[41]</a> Es bleibt eine deutlich minimierte Anzahl an |
723 | Variablenkombinationen übrig, bei denen ein genauerer Vergleich sinnhaft | 695 | Variablenkombinationen übrig, bei denen ein genauerer Vergleich sinnhaft |
728 | </h3> | 700 | </h3> |
729 | <p id=" | 701 | <p id="pid38"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid38">38</a>]</span>Eine Gruppe von Vergleichen kann vorgenommen werden, wenn in beiden Records |
730 | gleichartige Variablen vorliegen. Dazu ist ein Wissen über die Beziehungen | 702 | gleichartige Variablen vorliegen. Dazu ist ein Wissen über die Beziehungen |
751 | <li>Die (teilweise) Übereinstimmung von Vornamen kann Aufschluss | 723 | <li>Die (teilweise) Übereinstimmung von Vornamen kann Aufschluss |
752 | über die Zusammenführung der Personen liefern.<a id=" | 724 | über die Zusammenführung der Personen liefern.<a id="fna42" class="fn" href="#fn42" title="Der Vergleich darf sich aber nicht nur auf einzelne Vornamen oder die Reihenfolge der Vornamen beziehen. Beispielsweise können Johann und Johann Christoph dieselbe Person sein, Johann Christoph und Christoph Johann können dieselbe Person sein, Johann Christoph und Christoph Heinrich sind aber eher unwahrscheinlich dieselbe Person.">[42]</a></li> |
753 | </ul> | 725 | </ul> |
765 | Übereinstimmung von Nachnamen in unterschiedlichen Kategorien nur | 737 | Übereinstimmung von Nachnamen in unterschiedlichen Kategorien nur |
766 | bei surnameUnknown ein Indiz für eine Übereinstimmung ist.<a id=" | 738 | bei surnameUnknown ein Indiz für eine Übereinstimmung ist.<a id="fna43" class="fn" href="#fn43" title="Beispielsweise ist eine Person, die als surnameGiven Schwarzenberg aufweist, nur in seltenen Fällen mit einer Person übereinstimmend, die diesen Namen durch die erste Heirat (surnameMarriage1) erhalten hat.">[43]</a></li> |
767 | </ul> | 739 | </ul> |
773 | <li>birthday und baptismday: Taufdatum und Geburtsdatum liegen oft | 745 | <li>birthday und baptismday: Taufdatum und Geburtsdatum liegen oft |
774 | nah beieinander.<a id=" | 746 | nah beieinander.<a id="fna44" class="fn" href="#fn44" title="Die hier definierten Regeln passen nur auf solche Religionsgemeinschaften, die die Kleinkindtaufe praktizieren.">[44]</a> Eine Person kann nicht vor |
775 | ihrer Geburt getauft werden.</li> | 747 | ihrer Geburt getauft werden.</li> |
866 | werden, die sich nicht ähnlich sind und dadurch nur schwer über | 838 | werden, die sich nicht ähnlich sind und dadurch nur schwer über |
867 | String-Matching-Methoden erkannt werden können (z. | 839 | String-Matching-Methoden erkannt werden können (z. B. |
868 | »Feuerwehrmann« und | 840 | »Feuerwehrmann« und |
873 | hier angenommen, dass es sich nicht um dieselbe Person handelt. Dabei | 845 | hier angenommen, dass es sich nicht um dieselbe Person handelt. Dabei |
874 | sind detaillierte Quellen gemeint (z. | 846 | sind detaillierte Quellen gemeint (z. B. ein konkreter Heiratseintrag mit |
875 | laufender Nummer in einem Heiratsregister).</li> | 847 | laufender Nummer in einem Heiratsregister).</li> |
879 | </h3> | 851 | </h3> |
880 | <p id=" | 852 | <p id="pid39"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid39">39</a>]</span>Sind im vorigen Abschnitt mögliche Vergleiche zwischen Variablen beschrieben |
881 | worden, findet nun eine Definition konkreter Kriterien statt, die ein | 853 | worden, findet nun eine Definition konkreter Kriterien statt, die ein |
890 | erheblichen Verbesserung der Laufzeit.</p> | 862 | erheblichen Verbesserung der Laufzeit.</p> |
891 | <p id=" | 863 | <p id="pid40"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid40">40</a>]</span>Die meisten hier vorgestellten Regeln sind in Hinblick auf die kulturelle |
892 | Praxis und den Ablauf von Lebensereignissen logisch. So kann eine Person | 864 | Praxis und den Ablauf von Lebensereignissen logisch. So kann eine Person |
900 | mit genealogischen Daten.</p> | 872 | mit genealogischen Daten.</p> |
901 | <p id=" | 873 | <p id="pid41"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid41">41</a>]</span>Zunächst sind Records disjunkt, wenn sie auf demselben Eintrag in einer |
902 | Quelle basieren. Das kann beispielsweise in Taufeinträgen der Fall sein, bei | 874 | Quelle basieren. Das kann beispielsweise in Taufeinträgen der Fall sein, bei |
909 | nicht in anderen Einträgen vorkommen können und ein weiterer Vergleich aus | 881 | nicht in anderen Einträgen vorkommen können und ein weiterer Vergleich aus |
910 | Laufzeitgründen deshalb nicht notwendig ist.<a id=" | 882 | Laufzeitgründen deshalb nicht notwendig ist.<a id="fna45" class="fn" href="#fn45" title="Wenn für die zu vergleichenden Quellen jedoch insbesondere dieser Aspekt relevant ist, kann die Altersgrenze auch variiert oder entfernt werden. Das kann zum Beispiel der Fall sein, wenn Geburtsangaben aus Zeitungen mit denen aus Kirchenbüchern verglichen werden sollen.">[45]</a> Wenn beide Records |
911 | ein Geschlecht aufweisen, dieses aber nicht dasselbe ist, so sind sie | 883 | ein Geschlecht aufweisen, dieses aber nicht dasselbe ist, so sind sie |
922 | sterben, bevor sie beerdigt werden kann.</p> | 894 | sterben, bevor sie beerdigt werden kann.</p> |
923 | <p id=" | 895 | <p id="pid42"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid42">42</a>]</span>Wenn die Geburtsdaten beider Personen vorhanden und trotzdem unterschiedlich |
924 | sind, so beschreiben sie nicht dieselbe Person. Ebenso verhält es sich mit | 896 | sind, so beschreiben sie nicht dieselbe Person. Ebenso verhält es sich mit |
928 | Abweichungen lässt.</p> | 900 | Abweichungen lässt.</p> |
929 | <p id=" | 901 | <p id="pid43"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid43">43</a>]</span>Aus dem Vergleich mit den Eltern ergeben sich einige Zustände, die ein |
930 | ausschließendes Kriterium darstellen. So kann der Tod des eigenen Vaters | 902 | ausschließendes Kriterium darstellen. So kann der Tod des eigenen Vaters |
939 | können.</p> | 911 | können.</p> |
940 | <p id=" | 912 | <p id="pid44"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid44">44</a>]</span>Folgende Regeln führen zur Ungleichheit der Records (similarity = 0):</p> |
941 | <ul class="ul_article"> | 913 | <ul class="ul_article"> |
942 | <li>Wenn sex ! | 914 | <li>Wenn sex != sex</li> |
943 | <li>Wenn | 915 | <li>Wenn source == source</li> |
944 | <li>Wenn Differenz von birthday von id und deathday von idFather > 9 | 916 | <li>Wenn Differenz von birthday von id und deathday von idFather > 9 |
951 | Monate</li> | 923 | Monate</li> |
952 | <li>Wenn birthday von id > deathday von idMother<a id=" | 924 | <li>Wenn birthday von id > deathday von idMother<a id="fna46" class="fn" href="#fn46" title="Auf diese Regel unter Einbeziehung des Taufdatums wird hier verzichtet, weil die Mutter bei der Geburt sterben und das Kind erst danach getauft werden kann.">[46]</a></li> |
953 | <li>Wenn birthday von id > burialday von idMother</li> | 925 | <li>Wenn birthday von id > burialday von idMother</li> |
1046 | </ul> | 1018 | </ul> |
1047 | <p id="pid48"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid48">48</a>]</span>Programmtechnisch sind die Vergleiche mit IF-ELSE-Anweisungen umgesetzt. Ferner ist | 1019 | <p id="pid45"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid45">45</a>]</span>In der programmtechnischen Umsetzung ist ergänzend eine optionale Variable |
1048 | ergänzend eine optionale Variable | ||
1049 | (sortingBySurnameGiven) angelegt, mit der im Fall identischer zu | 1020 | (sortingBySurnameGiven) angelegt, mit der im Fall identischer zu |
1056 | </h3> | 1027 | </h3> |
1057 | <p id=" | 1028 | <p id="pid46"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid46">46</a>]</span>Kann nicht erkannt werden, dass zwei Records disjunkt sind, so wird die |
1058 | Similarität dieser weiter geprüft. Dazu wird ein Fuzzy-Vergleich der Vor- | 1029 | Similarität dieser weiter geprüft. Dazu wird ein Fuzzy-Vergleich der Vor- |
1059 | und Nachnamen vorgenommen. Zum Vergleich dieser Strings wird die | 1030 | und Nachnamen vorgenommen. Zum Vergleich dieser Strings wird die |
1060 | Jaro-Winkler-Distanz ausgewählt, weil diese bei Georgala | 1031 | Jaro-Winkler-Distanz ausgewählt, weil diese bei Georgala et al. zu guten |
1061 | Ergebnissen führt.<a id="fna48" class="fn" href="#fn48" title=" | 1032 | Ergebnissen führt.<a id="fna47" class="fn" href="#fn47" title="Vgl. Georgala et al. 2015, S. 187.">[47]</a> Georgala et al. erzielen mittels einer ROC-Kurve<a id="fna48" class="fn" href="#fn48" title="Receiver Operating Characteristic, vgl. Fan et al. 2006.">[48]</a> ein optimales Ergebnis bei einem Grenzwert von 0,70.<a id="fna49" class="fn" href="#fn49" title="Vgl. Georgala et al. 2015, S. 185.">[49]</a> Um die Anzahl |
1062 | der falschpositiven Zuordnungen zu verringern, wird in unserem Ansatz jedoch | 1033 | der falschpositiven Zuordnungen zu verringern, wird in unserem Ansatz jedoch |
1073 | den deutschen Sprachraum ausgerichtet ist. Buchstaben werden dabei in Zahlen | 1044 | den deutschen Sprachraum ausgerichtet ist. Buchstaben werden dabei in Zahlen |
1074 | codiert.<a id=" | 1045 | codiert.<a id="fna50" class="fn" href="#fn50" title="Vgl. Postel 1969, S. 928.">[50]</a> Ist der |
1075 | Wert der Kölner Phonetik gleich und liegt die Jaro-Winkler-Distanz bei über | 1046 | Wert der Kölner Phonetik gleich und liegt die Jaro-Winkler-Distanz bei über |
1076 | 0,60, wird hier ebenfalls von einer Similarität ausgegangen. Der Wert der Kölner Phonetik | 1047 | 0,60, wird hier ebenfalls von einer Similarität ausgegangen.</p> |
1077 | wird im Programmcode über die Bibliothek <i>kph</i> ermittelt. Für die Berechnung der Jaro-Winkler-Distanz wird hingegen die Bibliothek | 1048 | <p id="pid47"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid47">47</a>]</span>Nach dem Test der Nachnamen wird zudem die Similarität der Vornamen |
1078 | <i>distance</i> genutzt.</p> | ||
1079 | <p id="pid50"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid50">50</a>]</span>Nach dem Test der Nachnamen wird zudem die Similarität der Vornamen | ||
1080 | überprüft. Überschreitet die Jaro-Winkler-Distanz auch bei einem Vergleich | 1049 | überprüft. Überschreitet die Jaro-Winkler-Distanz auch bei einem Vergleich |
1086 | erhält dann einen Wert von 0.</p> | 1055 | erhält dann einen Wert von 0.</p> |
1087 | <p id=" | 1056 | <p id="pid48"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid48">48</a>]</span>Die Similaritätsprüfung stützt sich im Algorithmus damit nur auf die |
1088 | Ähnlichkeit von Vor- und Nachnamen. Dabei können perspektivisch auch weitere | 1057 | Ähnlichkeit von Vor- und Nachnamen. Dabei können perspektivisch auch weitere |
1091 | eine Kombination dieser zu implementieren.</p> | 1060 | eine Kombination dieser zu implementieren.</p> |
1092 | <p id=" | 1061 | <p id="pid49"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid49">49</a>]</span>Wenn mehrere Matches vorhanden sind, wird geprüft, welches über die größte |
1093 | Übereinstimmung verfügt. Nur das passendste wird zusammengeführt. Es wird | 1062 | Übereinstimmung verfügt. Nur das passendste wird zusammengeführt. Es wird |
1100 | Ergebnistabelle wiederholt ausgeführt werden.</p> | 1069 | Ergebnistabelle wiederholt ausgeführt werden.</p> |
1101 | <p id=" | 1070 | <p id="pid50"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid50">50</a>]</span>Neben der Similaritätsprüfung gibt es noch einen sogenannten Prioritätswert. |
1102 | Dieser wird ermittelt, um nicht nur Disjunktionsregeln und die Ähnlichkeit | 1071 | Dieser wird ermittelt, um nicht nur Disjunktionsregeln und die Ähnlichkeit |
1109 | zusammengeführt, wenn sie zugleich verschiedene Variablenkombinationen | 1078 | zusammengeführt, wenn sie zugleich verschiedene Variablenkombinationen |
1110 | aufweisen (z. | 1079 | aufweisen (z. B. beide ein Geburts- und Taufdatum), die die |
1111 | Disjunktionsprüfung überstanden haben. Darunter fallen folgende | 1080 | Disjunktionsprüfung überstanden haben. Darunter fallen folgende |
1124 | </h3> | 1093 | </h3> |
1125 | <p id=" | 1094 | <p id="pid51"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid51">51</a>]</span>Wird erkannt, dass zwei Records dieselbe Entität beschreiben, sind diese |
1126 | zusammenzuführen. Es wird ein neuer Record in einer neuen Tabelle kreiert, die | 1095 | zusammenzuführen. Es wird ein neuer Record in einer neuen Tabelle kreiert, die |
1137 | separiert zusammengeführt.</p> | 1106 | separiert zusammengeführt.</p> |
1138 | <p id=" | 1107 | <p id="pid52"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid52">52</a>]</span>Die neue Tabelle enthält neben allen (wie oben beschrieben zusammengeführten) |
1139 | Variablen zudem die Spalte idGlobal. Diese globale ID stellt eine neu erzeugte | 1108 | Variablen zudem die Spalte idGlobal. Diese globale ID stellt eine neu erzeugte |
1145 | dieser Variablen.</p> | 1114 | dieser Variablen.</p> |
1146 | <p id=" | 1115 | <p id="pid53"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid53">53</a>]</span>Solche Records, zu denen kein Pendant im jeweils anderen Datensatz gefunden |
1147 | wird, werden unverändert in die neue Tabelle überführt. Ausnahme ist allerdings | 1116 | wird, werden unverändert in die neue Tabelle überführt. Ausnahme ist allerdings |
1152 | <tr> | 1121 | <tr> |
1153 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969; background-color: #eee; font-weight: bold" | 1122 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969; background-color: #eee; font-weight: bold">Bezeichnung</td> |
1154 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969; background-color: #eee; font-weight: bold" | 1123 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969; background-color: #eee; font-weight: bold">Inhalt</td> |
1155 | </tr> | 1124 | </tr> |
1156 | <tr> | 1125 | <tr> |
1157 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1126 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">globalId</td> |
1158 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1127 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">Diese Spalte enthält eine eindeutige, globale ID. Jede natürliche |
1159 | Person soll nur eine ID erhalten, die mit den einzelnen Einträgen der | 1128 | Person soll nur eine ID erhalten, die mit den einzelnen Einträgen der |
1162 | <tr> | 1131 | <tr> |
1163 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1132 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">idSource1</td> |
1164 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1133 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">Diese Spalte enthält die Angabe über die ID des ersten Eintrags in der |
1165 | ersten Quelle.</td> | 1134 | ersten Quelle.</td> |
1167 | <tr> | 1136 | <tr> |
1168 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1137 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">idSource2</td> |
1169 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1138 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">Diese Spalte enthält die Angabe über die ID des zweiten Eintrags in |
1170 | der zweiten Quelle.</td> | 1139 | der zweiten Quelle.</td> |
1172 | </table> | 1141 | </table> |
1173 | <hr class="one"> | 1142 | <hr class="one"><span class="img_desc" id="tab02"><a title="" href="#tab2">Tab. 2</a>: Zusätzliche Variablen eines |
1174 | <div class="img_desc" id="tab02"><a title="" href="#tab2">Tab. 2</a>: Zusätzliche Variablen eines | 1143 | zusammengeführten Datensatzes. [Goldberg / Mernitz 2023]<a title="" href="#record_2022_t2"><span class="medium"></span></a></span><br></div> |
1175 | zusammengeführten Datensatzes. [Goldberg / Mernitz 2023]<a title="" href="#record_2022_t2"><span class="medium"></span></a></div><br></div> | ||
1176 | </div> | 1144 | </div> |
1179 | </h2> | 1147 | </h2> |
1180 | <p id=" | 1148 | <p id="pid54"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid54">54</a>]</span>Leipzig ist eine Stadt, an der sich zwei große historische Handelsrouten Europas |
1181 | kreuzen: die Via Regia von Ost nach West sowie die Via Imperii von Nord nach | 1149 | kreuzen: die Via Regia von Ost nach West sowie die Via Imperii von Nord nach |
1182 | Süd.<a id=" | 1150 | Süd.<a id="fna51" class="fn" href="#fn51" title="Vgl. Schönfelder / Börngen 2015, S. 39.">[51]</a> Diese |
1183 | geografische Lage bot für die Entwicklung Leipzigs, vor allem als Messe- und | 1151 | geografische Lage bot für die Entwicklung Leipzigs, vor allem als Messe- und |
1188 | Informationen bietet Leipzig ein geeignetes Beispiel zur Validierung des | 1156 | Informationen bietet Leipzig ein geeignetes Beispiel zur Validierung des |
1189 | beschriebenen Algorithmus. Innerhalb dieser Validierung werden zwei | 1157 | beschriebenen Algorithmus. Innerhalb dieser Validierung werden zwei Quellen / |
1190 | Datenbestände betrachtet: die Kartei Leipziger Familien (KLF) und die Kartei | 1158 | Datenbestände betrachtet: die Kartei Leipziger Familien (KLF) und die Kartei |
1192 | zumindest teilweise Daten über dieselben Personen enthalten. Aufgrund des | 1160 | zumindest teilweise Daten über dieselben Personen enthalten. Aufgrund des |
1193 | unterschiedlichen Gegenstands,<a id=" | 1161 | unterschiedlichen Gegenstands,<a id="fna52" class="fn" href="#fn52" title="Bei der KLK ist vor allem relevant, dass nur ein Teil der Bevölkerung überhaupt Testamente hinterlegt hat.">[52]</a> vor allem aber wegen unterschiedlicher Zeiträume, sind nicht |
1194 | alle Personen in beiden Datenbeständen zu finden. Zum Teil spielt auch eine | 1162 | alle Personen in beiden Datenbeständen zu finden. Zum Teil spielt auch eine |
1197 | ein.</p> | 1165 | ein.</p> |
1198 | <p id=" | 1166 | <p id="pid55"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid55">55</a>]</span>In dem folgenden Abschnitt wird zunächst die Struktur der hier verwendeten |
1199 | Datenbestände beschrieben, bevor der Algorithmus auf sie angewendet wird. Die | 1167 | Datenbestände beschrieben, bevor der Algorithmus auf sie angewendet wird. Die |
1205 | </h3> | 1173 | </h3> |
1206 | <p id=" | 1174 | <p id="pid56"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid56">56</a>]</span>Im Folgenden wird zunächst auf die KLF eingegangen. Danach folgt die KLK.</p><a name="div21"> </a><div id="subchapter"><a name="hd19"> </a><h3> |
1207 | <div style="position:relative;width:90%;">4.1.1 Kartei Leipziger Familien (ca. 1550–1850)</div> | 1175 | <div style="position:relative;width:90%;">4.1.1 Kartei Leipziger Familien (ca. 1550–1850)</div> |
1208 | </h3> | 1176 | </h3> |
1209 | <p id=" | 1177 | <p id="pid57"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid57">57</a>]</span>In der KLF sind viele Informationen über in Leipzig ansässige Familien |
1210 | enthalten. Die Kartei wurde von einer Mitarbeiterin der Deutschen | 1178 | enthalten. Die Kartei wurde von einer Mitarbeiterin der Deutschen |
1214 | Jahrhunderts. Auf 20.000 Karteikarten sind dort etwa 200.000 | 1182 | Jahrhunderts. Auf 20.000 Karteikarten sind dort etwa 200.000 |
1215 | Personen(einträge) dokumentiert.<a id=" | 1183 | Personen(einträge) dokumentiert.<a id="fna53" class="fn" href="#fn53" title="Munke 2019, S. 118. Personen innerhalb der KLF können also doppelt vorkommen, indem sie auf einer Karteikarte in der Rolle des Kindes erscheinen, auf einer anderen als Familienoberhaupt oder Ehefrau. Auch Drittpersonen können in den anderen Rollen vorkommen. Dadurch reduziert sich im Zuge eines Record Linkage die Anzahl der Personeneinträge.">[53]</a> Die Karteikarten |
1216 | enthalten jeweils Angaben zu einem Ehemann, seiner Ehefrau und deren | 1184 | enthalten jeweils Angaben zu einem Ehemann, seiner Ehefrau und deren |
1218 | Karte verzeichnet. Die Karteikarten sind untereinander nicht über eindeutige | 1186 | Karte verzeichnet. Die Karteikarten sind untereinander nicht über eindeutige |
1219 | Identifikatoren wie Kartennummern verknüpft.<a id=" | 1187 | Identifikatoren wie Kartennummern verknüpft.<a id="fna54" class="fn" href="#fn54" title="Für eine detaillierte Erklärung des Aufbaus der Karteikarten vgl. Verein für Computergenealogie 2018–2019.">[54]</a></p> |
1220 | <p id=" | 1188 | <p id="pid58"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid58">58</a>]</span>Im Rahmen eines Datenerfassungsprojekts durch den Verein für |
1221 | Computergenealogie wurde die Kartei digitalisiert.<a id=" | 1189 | Computergenealogie wurde die Kartei digitalisiert.<a id="fna55" class="fn" href="#fn55" title="Online durchsuchbar, vgl. Verein für Computergenealogie 2018–2019.">[55]</a> Dazu wurden die Scans der Karteikarten manuell |
1222 | abgetippt. Datenfelder im genutzten Datenerfassungssystem (DES) sind der | 1190 | abgetippt. Datenfelder im genutzten Datenerfassungssystem (DES) sind der |
1227 | vergeben wird). Des Weiteren existieren besondere, KLF-spezifische Angaben | 1195 | vergeben wird). Des Weiteren existieren besondere, KLF-spezifische Angaben |
1228 | zur Rolle, zur Bezugsperson und zur Art der Beziehung zur Bezugsperson.<a id=" | 1196 | zur Rolle, zur Bezugsperson und zur Art der Beziehung zur Bezugsperson.<a id="fna56" class="fn" href="#fn56" title="Erwähnenswert ist, dass nicht jedes Feld einen Eintrag enthält, sondern vieles optional ist. Dadurch stehen im Zweifel bei jedem Eintrag andere Daten zur Verfügung.">[56]</a> Es gibt die Rollen |
1229 | Familienoberhaupt, Kind, Ehefrau und Drittperson. Ersteres beschreibt einen | 1197 | Familienoberhaupt, Kind, Ehefrau und Drittperson. Ersteres beschreibt einen |
1236 | der Beziehung beschreibt dahingegen das Verhältnis zur Drittperson (Ehemann | 1204 | der Beziehung beschreibt dahingegen das Verhältnis zur Drittperson (Ehemann |
1237 | | 1205 | / Ehefrau / Vater). Damit sind die Felder nicht direkt der definierten |
1238 | Normform zuzuordnen, sondern müssen zunächst umgewandelt werden. Dieses | 1206 | Normform zuzuordnen, sondern müssen zunächst umgewandelt werden. Dieses |
1240 | beispielhaft, dass die Umwandlung in die Normform aufwendig sein kann.</p> | 1208 | beispielhaft, dass die Umwandlung in die Normform aufwendig sein kann.</p> |
1241 | <p id=" | 1209 | <p id="pid59"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid59">59</a>]</span>Ein Schwerpunkt dieses Programms besteht dabei in der Umwandlung von |
1242 | Altersangaben: Dabei wird im Algorithmus der Sonderfall abgedeckt, dass in | 1210 | Altersangaben: Dabei wird im Algorithmus der Sonderfall abgedeckt, dass in |
1248 | Separierung wäre ein alternativ mögliches Vorgehen.</p> | 1216 | Separierung wäre ein alternativ mögliches Vorgehen.</p> |
1249 | <p id=" | 1217 | <p id="pid60"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid60">60</a>]</span>Da Altersangaben nur in Beziehung mit anderen Variablen interpretiert werden |
1250 | können, bezieht die Aufbereitung dieser Daten weitere Informationen eines | 1218 | können, bezieht die Aufbereitung dieser Daten weitere Informationen eines |
1251 | Records mit ein (z. | 1219 | Records mit ein (z. B. das Alter bei Tod und das Todesdatum zur Berechnung |
1252 | des Geburtszeitpunkts). Für die Aufbereitung ist aufgrund der relativen | 1220 | des Geburtszeitpunkts). Für die Aufbereitung ist aufgrund der relativen |
1254 | Datumsangaben des Records notwendig.</p> | 1222 | Datumsangaben des Records notwendig.</p> |
1255 | <p id=" | 1223 | <p id="pid61"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid61">61</a>]</span>Es wird zunächst geprüft, ob die Zeitangabe einer normierten Schreibweise |
1256 | entspricht. Diese wird hier als D.M.YYYY definiert und darüber ermittelt, ob | 1224 | entspricht. Diese wird hier als D.M.YYYY definiert und darüber ermittelt, ob |
1270 | </ul> | 1238 | </ul> |
1271 | <p id=" | 1239 | <p id="pid62"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid62">62</a>]</span>Bei den ersten vier der fünf Fälle kann eine Zeitangabe abgeleitet werden. |
1272 | Im fünften Fall besteht die Herausforderung darin, zu erkennen, dass es sich | 1240 | Im fünften Fall besteht die Herausforderung darin, zu erkennen, dass es sich |
1285 | Datumsformat vorliegt.</p> | 1253 | Datumsformat vorliegt.</p> |
1286 | <p id=" | 1254 | <p id="pid63"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid63">63</a>]</span>Die grundsätzliche Zuordnung der KLF zu den Datenfeldern der Normform wird |
1287 | wie in <a title="" href="#tab03">Tabelle 3</a> | 1255 | wie in <a title="" href="#tab03">Tabelle 3</a> |
1293 | <tr> | 1261 | <tr> |
1294 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969; background-color: #eee; font-weight: bold" | 1262 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969; background-color: #eee; font-weight: bold">Variable KLF</td> |
1295 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969; background-color: #eee; font-weight: bold" | 1263 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969; background-color: #eee; font-weight: bold">Variable der Normform</td> |
1296 | </tr> | 1264 | </tr> |
1297 | <tr> | 1265 | <tr> |
1298 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1266 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">page [ID der Karteikarte]</td> |
1299 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1267 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">source</td> |
1300 | </tr> | 1268 | </tr> |
1301 | <tr> | 1269 | <tr> |
1302 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1270 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">lastname</td> |
1303 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1271 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">lastnameGiven</td> |
1304 | </tr> | 1272 | </tr> |
1305 | <tr> | 1273 | <tr> |
1306 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1274 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">firstname</td> |
1307 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1275 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">firstnameGiven</td> |
1308 | </tr> | 1276 | </tr> |
1309 | <tr> | 1277 | <tr> |
1310 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1278 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">Beruf</td> |
1311 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1279 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">occupation</td> |
1312 | </tr> | 1280 | </tr> |
1313 | <tr> | 1281 | <tr> |
1314 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1282 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">Rolle</td> |
1315 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1283 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">---</td> |
1316 | </tr> | 1284 | </tr> |
1317 | <tr> | 1285 | <tr> |
1318 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1286 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">Ort</td> |
1319 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1287 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">---</td> |
1320 | </tr> | 1288 | </tr> |
1321 | <tr> | 1289 | <tr> |
1322 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1290 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">GOV-Id</td> |
1323 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1291 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">---</td> |
1324 | </tr> | 1292 | </tr> |
1325 | <tr> | 1293 | <tr> |
1326 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1294 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">Bezugsperson</td> |
1327 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1295 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">---</td> |
1328 | </tr> | 1296 | </tr> |
1329 | <tr> | 1297 | <tr> |
1330 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1298 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">Art der Beziehung</td> |
1331 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1299 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">---</td> |
1332 | </tr> | 1300 | </tr> |
1333 | <tr> | 1301 | <tr> |
1334 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1302 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">Geburtsdatum/Alter</td> |
1335 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1303 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">birthday</td> |
1336 | </tr> | 1304 | </tr> |
1337 | <tr> | 1305 | <tr> |
1338 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1306 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">Taufdatum</td> |
1339 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1307 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">baptismday</td> |
1340 | </tr> | 1308 | </tr> |
1341 | <tr> | 1309 | <tr> |
1342 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1310 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">Heiratsdatum</td> |
1343 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1311 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">marriageday1</td> |
1344 | </tr> | 1312 | </tr> |
1345 | <tr> | 1313 | <tr> |
1346 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1314 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">Sterbedatum</td> |
1347 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1315 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">deathday</td> |
1348 | </tr> | 1316 | </tr> |
1349 | <tr> | 1317 | <tr> |
1350 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1318 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">Beerd.Datum</td> |
1351 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1319 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">burialday</td> |
1352 | </tr> | 1320 | </tr> |
1353 | <tr> | 1321 | <tr> |
1354 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1322 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">Bemerkung</td> |
1355 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1323 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">---</td> |
1356 | </tr> | 1324 | </tr> |
1357 | <tr> | 1325 | <tr> |
1358 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1326 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">weiterer Ort</td> |
1359 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1327 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">---</td> |
1360 | </tr> | 1328 | </tr> |
1361 | </table> | 1329 | </table> |
1362 | <hr class="one"> | 1330 | <hr class="one"><span class="img_desc" id="tab03"><a title="" href="#tab3">Tab. 3</a>: Direkte Umwandlung der |
1363 | <div class="img_desc" id="tab03"><a title="" href="#tab3">Tab. 3</a>: Direkte Umwandlung der | 1331 | KLF-Struktur in die Normform. [Goldberg / Mernitz 2023]<a title="" href="#record_2022_t3"><span class="medium"></span></a></span><br></div> |
1364 | KLF-Struktur in die Normform. [Goldberg / Mernitz 2023]<a title="" href="#record_2022_t3"><span class="medium"></span></a></div><br></div> | 1332 | <p id="pid64"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid64">64</a>]</span>Die KLF-Variablen Rolle, Bezugsperson, Art der Beziehung und ID werden zudem |
1365 | <p id="pid67"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid67">67</a>]</span>Die KLF-Variablen Rolle, Bezugsperson, Art der Beziehung und ID werden zudem | ||
1366 | herangezogen, um weitere Variablen der Normform zu füllen (vgl. <a title="" href="#tab04">Tabelle 4</a>).</p> | 1333 | herangezogen, um weitere Variablen der Normform zu füllen (vgl. <a title="" href="#tab04">Tabelle 4</a>).</p> |
1370 | <tr> | 1337 | <tr> |
1371 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969; background-color: #eee; font-weight: bold" | 1338 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969; background-color: #eee; font-weight: bold">Variable der Normform</td> |
1372 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969; background-color: #eee; font-weight: bold" | 1339 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969; background-color: #eee; font-weight: bold">Verknüpfung der KLF-Variablen</td> |
1373 | </tr> | 1340 | </tr> |
1374 | <tr> | 1341 | <tr> |
1375 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1342 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">idSpouse1, idSpouse2, idSpouse3</td> |
1376 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1343 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">Ein Familienoberhaupt erhält die ID der Ehefrau auf derselben |
1377 | Karteikarte. Eine Ehefrau erhält die ID des Familienoberhauptes auf | 1344 | Karteikarte. Eine Ehefrau erhält die ID des Familienoberhauptes auf |
1378 | derselben Karteikarte. Eine Drittperson vom Typ | 1345 | derselben Karteikarte. Eine Drittperson vom Typ Ehefrau / Ehemann |
1379 | führt dazu, dass bei der Drittperson wie auch bei der Bezugsperson | 1346 | führt dazu, dass bei der Drittperson wie auch bei der Bezugsperson |
1382 | <tr> | 1349 | <tr> |
1383 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1350 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">idFather, idMother</td> |
1384 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1351 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">Bei Kindern werden die IDs der Eltern jeweils ergänzt. Tritt eine |
1385 | Drittperson als Vater auf, so wird diese bei dem Kind ergänzt.</td> | 1352 | Drittperson als Vater auf, so wird diese bei dem Kind ergänzt.</td> |
1387 | <tr> | 1354 | <tr> |
1388 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1355 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">idGlobal</td> |
1389 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1356 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">Wird ohne Bezug zur KLF fortlaufend vergeben.</td> |
1390 | </tr> | 1357 | </tr> |
1391 | </table> | 1358 | </table> |
1392 | <hr class="one"> | 1359 | <hr class="one"><span class="img_desc" id="tab04"><a title="" href="#tab4">Tab. 4</a>: Indirekte Umwandlung der |
1393 | <div class="img_desc" id="tab04"><a title="" href="#tab4">Tab. 4</a>: Indirekte Umwandlung der | 1360 | KLF-Struktur in die Normform. [Goldberg / Mernitz 2023]<a title="" href="#record_2022_t4"><span class="medium"></span></a></span><br></div> |
1394 | KLF-Struktur in die Normform. [Goldberg / Mernitz 2023]<a title="" href="#record_2022_t4"><span class="medium"></span></a></div><br></div> | ||
1395 | </div><a name="div22"> </a><div id="subchapter"><a name="hd20"> </a><h3> | 1361 | </div><a name="div22"> </a><div id="subchapter"><a name="hd20"> </a><h3> |
1397 | </h3> | 1363 | </h3> |
1398 | <p id=" | 1364 | <p id="pid65"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid65">65</a>]</span>Für das Amt Leipzig liegen für die Zeit von 1696 bis 1829 Testamente |
1399 | innerhalb von 120 Bänden im Sächsischen Staatsarchiv vor.<a id=" | 1365 | innerhalb von 120 Bänden im Sächsischen Staatsarchiv vor.<a id="fna57" class="fn" href="#fn57" title="Sächsisches Staatsarchiv. Bestand 20009 Amt Leipzig.">[57]</a> Zum Auffinden von Testamentsvorgängen existiert eine |
1400 | | 1366 | Kartei – die KLK. Auch die KLK ist im Rahmen eines Datenerfassungsprojektes |
1401 | des Vereins für Computergenealogie mit Hilfe des DES erfasst worden und <a href="https://des.genealogy.net/leipzig_testamente/search/index" target="_blank">online</a> einsehbar.<a id=" | 1367 | des Vereins für Computergenealogie mit Hilfe des DES erfasst worden und <a href="https://des.genealogy.net/leipzig_testamente/search/index" target="_blank">online</a> einsehbar.<a id="fna58" class="fn" href="#fn58" title="Verein für Computergenealogie 2019–2021.">[58]</a> Sie umfasst 4.800 |
1402 | Karteikarten, auf denen jeweils zu einer Person die entsprechenden Vorgänge | 1368 | Karteikarten, auf denen jeweils zu einer Person die entsprechenden Vorgänge |
1404 | Jedoch können auch Drittpersonen auf den Karten erscheinen. Dazu gibt es in | 1370 | Jedoch können auch Drittpersonen auf den Karten erscheinen. Dazu gibt es in |
1405 | der KLK die Variable ›Rolle‹, in der zwischen Erblasser*innen und | 1371 | der KLK die Variable ›Rolle‹, in der zwischen Erblasser*innen und Drittpersonen / |
1406 | Verwandten unterschieden wird. Dies führt dazu, dass ca. 6.500 | 1372 | Verwandten unterschieden wird. Dies führt dazu, dass ca. 6.500 |
1410 | dokumentiert.</p> | 1376 | dokumentiert.</p> |
1411 | <p id=" | 1377 | <p id="pid66"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid66">66</a>]</span>Auch die Variablen der KLK-Erfassung lassen sich in die Normform umwandeln. |
1412 | Wie bei der KLF gibt es dabei Variablen, die sich direkt auf die Normform | 1378 | Wie bei der KLF gibt es dabei Variablen, die sich direkt auf die Normform |
1418 | <tr> | 1384 | <tr> |
1419 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969; background-color: #eee; font-weight: bold" | 1385 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969; background-color: #eee; font-weight: bold">Variable KLK</td> |
1420 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969; background-color: #eee; font-weight: bold" | 1386 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969; background-color: #eee; font-weight: bold">Variable der Normform</td> |
1421 | </tr> | 1387 | </tr> |
1422 | <tr> | 1388 | <tr> |
1423 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1389 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">page</td> |
1424 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1390 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">---</td> |
1425 | </tr> | 1391 | </tr> |
1426 | <tr> | 1392 | <tr> |
1427 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1393 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">firstname</td> |
1428 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1394 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">firstnameGiven</td> |
1429 | </tr> | 1395 | </tr> |
1430 | <tr> | 1396 | <tr> |
1431 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1397 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">Stand/Beruf</td> |
1432 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1398 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">occupation</td> |
1433 | </tr> | 1399 | </tr> |
1434 | <tr> | 1400 | <tr> |
1435 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1401 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">Rolle</td> |
1436 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1402 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">---</td> |
1437 | </tr> | 1403 | </tr> |
1438 | <tr> | 1404 | <tr> |
1439 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1405 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">Ort</td> |
1440 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1406 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">---</td> |
1441 | </tr> | 1407 | </tr> |
1442 | <tr> | 1408 | <tr> |
1443 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1409 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">Band und Blatt</td> |
1444 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1410 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">source</td> |
1445 | </tr> | 1411 | </tr> |
1446 | <tr> | 1412 | <tr> |
1447 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1413 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">Familienstand</td> |
1448 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1414 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">---</td> |
1449 | </tr> | 1415 | </tr> |
1450 | <tr> | 1416 | <tr> |
1451 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1417 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">Ereignis 1, …, Ereignis 8</td> |
1452 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1418 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">---</td> |
1453 | </tr> | 1419 | </tr> |
1454 | <tr> | 1420 | <tr> |
1455 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1421 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">Geschlecht</td> |
1456 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1422 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">sex</td> |
1457 | </tr> | 1423 | </tr> |
1458 | <tr> | 1424 | <tr> |
1459 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1425 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">Bezugsperson ID</td> |
1460 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1426 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">---</td> |
1461 | </tr> | 1427 | </tr> |
1462 | <tr> | 1428 | <tr> |
1463 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1429 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">Bezugsperson Name</td> |
1464 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1430 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">---</td> |
1465 | </tr> | 1431 | </tr> |
1466 | <tr> | 1432 | <tr> |
1467 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1433 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">Art der Beziehung</td> |
1468 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1434 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">---</td> |
1469 | </tr> | 1435 | </tr> |
1470 | <tr> | 1436 | <tr> |
1471 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1437 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">Sterbedatum</td> |
1472 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1438 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">deathday</td> |
1473 | </tr> | 1439 | </tr> |
1474 | <tr> | 1440 | <tr> |
1475 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1441 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">Datum von [erster Vorgang]</td> |
1476 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1442 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">---</td> |
1477 | </tr> | 1443 | </tr> |
1478 | <tr> | 1444 | <tr> |
1479 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1445 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">Datum bis [letzter Vorgang]</td> |
1480 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1446 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">---</td> |
1481 | </tr> | 1447 | </tr> |
1482 | <tr> | 1448 | <tr> |
1483 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1449 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">idGlobal</td> |
1484 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1450 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">›A‹ + id, bzw. neue ID bei zusammengeführten Personen.</td> |
1485 | </tr> | 1451 | </tr> |
1486 | </table> | 1452 | </table> |
1487 | <hr class="one"> | 1453 | <hr class="one"><span class="img_desc" id="tab05"><a title="" href="#tab5">Tab. 5</a>: Direkte Umwandlung der |
1488 | <div class="img_desc" id="tab05"><a title="" href="#tab5">Tab. 5</a>: Direkte Umwandlung der | 1454 | KLK-Struktur in die Normform. [Goldberg / Mernitz 2023]<a title="" href="#record_2022_t5"><span class="medium"></span></a></span><br></div> |
1489 | KLK-Struktur in die Normform. [Goldberg / Mernitz 2023]<a title="" href="#record_2022_t5"><span class="medium"></span></a></div><br></div> | 1455 | <p id="pid67"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid67">67</a>]</span>Die indirekte Herleitung betrifft vor allem die Nachnamen. In der KLK sind |
1490 | <p id="pid70"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid70">70</a>]</span>Die indirekte Herleitung betrifft vor allem die Nachnamen. In der KLK sind | ||
1491 | nämlich die vorherigen Nachnamen mit abgebildet. Wenn der Teilstring | 1456 | nämlich die vorherigen Nachnamen mit abgebildet. Wenn der Teilstring |
1500 | angegebene Nachname immer der Geburtsname ist.</p> | 1465 | angegebene Nachname immer der Geburtsname ist.</p> |
1501 | <p id=" | 1466 | <p id="pid68"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid68">68</a>]</span>Auch bei den IDs findet eine indirekte Zuordnung statt. Wenn eine |
1502 | Drittperson definiert ist und diese den Typ ›Ehemann‹ oder ›Ehefrau‹ | 1467 | Drittperson definiert ist und diese den Typ ›Ehemann‹ oder ›Ehefrau‹ |
1503 | aufweist, dann wird die ID des | 1468 | aufweist, dann wird die ID des Ehepartners / der Ehepartnerin hinzugefügt. Gleiches |
1504 | erfolgt bei | 1469 | erfolgt bei |
1511 | Dubletten ist hierbei die Quellenangabe (Band und Blatt) der Testamente. | 1476 | Dubletten ist hierbei die Quellenangabe (Band und Blatt) der Testamente. |
1512 | Wenn nur die ID eines | 1477 | Wenn nur die ID eines Ehepartners / einer Ehepartnerin verändert wird, deutet es darauf |
1513 | hin, dass | 1478 | hin, dass |
1516 | Drittperson fehlt.</p> | 1481 | Drittperson fehlt.</p> |
1517 | <p id=" | 1482 | <p id="pid69"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid69">69</a>]</span>Des Weiteren wird angenommen, dass die Testamentseröffnung kurz nach dem Tod |
1518 | vorgenommen wird. Liegt also kein Todestag vor, so wird das Jahr der | 1483 | vorgenommen wird. Liegt also kein Todestag vor, so wird das Jahr der |
1524 | <tr> | 1489 | <tr> |
1525 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969; background-color: #eee; font-weight: bold" | 1490 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969; background-color: #eee; font-weight: bold">Variable der Normform</td> |
1526 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969; background-color: #eee; font-weight: bold" | 1491 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969; background-color: #eee; font-weight: bold">Verknüpfung der KLF-Variablen</td> |
1527 | </tr> | 1492 | </tr> |
1528 | <tr> | 1493 | <tr> |
1529 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1494 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">idSpouse1, idSpouse2, idSpouse3</td> |
1530 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1495 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">Wenn eine Drittperson (›Rolle‹ == Drittperson / Verwandter) vom Typ |
1531 | Ehefrau oder Ehemann vorhanden ist (›Art der Beziehung‹), dann wird | 1496 | Ehefrau oder Ehemann vorhanden ist (›Art der Beziehung‹), dann wird |
1534 | <tr> | 1499 | <tr> |
1535 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1500 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">idFather, idMother</td> |
1536 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1501 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">Wenn eine Drittperson vom Typ Vater / Mutter / Sohn / Tochter |
1537 | vorhanden ist, dann wird die ID entsprechend ergänzt.</td> | 1502 | vorhanden ist, dann wird die ID entsprechend ergänzt.</td> |
1539 | <tr> | 1504 | <tr> |
1540 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1505 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">idGlobal</td> |
1541 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1506 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">id</td> |
1542 | </tr> | 1507 | </tr> |
1543 | <tr> | 1508 | <tr> |
1544 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1509 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">lastname</td> |
1545 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1510 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">surnamenGiven, surnameUnkown, surnameMarriage1, surnameMarriage2, |
1546 | surnameMarriage3</td> | 1511 | surnameMarriage3</td> |
1548 | <tr> | 1513 | <tr> |
1549 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1514 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">deathday</td> |
1550 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1515 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">Eröffnung</td> |
1551 | </tr> | 1516 | </tr> |
1552 | </table> | 1517 | </table> |
1553 | <hr class="one"> | 1518 | <hr class="one"><span class="img_desc" id="tab06"><a title="" href="#tab6">Tab. 6</a>: Indirekte Umwandlung der |
1554 | <div class="img_desc" id="tab06"><a title="" href="#tab6">Tab. 6</a>: Indirekte Umwandlung der | 1519 | KLK-Struktur in die Normform. [Goldberg / Mernitz 2023]<a title="" href="#record_2022_t6"><span class="medium"></span></a></span><br></div> |
1555 | KLK-Struktur in die Normform. [Goldberg / Mernitz 2023]<a title="" href="#record_2022_t6"><span class="medium"></span></a></div><br></div> | ||
1556 | </div> | 1520 | </div> |
1559 | </h3> | 1523 | </h3> |
1560 | <p id=" | 1524 | <p id="pid70"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid70">70</a>]</span>Da sowohl in der KLK und KLF Personen mehrfach genannt werden können, ist |
1561 | zunächst ein Vergleich der beiden normformatierten Datentabellen mit sich | 1525 | zunächst ein Vergleich der beiden normformatierten Datentabellen mit sich |
1570 | auch umgesetzt worden sind.</p> | 1534 | auch umgesetzt worden sind.</p> |
1571 | <p id=" | 1535 | <p id="pid71"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid71">71</a>]</span>Dennoch wird eine manuelle Überprüfung der zusammengeführten Records |
1572 | vorgenommen. Da nicht alle Records überprüft werden können, werden nur die | 1536 | vorgenommen. Da nicht alle Records überprüft werden können, werden nur die |
1573 | Personen behandelt, deren Geburtsname mit ›A‹ beginnt.<a id=" | 1537 | Personen behandelt, deren Geburtsname mit ›A‹ beginnt.<a id="fna59" class="fn" href="#fn59" title="Hierdurch werden nicht alle Aspekte des Algorithmus in gleicher Weise geprüft. Insbesondere die intergenerationalen Elemente der Plausibilitätsprüfung entfallen, da insbesondere Mütter Geburtsnamen mit anderen Anfangsbuchstaben haben.">[59]</a> Von diesen 4.251 Records werden 651 |
1574 | zusammengeführt (15,3 Prozent). Dabei konnten einige falschpositive Ergebnisse | 1538 | zusammengeführt (15,3 Prozent). Dabei konnten einige falschpositive Ergebnisse |
1582 | Abitzsch (14457495 und 14458366), Maria Arnst (14556375 und 14556424) und Paul | 1546 | Abitzsch (14457495 und 14458366), Maria Arnst (14556375 und 14556424) und Paul |
1583 | Arnst (14556496 und 14560610). Bei | 1547 | Arnst (14556496 und 14560610). Bei dem / den Bäcker(n) Anton Arnoldt (14554173 und |
1584 | 14554184) wird es sich | 1548 | 14554184) wird es sich |
1594 | Falschpositiven bei 1,7 Prozent.</p> | 1558 | Falschpositiven bei 1,7 Prozent.</p> |
1595 | <p id=" | 1559 | <p id="pid72"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid72">72</a>]</span>Weiterhin ist auffällig, dass bei vielen Personen ein positiver Prioritätswert |
1596 | aufgrund gleicher Heiratsdaten oder gleicher Berufsangaben zustande kommt. | 1560 | aufgrund gleicher Heiratsdaten oder gleicher Berufsangaben zustande kommt. |
1604 | darstellt.</p> | 1568 | darstellt.</p> |
1605 | <p id=" | 1569 | <p id="pid73"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid73">73</a>]</span>Die Relevanz von Berufsangaben für den Prioritätswert führt auch dazu, dass |
1606 | etwas mehr Männer (58,7 Prozent) als Frauen zusammengeführt werden. Um mehr | 1570 | etwas mehr Männer (58,7 Prozent) als Frauen zusammengeführt werden. Um mehr |
1614 | priorisiert werden.</p> | 1578 | priorisiert werden.</p> |
1615 | <p id=" | 1579 | <p id="pid74"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid74">74</a>]</span>Bemerkenswert ist auch, dass Vor- und Nachname bei den zusammengeführten |
1616 | Personen in 90,6 Prozent der Fälle exakt übereinstimmen. Das liegt auch darin | 1580 | Personen in 90,6 Prozent der Fälle exakt übereinstimmen. Das liegt auch darin |
1622 | »Christine« etc.).</p> | 1586 | »Christine« etc.).</p> |
1623 | <p id=" | 1587 | <p id="pid75"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid75">75</a>]</span>Zudem ist zu vermuten, dass es im gesamten Datensatz eine nicht näher bekannte |
1624 | Anzahl von falschnegativen Zuordnungen | 1588 | Anzahl von falschnegativen Zuordnungen gibt – also Records, die zusammengeführt |
1625 | werden müssten, es aber nicht wurden. Für diesen Abgleich wäre eine | 1589 | werden müssten, es aber nicht wurden. Für diesen Abgleich wäre eine |
1631 | eine mehrfache Iteration also hilfreich sein.</p> | 1595 | eine mehrfache Iteration also hilfreich sein.</p> |
1632 | <p id=" | 1596 | <p id="pid76"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid76">76</a>]</span>Dass mit dem hier vorgestellten Algorithmus jedoch ein |
1633 | erheblicher Teil der tatsächlich zusammenzuführenden Records auch | 1597 | erheblicher Teil der tatsächlich zusammenzuführenden Records auch |
1634 | zusammengeführt wird, zeigt ein Vergleich mit der Personenzusammenführung des | 1598 | zusammengeführt wird, zeigt ein Vergleich mit der Personenzusammenführung des |
1635 | Genealogie-Programms <i>Ahnenblatt</i> 2.99<a id=" | 1599 | Genealogie-Programms <i>Ahnenblatt</i> 2.99<a id="fna60" class="fn" href="#fn60" title="Vgl. Böttcher 2018.">[60]</a>: Wird die GEDCOM-Datei dort hineingeladen und werden die |
1636 | Vorschläge zur Zusammenführung der Personen ohne weiteren manuellen Eingriff | 1600 | Vorschläge zur Zusammenführung der Personen ohne weiteren manuellen Eingriff |
1637 | ausgeführt, werden 25.329 von 241.466 Personen zusammengeführt.<a id=" | 1601 | ausgeführt, werden 25.329 von 241.466 Personen zusammengeführt.<a id="fna61" class="fn" href="#fn61" title="Die Zusammenführung basiert hierbei auf gleichen Namen und einem gleichen Ereignisdatum (z. B. das Taufdatum) und betrifft auch die nähere Verwandtschaft der betreffenden Personen wie die Eltern, Kinder oder Geschwister. Vgl. Böttcher 2018, S. 17.">[61]</a> Das entspricht mit 10,5 |
1638 | Prozent einem deutlich geringeren Anteil als im Test der mit »A« beginnenden | 1602 | Prozent einem deutlich geringeren Anteil als im Test der mit »A« beginnenden |
1648 | <tr> | 1612 | <tr> |
1649 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1613 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969"></td> |
1650 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969; background-color: #eee; font-weight: bold" | 1614 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969; background-color: #eee; font-weight: bold">KLF</td> |
1651 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969; background-color: #eee; font-weight: bold" | 1615 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969; background-color: #eee; font-weight: bold">KLK</td> |
1652 | </tr> | 1616 | </tr> |
1653 | <tr> | 1617 | <tr> |
1654 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969; background-color: #eee; font-weight: bold" | 1618 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969; background-color: #eee; font-weight: bold">KLF</td> |
1655 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1619 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">31.791 von 241.465 Records zusammengeführt (Anteil: 13,2 |
1656 | Prozent)</td> | 1620 | Prozent)</td> |
1657 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1621 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">---</td> |
1658 | </tr> | 1622 | </tr> |
1659 | <tr> | 1623 | <tr> |
1660 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969; background-color: #eee; font-weight: bold" | 1624 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969; background-color: #eee; font-weight: bold">KLK</td> |
1661 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1625 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">413 zusammengeführt bei 5.761 Personen (Anteil: 7,2 Prozent)<a id="fna62" class="fn" href="#fn62" title="Hier werden die Daten genutzt, nachdem die KLF und KLK jeweils mit sich selbst abgeglichen worden sind. Von den 5.761 übrig gebliebenen Personen in der KLK konnten 413 in der KLF gefunden werden.">[62]</a></td> |
1662 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969" | 1626 | <td style="padding-top: 10px; padding-bottom: 10px; padding-right: 10px; padding-left: 5px; border: 1px; rules: all; border-style: solid; border-color: #696969">41 zusammengeführt bei 5.802 Personen (Anteil: 0,7 Prozent)<a id="fna63" class="fn" href="#fn63" title="Die KLK enthält zwar 6.524 Personendatensätze. Die Überführung in die Normform sorgt jedoch dafür, dass bereits Personen zusammengeführt werden, sodass hier 5.802 Personendatensätze übrig bleiben.">[63]</a></td> |
1663 | </tr> | 1627 | </tr> |
1664 | </table> | 1628 | </table> |
1665 | <hr class="one"> | 1629 | <hr class="one"><span class="img_desc" id="tab07"><a title="" href="#tab7">Tab. 7</a>: Übersicht über die Anzahl |
1666 | <div class="img_desc" id="tab07"><a title="" href="#tab7">Tab. 7</a>: Übersicht über die Anzahl | 1630 | der verknüpften Personen aus den Normformen. [Goldberg / Mernitz 2023]<a title="" href="#record_2022_t7"><span class="medium"></span></a></span><br></div> |
1667 | der verknüpften Personen aus den Normformen. [Goldberg / Mernitz 2023]<a title="" href="#record_2022_t7"><span class="medium"></span></a></div><br></div> | 1631 | <p id="pid77"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid77">77</a>]</span>Insgesamt sind die Ergebnisse des Algorithmus also gut: Ein nicht näher zu |
1668 | <p id="pid80"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid80">80</a>]</span>Insgesamt sind die Ergebnisse des Algorithmus also gut: Ein nicht näher zu | ||
1669 | quantifizierender, aber erheblicher Teil der tatsächlich zusammenzuführenden | 1632 | quantifizierender, aber erheblicher Teil der tatsächlich zusammenzuführenden |
1675 | die Formalisierung und Automatisierung genealogischer Heuristiken kann | 1638 | die Formalisierung und Automatisierung genealogischer Heuristiken kann |
1676 | erweitert und das Record Linkage somit verbessert werden.<a id=" | 1639 | erweitert und das Record Linkage somit verbessert werden.<a id="fna64" class="fn" href="#fn64" title="Es gibt weitere, noch nicht in die Normform integrierte Informationen, die eine hohe praktische Relevanz für genealogische Verknüpfungen haben, deren maschinelle Interpretation aber sehr schwer erscheint. Dazu gehören insbesondere Angaben zu den Taufpaten.">[64]</a></p> |
1677 | </div> | 1640 | </div> |
1680 | </h2> | 1643 | </h2> |
1681 | <p id=" | 1644 | <p id="pid78"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid78">78</a>]</span>Gleiches mit Gleichem zu verbinden – darin besteht eine Herausforderung im Umgang |
1682 | mit historischen Personendaten. Der vorgestellte Ansatz leistet einen Beitrag, | 1645 | mit historischen Personendaten. Der vorgestellte Ansatz leistet einen Beitrag, |
1698 | Anpassung an die jeweiligen Herausforderungen.</p> | 1661 | Anpassung an die jeweiligen Herausforderungen.</p> |
1699 | <p id=" | 1662 | <p id="pid79"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid79">79</a>]</span>Hierbei zeigt sich sowohl ein großer Vorteil als auch ein großer Nachteil der |
1700 | vorgestellten Lösung: Der Vorteil besteht darin, dass der Algorithmus besonders | 1663 | vorgestellten Lösung: Der Vorteil besteht darin, dass der Algorithmus besonders |
1710 | Der Algorithmus kann hier beispielsweise bei der Erstellung von | 1673 | Der Algorithmus kann hier beispielsweise bei der Erstellung von |
1711 | Ortsfamilienbüchern ein nützliches Werkzeug sein. Hierzu gilt es in einem nächsten | 1674 | Ortsfamilienbüchern ein nützliches Werkzeug sein.</p> |
1712 | Schritt, die Nachnutzung des Programmcodes niederschwelliger möglich zu machen, beispielsweise | 1675 | <p id="pid80"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid80">80</a>]</span>Nachteilig ist der Algorithmus dahingegen, wenn nur wenige Informationen über die |
1713 | durch ein Webinterface. Ziel ist es, dass zwei Normform-Tabellen als CSV-Dateien in | ||
1714 | einem Webbrowser hochgeladen werden können. Hier würde zudem die Möglichkeit bestehen, | ||
1715 | diverse Funktionen des Algorithmus ab- oder anzuschalten oder Grenzwerte zu variieren.</p> | ||
1716 | <p id="pid83"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid83">83</a>]</span>Nachteilig ist der Algorithmus dahingegen, wenn nur wenige Informationen über die | ||
1717 | durch die Records beschriebenen Personen vorhanden sind. Sind beispielsweise nur | 1676 | durch die Records beschriebenen Personen vorhanden sind. Sind beispielsweise nur |
1727 | Nichtsdestotrotz stellt das entwickelte Programm ein geeignetes Grundgerüst für | 1686 | Nichtsdestotrotz stellt das entwickelte Programm ein geeignetes Grundgerüst für |
1728 | die Anpassung dar. Weiteres Potenzial besteht in der Evaluation und Integration von | 1687 | die Anpassung dar.</p> |
1729 | Methoden maschinellen Lernens, die hier, wie eingangs erläutert, bewusst nicht genutzt | 1688 | <p id="pid81"><span style="float: right; padding: .2em; color: #999; border: 1px solid #ccc; background-color: #eee; margin-right: -80px;">[<a href="#pid81">81</a>]</span></p> |
1730 | worden sind.</p> | ||
1731 | </div> | 1689 | </div> |
1738 | <div class="footnote2" id="fn1" href="#fna1">[<a href="#fna1">1</a>]</div> | 1696 | <div class="footnote2" id="fn1" href="#fna1">[<a href="#fna1">1</a>]</div> |
1739 | <div class="footnote3"><span style="color:#035151" | 1697 | <div class="footnote3"><span style="color:#035151"><i>Time Machines</i></span> sind Konstrukte, in denen historische |
1740 | Daten verschiedenster Quellen zusammengeführt werden. Dadurch werden | 1698 | Daten verschiedenster Quellen zusammengeführt werden. Dadurch werden |
1743 | werden öffentlich zur Verfügung gestellt und können zur Forschung und Bildung | 1701 | werden öffentlich zur Verfügung gestellt und können zur Forschung und Bildung |
1744 | genutzt werden. Vgl. <a title="Frédéric Kaplan: The Venice Time Machine. In: DocEng ’15: Proceedings of the 2015 ACM Symposium on Document Engineering (DocEng, Lausanne, 08.–11.09.2015). New York 2015, S. | 1702 | genutzt werden. Vgl. <a title="Frédéric Kaplan: The Venice Time Machine. In: DocEng ’15: Proceedings of the 2015 ACM Symposium on Document Engineering (DocEng, Lausanne, 08.–11.09.2015). New York 2015, S. 73. DOI: 10.1145/2682571.2797071" href="#kaplan_venice_2015">Kaplan 2015</a>, S. 73.</div> |
1745 | </li><br><li class="footnote"> | 1703 | </li><br><li class="footnote"> |
1749 | <div class="footnote2" id="fn3" href="#fna3">[<a href="#fna3">3</a>]</div> | 1707 | <div class="footnote2" id="fn3" href="#fna3">[<a href="#fna3">3</a>]</div> |
1750 | <div class="footnote3"> Vgl. <a title="Saskia | 1708 | <div class="footnote3"> Vgl. <a title="Saskia Hin / Dalia A. Conde / Adam Lenart: New light on Roman census papyri through semi-automated record linkage. In: Historical Methods: A Journal of Quantitative and Interdisciplinary History 49 (2016), H. 1, S. 50–65. DOI: 10.1080/01615440.2015.1071226" href="#hin_roman_2016">Hin et al. 2016</a>, S. 50.</div> |
1751 | </li><br><li class="footnote"> | 1709 | </li><br><li class="footnote"> |
1753 | <div class="footnote3"> Vgl. <a title="James J. Feigenbaum: Automated census record linking: a machine learning approach. 2016. Handle: 2144/27526" href="#feigenbaum_census_2016">Feigenbaum 2016</a>; | 1711 | <div class="footnote3"> Vgl. <a title="James J. Feigenbaum: Automated census record linking: a machine learning approach. 2016. Handle: 2144/27526" href="#feigenbaum_census_2016">Feigenbaum 2016</a>; |
1754 | <a title="Saskia | 1712 | <a title="Saskia Hin / Dalia A. Conde / Adam Lenart: New light on Roman census papyri through semi-automated record linkage. In: Historical Methods: A Journal of Quantitative and Interdisciplinary History 49 (2016), H. 1, S. 50–65. DOI: 10.1080/01615440.2015.1071226" href="#hin_roman_2016">Hin et al. 2016</a>, S. 50, 52; |
1755 | <a title="Catherine G. Massey: Playing with matches: An assessment of accuracy in linked historical data. In: Historical Methods: A Journal of Quantitative and Interdisciplinary History 50 (2017), H. 3, S. | 1713 | <a title="Catherine G. Massey: Playing with matches: An assessment of accuracy in linked historical data. In: Historical Methods: A Journal of Quantitative and Interdisciplinary History 50 (2017), H. 3, S. 129–143. DOI: 10.1080/01615440.2017.1288598" href="#massey_playing_2017">Massey 2017</a>, S. 129, 131.</div> |
1756 | </li><br><li class="footnote"> | 1714 | </li><br><li class="footnote"> |
1757 | <div class="footnote2" id="fn5" href="#fna5">[<a href="#fna5">5</a>]</div> | 1715 | <div class="footnote2" id="fn5" href="#fna5">[<a href="#fna5">5</a>]</div> |
1758 | <div class="footnote3"> Vgl. <a title="Catherine G. Massey: Playing with matches: An assessment of accuracy in linked historical data. In: Historical Methods: A Journal of Quantitative and Interdisciplinary History 50 (2017), H. 3, S. | 1716 | <div class="footnote3"> Vgl. <a title="Catherine G. Massey: Playing with matches: An assessment of accuracy in linked historical data. In: Historical Methods: A Journal of Quantitative and Interdisciplinary History 50 (2017), H. 3, S. 129–143. DOI: 10.1080/01615440.2017.1288598" href="#massey_playing_2017">Massey 2017</a>, |
1759 | S. | 1717 | S. 130.</div> |
1760 | </li><br><li class="footnote"> | 1718 | </li><br><li class="footnote"> |
1761 | <div class="footnote2" id="fn6" href="#fna6">[<a href="#fna6">6</a>]</div> | 1719 | <div class="footnote2" id="fn6" href="#fna6">[<a href="#fna6">6</a>]</div> |
1762 | <div class="footnote3"> Vgl. <a title="Catherine G. Massey: Playing with matches: An assessment of accuracy in linked historical data. In: Historical Methods: A Journal of Quantitative and Interdisciplinary History 50 (2017), H. 3, S. | 1720 | <div class="footnote3"> Vgl. <a title="Catherine G. Massey: Playing with matches: An assessment of accuracy in linked historical data. In: Historical Methods: A Journal of Quantitative and Interdisciplinary History 50 (2017), H. 3, S. 129–143. DOI: 10.1080/01615440.2017.1288598" href="#massey_playing_2017">Massey 2017</a>, S. |
1763 | 129f.</div> | 1721 | 129f.</div> |
1770 | <div class="footnote2" id="fn8" href="#fna8">[<a href="#fna8">8</a>]</div> | 1728 | <div class="footnote2" id="fn8" href="#fna8">[<a href="#fna8">8</a>]</div> |
1771 | <div class="footnote3"> Als Einführung in die Grundlagen des Themas vgl. <a title="Lifang | 1729 | <div class="footnote3"> Als Einführung in die Grundlagen des Themas vgl. <a title="Lifang Gu / Rohan Baxter / Deanne Vickers / Chris Rainsford: Record Linkage: Current Practice and Future Directions. In: CMIS Technical Report 03/83 (2003). PDF. [online]" href="#gu_record_2003">Gu et al. |
1772 | 2003</a>.</div> | 1730 | 2003</a>.</div> |
1778 | auf die zeitliche Differenz zwischen diesen umgerechnet werden. Die besten | 1736 | auf die zeitliche Differenz zwischen diesen umgerechnet werden. Die besten |
1779 | Resultate erzielt sie mit probabilistischen Matching-Techniken. Vgl. <a title="Catherine G. Massey: Playing with matches: An assessment of accuracy in linked historical data. In: Historical Methods: A Journal of Quantitative and Interdisciplinary History 50 (2017), H. 3, S. | 1737 | Resultate erzielt sie mit probabilistischen Matching-Techniken. Vgl. <a title="Catherine G. Massey: Playing with matches: An assessment of accuracy in linked historical data. In: Historical Methods: A Journal of Quantitative and Interdisciplinary History 50 (2017), H. 3, S. 129–143. DOI: 10.1080/01615440.2017.1288598" href="#massey_playing_2017">Massey |
1780 | 2017</a>, S. | 1738 | 2017</a>, S. 129, 140.</div> |
1781 | </li><br><li class="footnote"> | 1739 | </li><br><li class="footnote"> |
1782 | <div class="footnote2" id="fn10" href="#fna10">[<a href="#fna10">10</a>]</div> | 1740 | <div class="footnote2" id="fn10" href="#fna10">[<a href="#fna10">10</a>]</div> |
1783 | <div class="footnote3"> Vgl. <a title="Corry Gellatly: Reconstructing Historical Populations from Genealogical Data Files. In: Population Reconstruction. Hg. von Gerrit | 1741 | <div class="footnote3"> Vgl. <a title="Corry Gellatly: Reconstructing Historical Populations from Genealogical Data Files. In: Population Reconstruction. Hg. von Gerrit Bloothooft / Peter Christen / Kees Mandemakers / Marijn Schraagen. Cham u. a. 2015, S. 111–128. DOI: 10.1007/978-3-319-19884-2_6" href="#gellatly_populations_2015">Gellatly 2015</a>, S. 114, 122.</div> |
1784 | </li><br><li class="footnote"> | 1742 | </li><br><li class="footnote"> |
1786 | <div class="footnote3"> Vgl. | 1744 | <div class="footnote3"> Vgl. |
1787 | <a title="Peter | 1745 | <a title="Peter Christen / Dinusha Vatsalan / Zhichun Fu: Advanced Record Linkage Methods and Privacy Aspects for Population Reconstruction. A Survey and Case Studies. In: Population Reconstruction. Hg. von Gerrit Bloothooft / Peter Christen / Kees Mandemakers / Marijn Schraagen. Cham u. a. 2015, S. 87–110. DOI: 10.1007/978-3-319-19884-2_5" href="#christian_record_2015">Christen et al. 2015</a>, S. 87.</div> |
1788 | </li><br><li class="footnote"> | 1746 | </li><br><li class="footnote"> |
1790 | <div class="footnote3"> | 1748 | <div class="footnote3"> |
1791 | Vgl. <a title="Kleanthi | 1749 | Vgl. <a title="Kleanthi Georgala / Benjamin van der Burgh / Marvin Meeng / Arno Knobbe: Record Linkage in Medieval and Early Modern Text. In: Population Reconstruction. Hg. von Gerrit Bloothooft / Peter Christen / Kees Mandemakers / Marijn Schraagen. Cham u. a. 2015, S. 173–195. DOI: 10.1007/978-3-319-19884-2_9" href="#georgala_record_2015">Georgala et al. 2015</a>, S. 173.</div> |
1792 | </li><br><li class="footnote"> | 1750 | </li><br><li class="footnote"> |
1793 | <div class="footnote2" id="fn13" href="#fna13">[<a href="#fna13">13</a>]</div> | 1751 | <div class="footnote2" id="fn13" href="#fna13">[<a href="#fna13">13</a>]</div> |
1794 | <div class="footnote3"> Vgl. <a title="Rohan | 1752 | <div class="footnote3"> Vgl. <a title="Rohan Baxter / Peter Christen / Tim Churches: A Comparison of Fast Blocking Methods for Record Linkage. 2003. PDF. [online]" href="#baxter_methods_2003">Baxter et al. |
1795 | 2003</a>, S. | 1753 | 2003</a>, S. 2.</div> |
1796 | </li><br><li class="footnote"> | 1754 | </li><br><li class="footnote"> |
1800 | Restriktionen einbeziehe, beispielsweise des möglichen | 1758 | Restriktionen einbeziehe, beispielsweise des möglichen |
1801 | Schwangerschaftszeitraums der Frau. Vgl. <a title="Charini | 1759 | Schwangerschaftszeitraums der Frau. Vgl. <a title="Charini Nanayakkara / Peter Christen / Thilina Ranbaduge: Temporal graph-based clustering for historical record linkage. In: Proceedings of 14th International Workshop on Mining and Learning with Graphs (MLG 14, London, 20.08.2018). New York 2018. PDF. [online]" href="#nanayakkara_clustering_2018">Nanayakkara et al. |
1802 | 2018</a>.</div> | 1760 | 2018</a>.</div> |
1804 | <div class="footnote2" id="fn15" href="#fna15">[<a href="#fna15">15</a>]</div> | 1762 | <div class="footnote2" id="fn15" href="#fna15">[<a href="#fna15">15</a>]</div> |
1805 | <div class="footnote3"> Vgl. <a title="Corry Gellatly: Reconstructing Historical Populations from Genealogical Data Files. In: Population Reconstruction. Hg. von Gerrit | 1763 | <div class="footnote3"> Vgl. <a title="Corry Gellatly: Reconstructing Historical Populations from Genealogical Data Files. In: Population Reconstruction. Hg. von Gerrit Bloothooft / Peter Christen / Kees Mandemakers / Marijn Schraagen. Cham u. a. 2015, S. 111–128. DOI: 10.1007/978-3-319-19884-2_6" href="#gellatly_populations_2015">Gellatly 2015</a>, S. 116.</div> |
1806 | </li><br><li class="footnote"> | 1764 | </li><br><li class="footnote"> |
1807 | <div class="footnote2" id="fn16" href="#fna16">[<a href="#fna16">16</a>]</div> | 1765 | <div class="footnote2" id="fn16" href="#fna16">[<a href="#fna16">16</a>]</div> |
1808 | <div class="footnote3"> Vgl. <a title="Corry Gellatly: Reconstructing Historical Populations from Genealogical Data Files. In: Population Reconstruction. Hg. von Gerrit | 1766 | <div class="footnote3"> Vgl. <a title="Corry Gellatly: Reconstructing Historical Populations from Genealogical Data Files. In: Population Reconstruction. Hg. von Gerrit Bloothooft / Peter Christen / Kees Mandemakers / Marijn Schraagen. Cham u. a. 2015, S. 111–128. DOI: 10.1007/978-3-319-19884-2_6" href="#gellatly_populations_2015">Gellatly 2015</a>, S. 122f.</div> |
1809 | </li><br><li class="footnote"> | 1767 | </li><br><li class="footnote"> |
1810 | <div class="footnote2" id="fn17" href="#fna17">[<a href="#fna17">17</a>]</div> | 1768 | <div class="footnote2" id="fn17" href="#fna17">[<a href="#fna17">17</a>]</div> |
1811 | <div class="footnote3"> Vgl. <a title="Julia | 1769 | <div class="footnote3"> Vgl. <a title="Julia Efremova / Bijan Ranjbar-Sahraei / Hossein Rahmani / Frans A. Oliehoek / Toon Calders / Karl Tuyls / Gerhard Weiss: Multi-Source Entity Resolution for Genealogical Data. In: Population Reconstruction. Hg. von Gerrit Bloothooft / Peter Christen / Kees Mandemakers / Marijn Schraagen. Cham u. a. 2015, S. 129–154. DOI: 10.1007/978-3-319-19884-2_7" href="#efremova_entity_2015">Efremova et al. 2015</a>.</div> |
1812 | </li><br><li class="footnote"> | 1770 | </li><br><li class="footnote"> |
1813 | <div class="footnote2" id="fn18" href="#fna18">[<a href="#fna18">18</a>]</div> | 1771 | <div class="footnote2" id="fn18" href="#fna18">[<a href="#fna18">18</a>]</div> |
1814 | <div class="footnote3"> Vgl. <a title="Gunnar | 1772 | <div class="footnote3"> Vgl. <a title="Gunnar Thorvaldsen / Andersen Trygve / Hilde L. Sommerseth: Record Linkage in the Historical Population Register for Norway. In: Population Reconstruction. Hg. von Gerrit Bloothooft / Peter Christen / Kees Mandemakers / Marijn Schraagen. Cham u. a. 2015, S. 155–171. DOI: 10.1007/978-3-319-19884-2_8" href="#thorvaldsen_record_2015">Thorvaldsen et al. 2015</a>, S. |
1815 | 163f.</div> | 1773 | 163f.</div> |
1817 | <div class="footnote2" id="fn19" href="#fna19">[<a href="#fna19">19</a>]</div> | 1775 | <div class="footnote2" id="fn19" href="#fna19">[<a href="#fna19">19</a>]</div> |
1818 | <div class="footnote3"> Vgl. <a title="Gunnar | 1776 | <div class="footnote3"> Vgl. <a title="Gunnar Thorvaldsen / Andersen Trygve / Hilde L. Sommerseth: Record Linkage in the Historical Population Register for Norway. In: Population Reconstruction. Hg. von Gerrit Bloothooft / Peter Christen / Kees Mandemakers / Marijn Schraagen. Cham u. a. 2015, S. 155–171. DOI: 10.1007/978-3-319-19884-2_8" href="#thorvaldsen_record_2015">Thorvaldsen et al. 2015</a>, S. |
1819 | 168.</div> | 1777 | 168.</div> |
1821 | <div class="footnote2" id="fn20" href="#fna20">[<a href="#fna20">20</a>]</div> | 1779 | <div class="footnote2" id="fn20" href="#fna20">[<a href="#fna20">20</a>]</div> |
1822 | <div class="footnote3"> Vgl. <a title="Kleanthi | 1780 | <div class="footnote3"> Vgl. <a title="Kleanthi Georgala / Benjamin van der Burgh / Marvin Meeng / Arno Knobbe: Record Linkage in Medieval and Early Modern Text. In: Population Reconstruction. Hg. von Gerrit Bloothooft / Peter Christen / Kees Mandemakers / Marijn Schraagen. Cham u. a. 2015, S. 173–195. DOI: 10.1007/978-3-319-19884-2_9" href="#georgala_record_2015">Georgala et al. 2015</a>, S. 187.</div> |
1823 | </li><br><li class="footnote"> | 1781 | </li><br><li class="footnote"> |
1837 | <div class="footnote2" id="fn24" href="#fna24">[<a href="#fna24">24</a>]</div> | 1795 | <div class="footnote2" id="fn24" href="#fna24">[<a href="#fna24">24</a>]</div> |
1838 | <div class="footnote3">Vgl. <a title="Antonin Delpeuch / Adrian Pohl / Fabian Steeg / Thad Guidry Sr. / Osma Suominen: Reconciliation Service API v0.2. A Protocol for Data Matching on the Web. Final Community Group Report. 10.04.2023. HTML. [online]" href="#delpeuch_reconciliation_2023">Delpeuch et al. 2023</a>.</div> | 1796 | <div class="footnote3"> Vgl. |
1797 | <a title="Ran Abramitzky / Leah Boustan / Katherine Eriksson / James Feigenbaum / Santiago Pérez: Automated Linking of Historical Data. In: Journal of Economic Literature 59 (2021), H. 3, S. 865–918. DOI: 10.1257/jel.20201599" href="#abramitzky_linking_2021">Abramitzky et al. 2021</a>.</div> | ||
1839 | </li><br><li class="footnote"> | 1798 | </li><br><li class="footnote"> |
1840 | <div class="footnote2" id="fn25" href="#fna25">[<a href="#fna25">25</a>]</div> | 1799 | <div class="footnote2" id="fn25" href="#fna25">[<a href="#fna25">25</a>]</div> |
1841 | <div class="footnote3"> Vgl. | 1800 | <div class="footnote3"> Vgl. <a title="Ran Abramitzky / Leah Boustan / Katherine Eriksson / James Feigenbaum / Santiago Pérez: Automated Linking of Historical Data. In: Journal of Economic Literature 59 (2021), H. 3, S. 865–918. DOI: 10.1257/jel.20201599" href="#abramitzky_linking_2021">Abramitzky et al. 2021</a>, S. 865.</div> |
1842 | <a title="Ran Abramitzky / Leah Boustan / Katherine Eriksson / James Feigenbaum / Santiago Pérez: Automated Linking of Historical Data. In: Journal of Economic Literature 59 (2021), H. 3, S. 865–918. DOI: 10.1257/jel.20201599" href="#abramitzky_linking_2021">Abramitzky et al. 2021</a>.</div> | ||
1843 | </li><br><li class="footnote"> | 1801 | </li><br><li class="footnote"> |
1844 | <div class="footnote2" id="fn26" href="#fna26">[<a href="#fna26">26</a>]</div> | 1802 | <div class="footnote2" id="fn26" href="#fna26">[<a href="#fna26">26</a>]</div> |
1845 | <div class="footnote3"> Vgl. <a title="Ran | 1803 | <div class="footnote3"> Vgl. <a title="Ran Abramitzky / Roy Mill / Santiago Pérez: Linking individuals across historical sources: A fully automated approach. In: Historical Methods: A Journal of Quantitative and Interdisciplinary History 53 (2020), H. 2, S. 94–111. DOI: 10.1080/01615440.2018.1543034" href="#abramitzky_linking_2020">Abramitzky et al. 2020</a>, S. 94.</div> |
1846 | </li><br><li class="footnote"> | 1804 | </li><br><li class="footnote"> |
1847 | <div class="footnote2" id="fn27" href="#fna27">[<a href="#fna27">27</a>]</div> | 1805 | <div class="footnote2" id="fn27" href="#fna27">[<a href="#fna27">27</a>]</div> |
1848 | <div class="footnote3"> Vgl. <a title="Ran Abramitzky / Roy Mill / Santiago Pérez: Linking individuals across historical sources: A fully automated approach. In: Historical Methods: A Journal of Quantitative and Interdisciplinary History 53 (2020), H. 2, S. 94–111. DOI: 10.1080/01615440.2018.1543034" href="#abramitzky_linking_2020">Abramitzky et al. 2020</a>, S. 94.</div> | ||
1849 | </li><br><li class="footnote"> | ||
1850 | <div class="footnote2" id="fn28" href="#fna28">[<a href="#fna28">28</a>]</div> | ||
1851 | <div class="footnote3"> Dieses stellt zugleich | 1806 | <div class="footnote3"> Dieses stellt zugleich |
1853 | Record-Linkage-Algorithmen in der ökonomischen Forschung dar. Vgl. | 1808 | Record-Linkage-Algorithmen in der ökonomischen Forschung dar. Vgl. |
1854 | <a title="Ran Abramitzky / Roy Mill / Santiago Pérez: Linking individuals across historical sources: A fully automated approach. In: Historical Methods: A Journal of Quantitative and Interdisciplinary History 53 (2020), H. 2, S. 94–111. DOI: 10.1080/01615440.2018.1543034" href="#abramitzky_linking_2020">Abramitzky et al. 2020</a>, S. 106f.</div> | 1809 | <a title="Ran Abramitzky / Roy Mill / Santiago Pérez: Linking individuals across historical sources: A fully automated approach. In: Historical Methods: A Journal of Quantitative and Interdisciplinary History 53 (2020), H. 2, S. 94–111. DOI: 10.1080/01615440.2018.1543034" href="#abramitzky_linking_2020">Abramitzky et al. 2020</a>, S. 106f.</div> |
1810 | </li><br><li class="footnote"> | ||
1811 | <div class="footnote2" id="fn28" href="#fna28">[<a href="#fna28">28</a>]</div> | ||
1812 | <div class="footnote3"> | ||
1813 | Efremova et al. nennen beispielsweise Variablen, die sie aus der Analyse von | ||
1814 | Geburts-, Todes- und Heiratsdokumenten erhalten. Vgl. <a title="Julia Efremova / Bijan Ranjbar-Sahraei / Hossein Rahmani / Frans A. Oliehoek / Toon Calders / Karl Tuyls / Gerhard Weiss: Multi-Source Entity Resolution for Genealogical Data. In: Population Reconstruction. Hg. von Gerrit Bloothooft / Peter Christen / Kees Mandemakers / Marijn Schraagen. Cham u. a. 2015, S. 129–154. DOI: 10.1007/978-3-319-19884-2_7" href="#efremova_entity_2015">Efremova et al. 2015</a>, | ||
1815 | S. 132.</div> | ||
1855 | </li><br><li class="footnote"> | 1816 | </li><br><li class="footnote"> |
1856 | <div class="footnote2" id="fn29" href="#fna29">[<a href="#fna29">29</a>]</div> | 1817 | <div class="footnote2" id="fn29" href="#fna29">[<a href="#fna29">29</a>]</div> |
1857 | <div class="footnote3"> | 1818 | <div class="footnote3"> Vgl. <a title="Corry Gellatly: Reconstructing Historical Populations from Genealogical Data Files. In: Population Reconstruction. Hg. von Gerrit Bloothooft / Peter Christen / Kees Mandemakers / Marijn Schraagen. Cham u. a. 2015, S. 111–128. DOI: 10.1007/978-3-319-19884-2_6" href="#gellatly_populations_2015">Gellatly 2015</a>, S. |
1858 | Efremova et al. nennen beispielsweise Variablen, die sie aus der Analyse von | 1819 | 112; <a title="J. Tuomas Harviainen / Bo-Christer Björk: Genealogy, GEDCOM, and popularity implications. In: Informaatiotutkimus 37 (2018), H. 3, S. 4–14. DOI: 10.23978/inf.76066" href="#harviainen_genealogy_2018">Harviainen / Björk 2018</a>, S. 4.</div> |
1859 | Geburts-, Todes- und Heiratsdokumenten erhalten. Vgl. <a title="Julia Efremova / Bijan Ranjbar-Sahraei / Hossein Rahmani / Frans A. Oliehoek / Toon Calders / Karl Tuyls / Gerhard Weiss: Multi-Source Entity Resolution for Genealogical Data. In: Population Reconstruction. Hg. von Gerrit Bloothooft / Peter Christen / Kees Mandemakers / Marijn Schraagen. Cham u. a. 2015, S. 129–154. DOI: 10.1007/978-3-319-19884-2_7" href="#efremova_entity_2015">Efremova et al. 2015</a>, | ||
1860 | S. 132.</div> | ||
1861 | </li><br><li class="footnote"> | 1820 | </li><br><li class="footnote"> |
1862 | <div class="footnote2" id="fn30" href="#fna30">[<a href="#fna30">30</a>]</div> | 1821 | <div class="footnote2" id="fn30" href="#fna30">[<a href="#fna30">30</a>]</div> |
1863 | <div class="footnote3"> Vgl. <a title="Corry Gellatly: Reconstructing Historical Populations from Genealogical Data Files. In: Population Reconstruction. Hg. von Gerrit Bloothooft / Peter Christen / Kees Mandemakers / Marijn Schraagen. Cham u. a. 2015, S. 111–128. DOI: 10.1007/978-3-319-19884-2_6" href="#gellatly_populations_2015">Gellatly 2015</a>, S. | ||
1864 | 112; <a title="J. Tuomas Harviainen / Bo-Christer Björk: Genealogy, GEDCOM, and popularity implications. In: Informaatiotutkimus 37 (2018), H. 3, S. 4–14. DOI: 10.23978/inf.76066" href="#harviainen_genealogy_2018">Harviainen / Björk 2018</a>, S. 4.</div> | ||
1865 | </li><br><li class="footnote"> | ||
1866 | <div class="footnote2" id="fn31" href="#fna31">[<a href="#fna31">31</a>]</div> | ||
1867 | <div class="footnote3"> Vgl. <a title="The Church of Jesus Christ of Latter-day Saints: The GEDCOM Standard. Salt Lake City 2019. Release 5.5.1. vom 15.11.2019. PDF. [online]" href="#church_gedcom_2019">The Church of Jesus | 1822 | <div class="footnote3"> Vgl. <a title="The Church of Jesus Christ of Latter-day Saints: The GEDCOM Standard. Salt Lake City 2019. Release 5.5.1. vom 15.11.2019. PDF. [online]" href="#church_gedcom_2019">The Church of Jesus |
1869 | </li><br><li class="footnote"> | 1824 | </li><br><li class="footnote"> |
1825 | <div class="footnote2" id="fn31" href="#fna31">[<a href="#fna31">31</a>]</div> | ||
1826 | <div class="footnote3"> Vgl. | ||
1827 | <a title="Verein für Computergenealogie (2016a): Gedbas4all / Datenmodell. In: GenWiki. Das Genealogie-Wiki. 2016. HTML. [online]" href="#vfc_datenmodell_2016">Verein für Computergenealogie 2016a</a>.</div> | ||
1828 | </li><br><li class="footnote"> | ||
1870 | <div class="footnote2" id="fn32" href="#fna32">[<a href="#fna32">32</a>]</div> | 1829 | <div class="footnote2" id="fn32" href="#fna32">[<a href="#fna32">32</a>]</div> |
1871 | <div class="footnote3"> Vgl. | 1830 | <div class="footnote3"> Vgl. <a title="Verein für Computergenealogie (2016b): Gedbas4all / Datumsangaben. In: GenWiki. Das Genealogie-Wiki. 2016. HTML. [online]" href="#vfc_datumsangaben_2016">Verein für |
1872 | | 1831 | Computergenealogie 2016b</a>.</div> |
1873 | </li><br><li class="footnote"> | 1832 | </li><br><li class="footnote"> |
1874 | <div class="footnote2" id="fn33" href="#fna33">[<a href="#fna33">33</a>]</div> | 1833 | <div class="footnote2" id="fn33" href="#fna33">[<a href="#fna33">33</a>]</div> |
1875 | <div class="footnote3"> Vgl. <a title="Verein für Computergenealogie (2016b): Gedbas4all / Datumsangaben. In: GenWiki. Das Genealogie-Wiki. 2016. HTML. [online]" href="#vfc_datumsangaben_2016">Verein für | ||
1876 | Computergenealogie 2016b</a>.</div> | ||
1877 | </li><br><li class="footnote"> | ||
1878 | <div class="footnote2" id="fn34" href="#fna34">[<a href="#fna34">34</a>]</div> | ||
1879 | <div class="footnote3"> In | 1834 | <div class="footnote3"> In |
1889 | </li><br><li class="footnote"> | 1844 | </li><br><li class="footnote"> |
1890 | <div class="footnote2" id=" | 1845 | <div class="footnote2" id="fn34" href="#fna34">[<a href="#fna34">34</a>]</div> |
1891 | <div class="footnote3"> Sollten mehr als zwei Datensätze | 1846 | <div class="footnote3"> Sollten mehr als zwei Datensätze |
1897 | </li><br><li class="footnote"> | 1852 | </li><br><li class="footnote"> |
1898 | <div class="footnote2" id=" | 1853 | <div class="footnote2" id="fn35" href="#fna35">[<a href="#fna35">35</a>]</div> |
1899 | <div class="footnote3"> Vgl. | 1854 | <div class="footnote3"> Vgl. |
1901 | </li><br><li class="footnote"> | 1856 | </li><br><li class="footnote"> |
1902 | <div class="footnote2" id=" | 1857 | <div class="footnote2" id="fn36" href="#fna36">[<a href="#fna36">36</a>]</div> |
1903 | <div class="footnote3"> Ortsangaben | 1858 | <div class="footnote3"> Ortsangaben |
1914 | Bevölkerung ist es wahrscheinlicher, dass Lebensereignisse in einer | 1869 | Bevölkerung ist es wahrscheinlicher, dass Lebensereignisse in einer |
1915 | begrenzten geografischen Distanz stattgefunden haben. Vgl. <a title="Jürgen | 1870 | begrenzten geografischen Distanz stattgefunden haben. Vgl. <a title="Jürgen Bähr / Christoph Jentsch / Wolfgang Kuls: Bevölkerungsgeographie. Berlin u. a. 1992. (= Lehrbuch der allgemeinen Geographie, 9)." href="#baehr_bevoelkerungsgeographie_1992">Bähr et al. |
1916 | 1992</a>; <a title="Jürgen | 1871 | 1992</a>; <a title="Jürgen Kocka / Karl Ditt / Josef Mooser / Heinz Reif / Reinhard Schüren: Familie und soziale Platzierung. Studien zum Verhältnis von Familie, sozialer Mobilität und Heiratsverhalten an westfälischen Beispielen im späten 18. und 19. Jahrhundert. Wiesbaden 1980 (= Forschungsberichte des Landes Nordrhein-Westfalen, 2953). DOI: 10.1007/978-3-322-87746-8" href="#kocka_familie_1980">Kocka et al. 1980</a>. Für den Erfolg eines Record Linkage kann es also |
1917 | auch relevant sein, ob Orte geografisch nah beieinander zu finden sind. | 1872 | auch relevant sein, ob Orte geografisch nah beieinander zu finden sind. |
1918 | Vgl. <a title="Julia | 1873 | Vgl. <a title="Julia Efremova / Bijan Ranjbar-Sahraei / Hossein Rahmani / Frans A. Oliehoek / Toon Calders / Karl Tuyls / Gerhard Weiss: Multi-Source Entity Resolution for Genealogical Data. In: Population Reconstruction. Hg. von Gerrit Bloothooft / Peter Christen / Kees Mandemakers / Marijn Schraagen. Cham u. a. 2015, S. 129–154. DOI: 10.1007/978-3-319-19884-2_7" href="#efremova_entity_2015">Efremova et al. 2015</a>, S. 135, 139–141. Die Aufbereitung der Ortsangaben |
1919 | kann an den von Goldberg definierten, auf den deutschen Sprachraum | 1874 | kann an den von Goldberg definierten, auf den deutschen Sprachraum |
1923 | </li><br><li class="footnote"> | 1878 | </li><br><li class="footnote"> |
1924 | <div class="footnote2" id=" | 1879 | <div class="footnote2" id="fn37" href="#fna37">[<a href="#fna37">37</a>]</div> |
1925 | <div class="footnote3"> In der deutschen Sprache enden Frauennamen traditionell | 1880 | <div class="footnote3"> In der deutschen Sprache enden Frauennamen traditionell |
1931 | </li><br><li class="footnote"> | 1886 | </li><br><li class="footnote"> |
1887 | <div class="footnote2" id="fn38" href="#fna38">[<a href="#fna38">38</a>]</div> | ||
1888 | <div class="footnote3"> Zur | ||
1889 | Separierung solcher berufsfernen Angaben kann auf <a title="Jan Michael Goldberg / Katrin Moeller: Automatisierte Identifikation und Lemmatisierung historischer Berufsbezeichnungen in deutschsprachigen Datenbeständen. In: Zeitschrift für digitale Geisteswissenschaften 7 (2022). 08.03.2022. DOI: 10.17175/2022_002" href="#goldberg_identifikation_2022">Goldberg / Moeller 2022</a> hingewiesen werden, die Kriterien zur Bereinigung von Berufsangaben aufstellen.</div> | ||
1890 | </li><br><li class="footnote"> | ||
1932 | <div class="footnote2" id="fn39" href="#fna39">[<a href="#fna39">39</a>]</div> | 1891 | <div class="footnote2" id="fn39" href="#fna39">[<a href="#fna39">39</a>]</div> |
1933 | <div class="footnote3"> Zur | 1892 | <div class="footnote3"> 2<sup>30</sup> = 1.073.741.824.</div> |
1934 | Separierung solcher berufsfernen Angaben kann auf <a title="Jan Michael Goldberg / Katrin Moeller: Automatisierte Identifikation und Lemmatisierung historischer Berufsbezeichnungen in deutschsprachigen Datenbeständen. In: Zeitschrift für digitale Geisteswissenschaften 7 (2022). 08.03.2022. DOI: 10.17175/2022_002" href="#goldberg_identifikation_2022">Goldberg / Moeller 2022</a> hingewiesen werden, die Kriterien zur Bereinigung von Berufsangaben aufstellen.</div> | ||
1935 | </li><br><li class="footnote"> | 1893 | </li><br><li class="footnote"> |
1936 | <div class="footnote2" id="fn40" href="#fna40">[<a href="#fna40">40</a>]</div> | 1894 | <div class="footnote2" id="fn40" href="#fna40">[<a href="#fna40">40</a>]</div> |
1937 | <div class="footnote3"> | 1895 | <div class="footnote3"> 1.073.741.824<sup>2</sup> = 1.152.921.504.606.850.000.</div> |
1938 | </li><br><li class="footnote"> | 1896 | </li><br><li class="footnote"> |
1939 | <div class="footnote2" id="fn41" href="#fna41">[<a href="#fna41">41</a>]</div> | 1897 | <div class="footnote2" id="fn41" href="#fna41">[<a href="#fna41">41</a>]</div> |
1940 | <div class="footnote3"> 1.073.741.824<sup>2</sup> = 1.152.921.504.606.850.000.</div> | 1898 | <div class="footnote3"> Sonderformen bei einzelnen |
1899 | Glaubensgemeinschaften, z. B. die Totentaufe der Mormonen, bleiben | ||
1900 | unberücksichtigt.</div> | ||
1941 | </li><br><li class="footnote"> | 1901 | </li><br><li class="footnote"> |
1942 | <div class="footnote2" id="fn42" href="#fna42">[<a href="#fna42">42</a>]</div> | 1902 | <div class="footnote2" id="fn42" href="#fna42">[<a href="#fna42">42</a>]</div> |
1943 | <div class="footnote3"> Sonderformen bei einzelnen | ||
1944 | Glaubensgemeinschaften, z. B. die Totentaufe der Mormonen, bleiben | ||
1945 | unberücksichtigt.</div> | ||
1946 | </li><br><li class="footnote"> | ||
1947 | <div class="footnote2" id="fn43" href="#fna43">[<a href="#fna43">43</a>]</div> | ||
1948 | <div class="footnote3"> Der Vergleich darf sich aber nicht nur auf einzelne Vornamen | 1903 | <div class="footnote3"> Der Vergleich darf sich aber nicht nur auf einzelne Vornamen |
1956 | </li><br><li class="footnote"> | 1911 | </li><br><li class="footnote"> |
1957 | <div class="footnote2" id=" | 1912 | <div class="footnote2" id="fn43" href="#fna43">[<a href="#fna43">43</a>]</div> |
1958 | <div class="footnote3"> Beispielsweise ist eine Person, die als | 1913 | <div class="footnote3"> Beispielsweise ist eine Person, die als |
1963 | </li><br><li class="footnote"> | 1918 | </li><br><li class="footnote"> |
1964 | <div class="footnote2" id=" | 1919 | <div class="footnote2" id="fn44" href="#fna44">[<a href="#fna44">44</a>]</div> |
1965 | <div class="footnote3"> Die hier definierten Regeln | 1920 | <div class="footnote3"> Die hier definierten Regeln |
1968 | </li><br><li class="footnote"> | 1923 | </li><br><li class="footnote"> |
1969 | <div class="footnote2" id=" | 1924 | <div class="footnote2" id="fn45" href="#fna45">[<a href="#fna45">45</a>]</div> |
1970 | <div class="footnote3"> Wenn für | 1925 | <div class="footnote3"> Wenn für |
1975 | </li><br><li class="footnote"> | 1930 | </li><br><li class="footnote"> |
1976 | <div class="footnote2" id=" | 1931 | <div class="footnote2" id="fn46" href="#fna46">[<a href="#fna46">46</a>]</div> |
1977 | <div class="footnote3"> | 1932 | <div class="footnote3"> |
1981 | </li><br><li class="footnote"> | 1936 | </li><br><li class="footnote"> |
1937 | <div class="footnote2" id="fn47" href="#fna47">[<a href="#fna47">47</a>]</div> | ||
1938 | <div class="footnote3"> Vgl. <a title="Kleanthi Georgala / Benjamin van der Burgh / Marvin Meeng / Arno Knobbe: Record Linkage in Medieval and Early Modern Text. In: Population Reconstruction. Hg. von Gerrit Bloothooft / Peter Christen / Kees Mandemakers / Marijn Schraagen. Cham u. a. 2015, S. 173–195. DOI: 10.1007/978-3-319-19884-2_9" href="#georgala_record_2015">Georgala et al. 2015</a>, S. | ||
1939 | 187.</div> | ||
1940 | </li><br><li class="footnote"> | ||
1982 | <div class="footnote2" id="fn48" href="#fna48">[<a href="#fna48">48</a>]</div> | 1941 | <div class="footnote2" id="fn48" href="#fna48">[<a href="#fna48">48</a>]</div> |
1983 | <div class="footnote3"> | 1942 | <div class="footnote3"> Receiver Operating Characteristic, vgl. <a title="Jerome Fan / Suneel Upadhye / Andrew Worster: Understanding receiver operating characteristic (ROC) curves. In: Canadian Journal of Emergency Medicine 8 (2006), H. 1, S. 19–20. DOI: 10.1017/S1481803500013336" href="#fan_understanding_2006">Fan et al. |
1984 | | 1943 | 2006</a>.</div> |
1985 | </li><br><li class="footnote"> | 1944 | </li><br><li class="footnote"> |
1986 | <div class="footnote2" id="fn49" href="#fna49">[<a href="#fna49">49</a>]</div> | 1945 | <div class="footnote2" id="fn49" href="#fna49">[<a href="#fna49">49</a>]</div> |
1987 | <div class="footnote3"> Receiver Operating Characteristic, vgl. <a title="Jerome Fan / Suneel Upadhye / Andrew Worster: Understanding receiver operating characteristic (ROC) curves. In: Canadian Journal of Emergency Medicine 8 (2006), H. 1, S. 19–20. DOI: 10.1017/S1481803500013336" href="#fan_understanding_2006">Fan et al. | 1946 | <div class="footnote3"> Vgl. <a title="Kleanthi Georgala / Benjamin van der Burgh / Marvin Meeng / Arno Knobbe: Record Linkage in Medieval and Early Modern Text. In: Population Reconstruction. Hg. von Gerrit Bloothooft / Peter Christen / Kees Mandemakers / Marijn Schraagen. Cham u. a. 2015, S. 173–195. DOI: 10.1007/978-3-319-19884-2_9" href="#georgala_record_2015">Georgala et al. 2015</a>, S. 185.</div> |
1988 | 2006</a>.</div> | ||
1989 | </li><br><li class="footnote"> | 1947 | </li><br><li class="footnote"> |
1990 | <div class="footnote2" id="fn50" href="#fna50">[<a href="#fna50">50</a>]</div> | 1948 | <div class="footnote2" id="fn50" href="#fna50">[<a href="#fna50">50</a>]</div> |
1991 | <div class="footnote3"> Vgl. <a title=" | 1949 | <div class="footnote3"> Vgl. <a title="Hans Joachim Postel: Die Kölner Phonetik. Ein Verfahren zur Identifizierung von Personennamen auf der Grundlage der Gestaltanalyse. In: IBM-Nachrichten 19 (1969), S. 925–931." href="#postel_phonetik_1969">Postel 1969</a>, S. 928.</div> |
1992 | </li><br><li class="footnote"> | 1950 | </li><br><li class="footnote"> |
1993 | <div class="footnote2" id="fn51" href="#fna51">[<a href="#fna51">51</a>]</div> | 1951 | <div class="footnote2" id="fn51" href="#fna51">[<a href="#fna51">51</a>]</div> |
1994 | <div class="footnote3"> Vgl. <a title=" | 1952 | <div class="footnote3"> Vgl. <a title="Günther Schönfelder / Michael Börngen: Naturräumliche Grundlagen. Landschaft und Klima. In: Geschichte der Stadt Leipzig. Hg. von Uwe John / Enno Bünz. 4 Bde. Leipzig 2015–2019. Bd. 1 (2015): Von den Anfängen bis zur Reformation, S. 33–47." href="#schoenfelder_grundlagen_2015">Schönfelder / Börngen 2015</a>, S. 39.</div> |
1995 | </li><br><li class="footnote"> | 1953 | </li><br><li class="footnote"> |
1996 | <div class="footnote2" id="fn52" href="#fna52">[<a href="#fna52">52</a>]</div> | 1954 | <div class="footnote2" id="fn52" href="#fna52">[<a href="#fna52">52</a>]</div> |
1997 | <div class="footnote3"> Vgl. <a title="Günther Schönfelder / Michael Börngen: Naturräumliche Grundlagen. Landschaft und Klima. In: Geschichte der Stadt Leipzig. Hg. von Uwe John / Enno Bünz. 4 Bde. Leipzig 2015–2019. Bd. 1 (2015): Von den Anfängen bis zur Reformation, S. 33–47." href="#schoenfelder_grundlagen_2015">Schönfelder / Börngen 2015</a>, S. 39.</div> | ||
1998 | </li><br><li class="footnote"> | ||
1999 | <div class="footnote2" id="fn53" href="#fna53">[<a href="#fna53">53</a>]</div> | ||
2000 | <div class="footnote3"> Bei der KLK ist vor allem | 1955 | <div class="footnote3"> Bei der KLK ist vor allem |
2003 | </li><br><li class="footnote"> | 1958 | </li><br><li class="footnote"> |
2004 | <div class="footnote2" id=" | 1959 | <div class="footnote2" id="fn53" href="#fna53">[<a href="#fna53">53</a>]</div> |
2005 | <div class="footnote3"><a title="Martin Munke: Citizen | 1960 | <div class="footnote3"><a title="Martin Munke: Citizen Science / Bürgerwissenschaft. Projekte, Probleme, Perspektiven am Beispiel Sachsen. In: Forschungsdesign 4.0. Datengenerierung und Wissenstransfer in interdisziplinärer Perspektive. Hg. von Jens Klingner / Merve Lühr (Dresden, 19.–21.04.2018). Dresden 2019, S. 107–124. DOI: 10.25366/2019.11" href="#munke_citizen_2019">Munke 2019</a>, S. 118. |
2006 | Personen innerhalb der KLF können also doppelt vorkommen, indem sie auf | 1961 | Personen innerhalb der KLF können also doppelt vorkommen, indem sie auf |
2011 | </li><br><li class="footnote"> | 1966 | </li><br><li class="footnote"> |
2012 | <div class="footnote2" id=" | 1967 | <div class="footnote2" id="fn54" href="#fna54">[<a href="#fna54">54</a>]</div> |
2013 | <div class="footnote3"> Für eine | 1968 | <div class="footnote3"> Für eine |
2016 | </li><br><li class="footnote"> | 1971 | </li><br><li class="footnote"> |
2017 | <div class="footnote2" id=" | 1972 | <div class="footnote2" id="fn55" href="#fna55">[<a href="#fna55">55</a>]</div> |
2018 | <div class="footnote3"><a href="http://des.genealogy.net/karteiLeipzigerFamilien/search/index" target="_blank">Online durchsuchbar</a>, vgl. <a title="Verein für Computergenealogie: Kartei Leipziger Familien. In: GenWiki. Das Genealogie-Wiki. 2018–2019. HTML. [online]" href="#vfc_kartei_2018">Verein für Computergenealogie | 1973 | <div class="footnote3"><a href="http://des.genealogy.net/karteiLeipzigerFamilien/search/index" target="_blank">Online durchsuchbar</a>, vgl. <a title="Verein für Computergenealogie: Kartei Leipziger Familien. In: GenWiki. Das Genealogie-Wiki. 2018–2019. HTML. [online]" href="#vfc_kartei_2018">Verein für Computergenealogie |
2020 | </li><br><li class="footnote"> | 1975 | </li><br><li class="footnote"> |
2021 | <div class="footnote2" id=" | 1976 | <div class="footnote2" id="fn56" href="#fna56">[<a href="#fna56">56</a>]</div> |
2022 | <div class="footnote3"> Erwähnenswert ist, dass nicht jedes Feld einen Eintrag | 1977 | <div class="footnote3"> Erwähnenswert ist, dass nicht jedes Feld einen Eintrag |
2025 | </li><br><li class="footnote"> | 1980 | </li><br><li class="footnote"> |
2026 | <div class="footnote2" id=" | 1981 | <div class="footnote2" id="fn57" href="#fna57">[<a href="#fna57">57</a>]</div> |
2027 | <div class="footnote3"> Sächsisches Staatsarchiv. Bestand 20009 Amt | 1982 | <div class="footnote3"> Sächsisches Staatsarchiv. Bestand 20009 Amt |
2029 | </li><br><li class="footnote"> | 1984 | </li><br><li class="footnote"> |
1985 | <div class="footnote2" id="fn58" href="#fna58">[<a href="#fna58">58</a>]</div> | ||
1986 | <div class="footnote3"><a title="Verein für Computergenealogie: Kartei Leipziger Kreisamtstestamente. 2019–2021. HTML. [online]" href="#vfc_kartei_2019">Verein für Computergenealogie 2019–2021</a>.</div> | ||
1987 | </li><br><li class="footnote"> | ||
2030 | <div class="footnote2" id="fn59" href="#fna59">[<a href="#fna59">59</a>]</div> | 1988 | <div class="footnote2" id="fn59" href="#fna59">[<a href="#fna59">59</a>]</div> |
2031 | <div class="footnote3"><a title="Verein für Computergenealogie: Kartei Leipziger Kreisamtstestamente. 2019–2021. HTML. [online]" href="#vfc_kartei_2019">Verein für Computergenealogie 2019–2021</a>.</div> | ||
2032 | </li><br><li class="footnote"> | ||
2033 | <div class="footnote2" id="fn60" href="#fna60">[<a href="#fna60">60</a>]</div> | ||
2034 | <div class="footnote3"> | 1989 | <div class="footnote3"> |
2039 | </li><br><li class="footnote"> | 1994 | </li><br><li class="footnote"> |
2040 | <div class="footnote2" id=" | 1995 | <div class="footnote2" id="fn60" href="#fna60">[<a href="#fna60">60</a>]</div> |
2041 | <div class="footnote3"> Vgl. <a title="Dirk Böttcher: Ahnenblatt Handbuch. 2018. PDF. [online]" href="#boettcher_ahnenblatt_2018">Böttcher | 1996 | <div class="footnote3"> Vgl. <a title="Dirk Böttcher: Ahnenblatt Handbuch. 2018. PDF. [online]" href="#boettcher_ahnenblatt_2018">Böttcher |
2043 | </li><br><li class="footnote"> | 1998 | </li><br><li class="footnote"> |
1999 | <div class="footnote2" id="fn61" href="#fna61">[<a href="#fna61">61</a>]</div> | ||
2000 | <div class="footnote3"> Die Zusammenführung basiert hierbei auf gleichen Namen und | ||
2001 | einem gleichen Ereignisdatum (z. B. das Taufdatum) und betrifft auch die | ||
2002 | nähere Verwandtschaft der betreffenden Personen wie die Eltern, Kinder oder | ||
2003 | Geschwister. Vgl. <a title="Dirk Böttcher: Ahnenblatt Handbuch. 2018. PDF. [online]" href="#boettcher_ahnenblatt_2018">Böttcher 2018</a>, S. 17.</div> | ||
2004 | </li><br><li class="footnote"> | ||
2044 | <div class="footnote2" id="fn62" href="#fna62">[<a href="#fna62">62</a>]</div> | 2005 | <div class="footnote2" id="fn62" href="#fna62">[<a href="#fna62">62</a>]</div> |
2045 | <div class="footnote3"> Die Zusammenführung basiert hierbei auf gleichen Namen und | ||
2046 | einem gleichen Ereignisdatum (z. B. das Taufdatum) und betrifft auch die | ||
2047 | nähere Verwandtschaft der betreffenden Personen wie die Eltern, Kinder oder | ||
2048 | Geschwister. Vgl. <a title="Dirk Böttcher: Ahnenblatt Handbuch. 2018. PDF. [online]" href="#boettcher_ahnenblatt_2018">Böttcher 2018</a>, S. 17.</div> | ||
2049 | </li><br><li class="footnote"> | ||
2050 | <div class="footnote2" id="fn63" href="#fna63">[<a href="#fna63">63</a>]</div> | ||
2051 | <div class="footnote3"> Hier werden die Daten genutzt, nachdem die KLF und | 2006 | <div class="footnote3"> Hier werden die Daten genutzt, nachdem die KLF und |
2055 | </li><br><li class="footnote"> | 2010 | </li><br><li class="footnote"> |
2056 | <div class="footnote2" id=" | 2011 | <div class="footnote2" id="fn63" href="#fna63">[<a href="#fna63">63</a>]</div> |
2057 | <div class="footnote3"> Die KLK enthält zwar 6.524 Personendatensätze. Die | 2012 | <div class="footnote3"> Die KLK enthält zwar 6.524 Personendatensätze. Die |
2061 | </li><br><li class="footnote"> | 2016 | </li><br><li class="footnote"> |
2062 | <div class="footnote2" id=" | 2017 | <div class="footnote2" id="fn64" href="#fna64">[<a href="#fna64">64</a>]</div> |
2063 | <div class="footnote3"> | 2018 | <div class="footnote3"> |
2075 | <ul class="bibl"> | 2030 | <ul class="bibl"> |
2076 | <li class="biblio" id="abramitzky_linking_2021">Ran | 2031 | <li class="biblio" id="abramitzky_linking_2021">Ran Abramitzky / Leah Boustan / Katherine Eriksson / James Feigenbaum / |
2077 | Santiago Pérez: Automated Linking of Historical Data. In: Journal of Economic | 2032 | Santiago Pérez: Automated Linking of Historical Data. In: Journal of Economic |
2078 | Literature 59 (2021), H. 3, S. | 2033 | Literature 59 (2021), H. 3, S. 865–918. DOI: 10.1257/jel.20201599 |
2079 | [<a href=" | 2034 | [<a href="https://kxp.k10plus.de/DB=2.1/PPN?PPN=129078794" target="_blank">Nachweis im GVK</a>] </li><br><li class="biblio" id="abramitzky_linking_2020">Ran Abramitzky / Roy Mill / Santiago Pérez: Linking individuals across |
2080 | historical sources: A fully automated approach. In: Historical Methods: A Journal | 2035 | historical sources: A fully automated approach. In: Historical Methods: A Journal |
2081 | of Quantitative and Interdisciplinary History 53 (2020), H. 2, S. | 2036 | of Quantitative and Interdisciplinary History 53 (2020), H. 2, S. 94–111. DOI: 10.1080/01615440.2018.1543034 |
2082 | [<a href=" | 2037 | [<a href="https://kxp.k10plus.de/DB=2.1/PPN?PPN=166715824" target="_blank">Nachweis im GVK</a>] </li><br><li class="biblio" id="baehr_bevoelkerungsgeographie_1992">Jürgen Bähr / Christoph Jentsch / Wolfgang Kuls: Bevölkerungsgeographie. Berlin |
2083 | u. | 2038 | u. a. 1992. (= Lehrbuch der allgemeinen Geographie, 9). [<a href="https://kxp.k10plus.de/DB=2.1/PPN?PPN=028380339" target="_blank">Nachweis im GVK</a>] </li><br><li class="biblio" id="baxter_methods_2003">Rohan Baxter / Peter Christen / Tim Churches: A Comparison of Fast Blocking |
2084 | Methods for Record Linkage. 2003. PDF. [<a href="https://www.researchgate.net/publication/2838209" target="_blank">online</a>]</li><br><li class="biblio" id="boettcher_ahnenblatt_2018">Dirk Böttcher: Ahnenblatt Handbuch. 2018. PDF. [<a href="https://www.ahnenblatt.de/downloads/Ahnenblatt-Handbuch.pdf" target="_blank">online</a>]</li><br><li class="biblio" id="christian_record_2015">Peter | 2039 | Methods for Record Linkage. 2003. PDF. [<a href="https://www.researchgate.net/publication/2838209" target="_blank">online</a>]</li><br><li class="biblio" id="boettcher_ahnenblatt_2018">Dirk Böttcher: Ahnenblatt Handbuch. 2018. PDF. [<a href="https://www.ahnenblatt.de/downloads/Ahnenblatt-Handbuch.pdf" target="_blank">online</a>]</li><br><li class="biblio" id="christian_record_2015">Peter Christen / Dinusha Vatsalan / Zhichun Fu: Advanced Record Linkage Methods |
2085 | and Privacy Aspects for Population Reconstruction. A Survey and Case Studies. In: | 2040 | and Privacy Aspects for Population Reconstruction. A Survey and Case Studies. In: |
2086 | Population Reconstruction. Hg. von Gerrit | 2041 | Population Reconstruction. Hg. von Gerrit Bloothooft / Peter Christen / Kees |
2087 | | 2042 | Mandemakers / Marijn Schraagen. Cham u. a. 2015, S. 87–110. DOI: 10.1007/978-3-319-19884-2_5 |
2088 | [<a href=" | 2043 | [<a href="https://kxp.k10plus.de/DB=2.1/PPN?PPN=833549804" target="_blank">Nachweis im GVK</a>] </li><br><li class="biblio" id="church_gedcom_2019">The Church of Jesus Christ of Latter-day Saints: The GEDCOM Standard. Salt Lake City |
2089 | 2019. Release | 2044 | 2019. Release |
2090 | 5.5.1. vom 15.11.2019. PDF. [<a href="https://edge.fscdn.org/assets/img/documents/ged551-5bac5e57fe88dd37df0e153d9c515335.pdf" target="_blank">online</a>]</li><br><li class="biblio" id="delpeuch_reconciliation_2023">Antonin Delpeuch / Adrian Pohl / Fabian Steeg / Thad Guidry Sr. / Osma Suominen: Reconciliation | 2045 | 5.5.1. vom 15.11.2019. PDF. [<a href="https://edge.fscdn.org/assets/img/documents/ged551-5bac5e57fe88dd37df0e153d9c515335.pdf" target="_blank">online</a>]</li><br><li class="biblio" id="efremova_entity_2015">Julia Efremova / Bijan Ranjbar-Sahraei / Hossein Rahmani / Frans A. Oliehoek / |
2091 | Service API v0.2. A Protocol for Data Matching on the Web. Final Community Group Report. | 2046 | Toon Calders / Karl Tuyls / Gerhard Weiss: Multi-Source Entity Resolution for |
2092 | 10.04.2023. HTML. [<a href="https://www.w3.org/community/reports/reconciliation/CG-FINAL-specs-0.2-20230410/" target="_blank">online</a>]</li><br><li class="biblio" id="efremova_entity_2015">Julia Efremova / Bijan Ranjbar-Sahraei / Hossein Rahmani / Frans A. Oliehoek / | 2047 | Genealogical Data. In: Population Reconstruction. Hg. von Gerrit Bloothooft / |
2093 | Toon Calders / Karl Tuyls / Gerhard Weiss: Multi-Source Entity Resolution for | 2048 | Peter Christen / Kees Mandemakers / Marijn Schraagen. Cham u. a. 2015, S. 129–154. |
2094 | Genealogical Data. In: Population Reconstruction. Hg. von Gerrit Bloothooft / | 2049 | DOI: 10.1007/978-3-319-19884-2_7 [<a href="https://kxp.k10plus.de/DB=2.1/PPN?PPN=833549804" target="_blank">Nachweis im GVK</a>] </li><br><li class="biblio" id="fan_understanding_2006">Jerome Fan / Suneel Upadhye / Andrew Worster: Understanding receiver operating |
2095 | Peter Christen / Kees Mandemakers / Marijn Schraagen. Cham u. a. 2015, S. 129–154. | ||
2096 | DOI: 10.1007/978-3-319-19884-2_7 [<a href="http://kxp.k10plus.de/DB=2.1/PPN?PPN=833549804" target="_blank">Nachweis im GVK</a>] </li><br><li class="biblio" id="fan_understanding_2006">Jerome Fan / Suneel Upadhye / Andrew Worster: Understanding receiver operating | ||
2097 | characteristic (ROC) curves. In: Canadian Journal of Emergency Medicine 8 (2006), | 2050 | characteristic (ROC) curves. In: Canadian Journal of Emergency Medicine 8 (2006), |
2098 | H. | 2051 | H. 1, S. 19–20. DOI: <a href="https://doi.org/10.1017/S1481803500013336" target="_blank">10.1017/S1481803500013336</a> [<a href="https://kxp.k10plus.de/DB=2.1/PPN?PPN=776629255" target="_blank">Nachweis im GVK</a>] </li><br><li class="biblio" id="feigenbaum_census_2016">James J. Feigenbaum: Automated census record linking: a machine learning |
2099 | approach. 2016. Handle: <a href="https://hdl.handle.net/2144/27526" target="_blank">2144/27526</a></li><br><li class="biblio" id="fure_record_2000">Eli Fure: Interactive Record Linkage: The Cumulative Construction of Life | 2052 | approach. 2016. Handle: <a href="https://hdl.handle.net/2144/27526" target="_blank">2144/27526</a></li><br><li class="biblio" id="fure_record_2000">Eli Fure: Interactive Record Linkage: The Cumulative Construction of Life |
2100 | Courses. In: Demographic Research 3 (2000). 12.12.2000. DOI: <a href="https://doi.org/10.4054/DemRes.2000.3.11" target="_blank">10.4054/DemRes.2000.3.11</a></li><br><li class="biblio" id="gellatly_populations_2015">Corry Gellatly: Reconstructing Historical Populations from Genealogical Data | 2053 | Courses. In: Demographic Research 3 (2000). 12.12.2000. DOI: <a href="https://doi.org/10.4054/DemRes.2000.3.11" target="_blank">10.4054/DemRes.2000.3.11</a></li><br><li class="biblio" id="gellatly_populations_2015">Corry Gellatly: Reconstructing Historical Populations from Genealogical Data |
2101 | Files. In: Population Reconstruction. Hg. von Gerrit | 2054 | Files. In: Population Reconstruction. Hg. von Gerrit Bloothooft / Peter Christen / |
2102 | Kees | 2055 | Kees Mandemakers / Marijn Schraagen. Cham u. a. 2015, S. 111–128. DOI: 10.1007/978-3-319-19884-2_6 |
2103 | [<a href=" | 2056 | [<a href="https://kxp.k10plus.de/DB=2.1/PPN?PPN=833549804" target="_blank">Nachweis im GVK</a>] </li><br><li class="biblio" id="georgala_record_2015">Kleanthi Georgala / Benjamin van der Burgh / Marvin Meeng / Arno Knobbe: Record |
2104 | Linkage in Medieval and Early Modern Text. In: Population Reconstruction. Hg. von | 2057 | Linkage in Medieval and Early Modern Text. In: Population Reconstruction. Hg. von |
2105 | Gerrit | 2058 | Gerrit Bloothooft / Peter Christen / Kees Mandemakers / Marijn Schraagen. Cham u. |
2106 | a. 2015, S. | 2059 | a. 2015, S. 173–195. DOI: 10.1007/978-3-319-19884-2_9 [<a href="https://kxp.k10plus.de/DB=2.1/PPN?PPN=833549804" target="_blank">Nachweis im GVK</a>] </li><br><li class="biblio" id="goldberg_entscheidungsfindung_2022">Jan Michael Goldberg: Kontextsensitive Entscheidungsfindung zur automatisierten |
2107 | Identifizierung und Clusterung deutschsprachiger Urbanonyme. In: Zeitschrift für | 2060 | Identifizierung und Clusterung deutschsprachiger Urbanonyme. In: Zeitschrift für |
2108 | digitale Geisteswissenschaften 7 (2022). 10.10.2022. DOI: <a href="https://doi.org/10.17175/2022_005" target="_blank">10.17175/2022_005</a></li><br><li class="biblio" id="goldberg_identifikation_2022">Jan Michael | 2061 | digitale Geisteswissenschaften 7 (2022). 10.10.2022. DOI: <a href="https://doi.org/10.17175/2022_005" target="_blank">10.17175/2022_005</a></li><br><li class="biblio" id="goldberg_identifikation_2022">Jan Michael Goldberg / Katrin Moeller: Automatisierte Identifikation und |
2109 | Lemmatisierung historischer Berufsbezeichnungen in deutschsprachigen | 2062 | Lemmatisierung historischer Berufsbezeichnungen in deutschsprachigen |
2110 | Datenbeständen. In: Zeitschrift für digitale Geisteswissenschaften 7 (2022). 08.03.2022. | 2063 | Datenbeständen. In: Zeitschrift für digitale Geisteswissenschaften 7 (2022). 08.03.2022. |
2111 | DOI: <a href="https://doi.org/10.17175/2022_002" target="_blank">10.17175/2022_002</a></li><br><li class="biblio" id="gu_record_2003">Lifang | 2064 | DOI: <a href="https://doi.org/10.17175/2022_002" target="_blank">10.17175/2022_002</a></li><br><li class="biblio" id="gu_record_2003">Lifang Gu / Rohan Baxter / Deanne Vickers / Chris Rainsford: Record Linkage: |
2112 | Current Practice and Future Directions. In: CMIS Technical Report 03/83 (2003). | 2065 | Current Practice and Future Directions. In: CMIS Technical Report 03/83 (2003). |
2113 | PDF. [<a href="https://citeseerx.ist.psu.edu/pdf/a2c4dec86a96a99adc00cb664b703e8407216183" target="_blank">online</a>]</li><br><li class="biblio" id="harviainen_genealogy_2018">J. Tuomas | 2066 | PDF. [<a href="https://citeseerx.ist.psu.edu/pdf/a2c4dec86a96a99adc00cb664b703e8407216183" target="_blank">online</a>]</li><br><li class="biblio" id="harviainen_genealogy_2018">J. Tuomas Harviainen / Bo-Christer Björk: Genealogy, GEDCOM, and popularity |
2114 | implications. In: Informaatiotutkimus 37 (2018), H. | 2067 | implications. In: Informaatiotutkimus 37 (2018), H. 3, S. 4–14. DOI: <a href="https://doi.org/10.23978/inf.76066" target="_blank">10.23978/inf.76066</a> [<a href="https://kxp.k10plus.de/DB=2.1/PPN?PPN=366701630" target="_blank">Nachweis im GVK</a>] </li><br><li class="biblio" id="hin_roman_2016">Saskia Hin / Dalia A. Conde / Adam Lenart: New light on Roman census papyri |
2115 | through semi-automated record linkage. In: Historical Methods: A Journal of | 2068 | through semi-automated record linkage. In: Historical Methods: A Journal of |
2116 | Quantitative and Interdisciplinary History 49 (2016), H. 1, S. | 2069 | Quantitative and Interdisciplinary History 49 (2016), H. 1, S. 50–65. DOI: 10.1080/01615440.2015.1071226 |
2117 | [<a href=" | 2070 | [<a href="https://kxp.k10plus.de/DB=2.1/PPN?PPN=166715824" target="_blank">Nachweis im GVK</a>] </li><br><li class="biblio" id="kaplan_venice_2015">Frédéric Kaplan: The Venice Time Machine. In: DocEng ’15: Proceedings of the |
2118 | 2015 ACM Symposium on Document Engineering (DocEng, Lausanne, 08.–11.09.2015). New | 2071 | 2015 ACM Symposium on Document Engineering (DocEng, Lausanne, 08.–11.09.2015). New |
2119 | York 2015, S. | 2072 | York 2015, S. 73. DOI: 10.1145/2682571.2797071</li><br><li class="biblio" id="kocka_familie_1980">Jürgen Kocka / Karl Ditt / Josef Mooser / Heinz Reif / Reinhard Schüren: |
2120 | Familie und soziale Platzierung. Studien zum Verhältnis von Familie, sozialer | 2073 | Familie und soziale Platzierung. Studien zum Verhältnis von Familie, sozialer |
2121 | Mobilität und Heiratsverhalten an westfälischen Beispielen im späten 18. und 19. | 2074 | Mobilität und Heiratsverhalten an westfälischen Beispielen im späten 18. und 19. |
2122 | Jahrhundert. Wiesbaden 1980 (= | 2075 | Jahrhundert. Wiesbaden 1980 (= Forschungsberichte des Landes Nordrhein-Westfalen, |
2123 | 2953). DOI: 10.1007/978-3-322-87746-8</li><br><li class="biblio" id="massey_playing_2017">Catherine G. Massey: Playing with matches: An assessment of accuracy in linked | 2076 | 2953). DOI: 10.1007/978-3-322-87746-8</li><br><li class="biblio" id="massey_playing_2017">Catherine G. Massey: Playing with matches: An assessment of accuracy in linked |
2124 | historical data. In: Historical Methods: A Journal of Quantitative and | 2077 | historical data. In: Historical Methods: A Journal of Quantitative and |
2125 | Interdisciplinary History 50 (2017), H. 3, S. | 2078 | Interdisciplinary History 50 (2017), H. 3, S. 129–143. DOI: 10.1080/01615440.2017.1288598 |
2126 | [<a href=" | 2079 | [<a href="https://kxp.k10plus.de/DB=2.1/PPN?PPN=166715824" target="_blank">Nachweis im GVK</a>] </li><br><li class="biblio" id="munke_citizen_2019">Martin Munke: Citizen Science / Bürgerwissenschaft. Projekte, Probleme, |
2127 | Perspektiven am Beispiel Sachsen. In: Forschungsdesign 4.0. Datengenerierung und | 2080 | Perspektiven am Beispiel Sachsen. In: Forschungsdesign 4.0. Datengenerierung und |
2128 | Wissenstransfer in interdisziplinärer Perspektive. Hg. von Jens | 2081 | Wissenstransfer in interdisziplinärer Perspektive. Hg. von Jens Klingner / Merve |
2129 | Lühr (Dresden, 19.–21.04.2018). Dresden 2019, S. | 2082 | Lühr (Dresden, 19.–21.04.2018). Dresden 2019, S. 107–124. DOI: <a href="https://doi.org/10.25366/2019.11" target="_blank">10.25366/2019.11</a></li><br><li class="biblio" id="nanayakkara_clustering_2018">Charini Nanayakkara / Peter Christen / Thilina Ranbaduge: Temporal graph-based |
2130 | clustering for historical record linkage. In: Proceedings of 14th International | 2083 | clustering for historical record linkage. In: Proceedings of 14th International |
2133 | Personennamen auf der Grundlage der Gestaltanalyse. In: IBM-Nachrichten 19 (1969), | 2086 | Personennamen auf der Grundlage der Gestaltanalyse. In: IBM-Nachrichten 19 (1969), |
2134 | S. | 2087 | S. 925–931. [<a href="https://kxp.k10plus.de/DB=2.1/PPN?PPN=129076759" target="_blank">Nachweis im GVK</a>] </li><br><li class="biblio" id="schoenfelder_grundlagen_2015">Günther Schönfelder / Michael Börngen: Naturräumliche Grundlagen. Landschaft |
2135 | und Klima. In: Geschichte der Stadt Leipzig. Hg. von Uwe | 2088 | und Klima. In: Geschichte der Stadt Leipzig. Hg. von Uwe John / Enno Bünz. 4 Bde. |
2136 | Leipzig 2015–2019. Bd. 1 (2015): Von den Anfängen bis zur Reformation, S. | 2089 | Leipzig 2015–2019. Bd. 1 (2015): Von den Anfängen bis zur Reformation, S. 33–47. |
2137 | [<a href=" | 2090 | [<a href="https://kxp.k10plus.de/DB=2.1/PPN?PPN=774827831" target="_blank">Nachweis im GVK</a>] </li><br><li class="biblio" id="schulz_gedtool_2017">Peter Schulz: GEDTOOL. Makrosammlung für GEDCOM-Dateien. V. 2.7 vom 14.09.2017. |
2138 | PDF. [<a href="https://gedtool.de/resources/GedTool_2_7.pdf" target="_blank">online</a>] </li><br><li class="biblio" id="thorvaldsen_record_2015">Gunnar | 2091 | PDF. [<a href="https://gedtool.de/resources/GedTool_2_7.pdf" target="_blank">online</a>] </li><br><li class="biblio" id="thorvaldsen_record_2015">Gunnar Thorvaldsen / Andersen Trygve / Hilde L. Sommerseth: Record Linkage in |
2139 | the Historical Population Register for Norway. In: Population Reconstruction. | 2092 | the Historical Population Register for Norway. In: Population Reconstruction. |
2140 | Hg. von Gerrit | 2093 | Hg. von Gerrit Bloothooft / Peter Christen / Kees Mandemakers / Marijn Schraagen. |
2141 | Cham u. | 2094 | Cham u. a. 2015, S. 155–171. DOI: 10.1007/978-3-319-19884-2_8 [<a href="https://kxp.k10plus.de/DB=2.1/PPN?PPN=833549804" target="_blank">Nachweis im GVK</a>] </li><br><li class="biblio" id="time_machine_2022">Time Machine Organisation: Local Time Machines. 2022. HTML. [<a href="https://www.timemachine.eu/ltms/" target="_blank">online</a>]</li><br><li class="biblio" id="vfc_datenmodell_2016">Verein für Computergenealogie (2016a): Gedbas4all / Datenmodell. In: GenWiki. |
2142 | Das Genealogie-Wiki. 2016. HTML. [<a href="http://wiki-de.genealogy.net/Gedbas4all/Datenmodell" target="_blank">online</a>] </li><br><li class="biblio" id="vfc_datumsangaben_2016">Verein für Computergenealogie (2016b): | 2095 | Das Genealogie-Wiki. 2016. HTML. [<a href="http://wiki-de.genealogy.net/Gedbas4all/Datenmodell" target="_blank">online</a>] </li><br><li class="biblio" id="vfc_datumsangaben_2016">Verein für Computergenealogie (2016b): Gedbas4all / Datumsangaben. In: GenWiki. |
2143 | Das Genealogie-Wiki. 2016. HTML. [<a href="http://wiki-de.genealogy.net/Gedbas4all/Datumsangaben" target="_blank">online</a>]</li><br><li class="biblio" id="vfc_kartei_2018">Verein für Computergenealogie: Kartei Leipziger Familien. In: GenWiki. Das | 2096 | Das Genealogie-Wiki. 2016. HTML. [<a href="http://wiki-de.genealogy.net/Gedbas4all/Datumsangaben" target="_blank">online</a>]</li><br><li class="biblio" id="vfc_kartei_2018">Verein für Computergenealogie: Kartei Leipziger Familien. In: GenWiki. Das |
2147 | </div> | 2100 | </div> |
2148 | <div class="abbildungsnachweis" id="abbildungsnachweis"> | 2101 | <div class="abbildungsnachweis"> |
2149 | <hr> | 2102 | <hr><a name="div26"> </a><div id="abbildungsnachweis"><a name="hd24"> </a><h2> |
2150 | <ul class="abbildung"> | ||
2151 | <h2> | ||
2152 | <div style="position:relative;width:90%;">Abbildungs- und Tabellenverzeichnis</div> | 2103 | <div style="position:relative;width:90%;">Abbildungs- und Tabellenverzeichnis</div> |
2153 | </h2> | 2104 | </h2> |
2154 | <li id="abb1" class="abbildung"><a href="#record_2022_001">Abb. 1</a>: Ablauf der Datenverarbeitung. [Goldberg / Mernitz 2023]</li> | 2105 | <ul class="abbildung"> |
2155 | <li id="abb2" class="abbildung"><a href="#record_2022_002">Abb. 2</a>: Funktionsweise des Algorithmus als Nassi-Shneiderman-Diagramm. [Goldberg / Mernitz | 2106 | <li id="abb1"><a href="#record_2022_001">Abb. 1</a>: |
2156 | 2023]</li> | 2107 | Ablauf der Datenverarbeitung. [Goldberg / Mernitz 2023]<a href="#record_2022_001"></a></li> |
2157 | <li id="tab1" class="tabelle"><a href="#tab01">Tab. 1</a>: | 2108 | </ul> |
2158 | Definition von Datenfeldern. [Goldberg / Mernitz 2023]</li> | 2109 | <ul class="abbildung"> |
2159 | <li id="tab2" class="tabelle"><a href="#tab02">Tab. 2</a>: | 2110 | <li id="abb2"><a href="#record_2022_002">Abb. 2</a>: |
2160 | Zusätzliche Variablen eines zusammengeführten Datensatzes. [Goldberg / Mernitz 2023]</li> | 2111 | Funktionsweise des Algorithmus als Nassi-Shneiderman-Diagramm. [Goldberg / Mernitz |
2161 | <li id="tab3" class="tabelle"><a href="#tab03">Tab. 3</a>: | 2112 | 2023]<a href="#record_2022_002"></a></li> |
2162 | Direkte Umwandlung der KLF-Struktur in die Normform. [Goldberg / Mernitz 2023]</li> | 2113 | </ul> |
2163 | <li id="tab4" class="tabelle"><a href="#tab04">Tab. 4</a>: | 2114 | <ul class="tabelle"> |
2164 | Indirekte Umwandlung der KLF-Struktur in die Normform. [Goldberg / Mernitz 2023]</li> | 2115 | <li id="tab1"><a href="#tab01">Tab. 1</a>: |
2165 | <li id="tab5" class="tabelle"><a href="#tab05">Tab. 5</a>: | 2116 | Definition von Datenfeldern. [Goldberg / Mernitz 2023]</li> |
2166 | Direkte Umwandlung der KLK-Struktur in die Normform. [Goldberg / Mernitz 2023]</li> | 2117 | </ul> |
2167 | <li id="tab6" class="tabelle"><a href="#tab06">Tab. 6</a>: | 2118 | <ul class="tabelle"> |
2168 | Indirekte Umwandlung der KLK-Struktur in die Normform. [Goldberg / Mernitz 2023]</li> | 2119 | <li id="tab2"><a href="#tab02">Tab. 2</a>: |
2169 | <li id="tab7" class="tabelle"><a href="#tab07">Tab. 7</a>: | 2120 | Zusätzliche Variablen eines zusammengeführten Datensatzes. [Goldberg / Mernitz 2023]</li> |
2170 | Übersicht über die Anzahl der verknüpften Personen aus den Normformen. [Goldberg / | 2121 | </ul> |
2122 | <ul class="tabelle"> | ||
2123 | <li id="tab3"><a href="#tab03">Tab. 3</a>: | ||
2124 | Direkte Umwandlung der KLF-Struktur in die Normform. [Goldberg / Mernitz 2023]</li> | ||
2125 | </ul> | ||
2126 | <ul class="tabelle"> | ||
2127 | <li id="tab4"><a href="#tab04">Tab. 4</a>: | ||
2128 | Indirekte Umwandlung der KLF-Struktur in die Normform. [Goldberg / Mernitz 2023]</li> | ||
2129 | </ul> | ||
2130 | <ul class="tabelle"> | ||
2131 | <li id="tab5"><a href="#tab05">Tab. 5</a>: | ||
2132 | Direkte Umwandlung der KLK-Struktur in die Normform. [Goldberg / Mernitz 2023]</li> | ||
2133 | </ul> | ||
2134 | <ul class="tabelle"> | ||
2135 | <li id="tab6"><a href="#tab06">Tab. 6</a>: | ||
2136 | Indirekte Umwandlung der KLK-Struktur in die Normform. [Goldberg / Mernitz 2023]</li> | ||
2137 | </ul> | ||
2138 | <ul class="tabelle"> | ||
2139 | <li id="tab7"><a href="#tab07">Tab. 7</a>: | ||
2140 | Übersicht über die Anzahl der verknüpften Personen aus den Normformen. [Goldberg / | ||
2171 | Mernitz 2023]</li> | 2141 | Mernitz 2023]</li> |
2173 | </div> | 2143 | </div> |
2174 | </ | 2144 | </div> |