Available at https://www.zfdg.de
Sofern nicht anders angegeben
Available at https://www.zfdg.de; (c) Forschungsverbund MWW
Einreichung als Working Paper in der ZfdG durch die Herausgeber*innen
Transformation der WORD-Vorlage nach XML/TEI-P5 durch TEI-Oxgarage und XSLT-Skripten
Lektorat des Textes durch die Redaktion in Person von
Medienrechte liegen bei den Autor*innen
All links checked
Synonyme und ähnliche Begriffe: Capta | Information | Intermediärdaten | Linked Data | Linked Open Data | Long Data | Paradaten | Primärdaten | raw data | ZeichenPendants in kontrollierten Vokabularen: Wikidata: Q15809982 | TaDiRAH: –
›Daten‹ werden heute überwiegend als eine Art Informationseinheit im Zusammenhang mit Digitaltechnologien verstanden. → Wissenschaftstheoretisch wird der Begriff kaum bearbeitet, eine einheitliche Definition gibt es bis dato nicht. In den geistes- und kulturwissenschaftlichen Traditionen gibt es zwar keinen Dissens hinsichtlich unterschiedlicher technisch verstandener Datenbegriffe. Eine breitere Diskussion gibt es in den Digital Humanities allerdings dort, wo Daten als ›Forschungsdaten‹ in Erscheinung treten. Eine einheitliche Definition liegt aber auch hier (noch) nicht vor – der Begriff bewegt sich in einem Spannungsfeld zwischen sprachlichen Definitionsversuchen, dem praktischen Umgang in Forschungskontexten und wissenschaftstheoretischen Reflexionen.
Zu unserer heutigen alltäglichen Verwendung des Begriffs ›Daten‹ führt der
1. Plural von Datum
2. (durch Beobachtungen, Messungen,
statistische Erhebungen u. a. gewonnene) [Zahlen]werte, (auf Beobachtungen,
Messungen, statistischen Erhebungen u. a. beruhende) Angaben, formulierbare
Befunde
Herkunft nach englisch data, Plural von: datum < lateinisch datum, datum
[...]
3. elektronisch gespeicherte Zeichen, Angaben, Informationen
Gebrauch EDV
[...]
4. zur Lösung oder Durchrechnung einer Aufgabe vorgegebene Zahlenwerte,
Größen
Gebrauch Mathematik
[...]
Etymologisch stammt der Singular zu Daten – ›Datum‹ – aus dem Lateinischen und leitet
sich von ›dare‹ (›geben‹) ab. Er wurde schon in der Antike und in deutschen
Datierungsformen seit dem 13. Jahrhundert verwendet für die Tages- und Ortsangaben
eines Schreibens, z. B. bei der Datierung von Briefen. In seiner Bedeutung als
›gegebene Größe, Angabe, Beleg‹ wird ›Datum‹ oder pluralisiert als ›data‹ von der
Wissenschaftssprache im 17. und 18. Jahrhundert aufgegriffen. Der eingedeutschte
Plural ›Daten‹ wurde seit Beginn des 19. Jahrhunderts verwendet und seit den 1950ern
verstärkt im Zusammenhang mit Computertechnik zusammengebracht.
Um der Begriffsentwicklung und den damit einhergehenden Wörtern, Intensionen und Extensionen gerecht zu werden, muss zwischen verschiedenen Begriffen differenziert werden: (1) einem historischen expliziten Datenbegriff im nicht-technischen Sinne, (2) einem historischen, aber impliziten Datenbegriff im technischen Sinne und (3) einem modernen expliziten Datenbegriff (im technischen Sinne).
Unter (1) lassen sich alle Begrifflichkeiten in geisteswissenschaftlichen Traditionen
subsumieren, die zwar explizit von ›Daten‹ sprechen, aber nicht in einem technischen
Sinne. In der Philosophie war dies beispielsweise der Begriff der ›Sinnesdaten‹,
dessen Prägung gemeinhin George Edward Moore und Bertrand Russell zugeschrieben
wird.
Welcher dieser Begriffe ist nun relevant für den Diskurs rund um den Datenbegriff in den Digital Humanities? Die Begriffstraditionen nicht-technischer Daten (1) spielen hier keine Rolle, doch es gibt auch keinen (prominenten) Dissens in Bezug auf ›analoge Daten‹ (2) oder darüber, dass beispielsweise Messreihen (3) unter Daten zu verstehen sind. ›Daten‹ werden als Daten im modern-technischen Sinne verstanden. Allerdings: Die Digital Humanities sind Forschungsfelder, die mit digitalen Methoden oder weitgehend in digitalen Milieus stattfinden. Die Digitalisierung der Forschungspraktiken führt nicht (unbedingt) zu begrifflichen Friktionen hinsichtlich des (technischen) Datenbegriffs, wohl aber zu Unsicherheiten hinsichtlich des Verhältnisses zwischen ›Daten‹ und den sogenannten ›Forschungsdaten‹.
Auffälligerweise gibt es trotz der heutigen Omnipräsenz des Forschungsdatenbegriffs in den Digital Humanities keine umfängliche wissenschaftstheoretische Auseinandersetzung mit diesem. Was aussteht, ist allerdings weniger eine begriffliche Transferleistung vom Datenbegriff auf die Forschung, sondern institutionelle Aushandlungsprozesse. Daher muss der Begriff nicht nur als theoretischer Begriff neu gedacht werden, sondern als methodologischer Begriff, der seine Relevanz auf der Ebene des Forschungsprozesses entfaltet und sich in einem Spannungsfeld zwischen Forschungspraxis, Wissenschaftspolitik und Wissenschaftstheorie bewegt.
Für den (technischen) Datenbegriff gibt es in der Praxis eine ganze Fülle von
Definitionsvorschlägen unterschiedlichster Qualität. Anhand dieser lässt sich eine
(nicht abgeschlossene) Reihe von Attributen identifizieren, die die Intension des
Begriffs expliziert und ihn in ein Begriffsnetzwerk einordnet bzw. ihn als
Wittgensteinschen Familienbegriff
In wissenschaftlichen Kontexten lassen sich Daten in mannigfaltigen Formen finden. Die diskursive und rekursive Dynamik des Datenbegriffs lässt zwar eine einheitliche Definition schwer bis unmöglich werden, eröffnet dafür allerdings Spielräume, um die Applikation des Datenbegriffs auf die Wissenschaft (›Forschungsdaten‹) praktischen und systemischen Anforderungen genügen zu lassen. Zu ›Forschungsdaten‹ gibt es (daher) ebenfalls viele Definitionen, die die meisten Forschungs- und GLAM- (Galleries, Libraries, Archives, Museums) Einrichtungen, sowie digitale Infrastrukturprojekte (z. B. die Nationale Forschungsdateninfrastruktur, NFDI) und auch forschungsfördernde Institutionen (z. B. die Deutsche Forschungsgemeinschaft, DFG) in ihrer jeweiligen Forschungsdatenstrategie darlegen.
Die DFG definiert Forschungsdaten beispielsweise primär extensional:
Zu Forschungsdaten zählen u. a. Messdaten, Laborwerte,
audiovisuelle Informationen, Texte, Surveydaten oder Beobachtungsdaten,
methodische Testverfahren sowie Fragebögen. Korpora und Simulationen können
ebenfalls zentrale Ergebnisse wissenschaftlicher Forschung darstellen und werden
daher ebenfalls unter den Begriff Forschungsdaten gefasst.
Die wissenschaftlich einschlägige Plattform forschungsdaten.info definiert Forschungsdaten intensional:
Forschungsdaten sind (digitale) Daten, die während
wissenschaftlicher Tätigkeit (z. B. durch Messungen, Befragungen, Quellenarbeit)
entstehen. Sie bilden eine Grundlage wissenschaftlicher Arbeit und dokumentieren
deren Ergebnisse. Daraus ergibt sich ein disziplin- und projektspezifisches
Verständnis von Forschungsdaten mit unterschiedlichen Anforderungen an die
Aufbereitung, Verarbeitung und Verwaltung der Daten.
Neben intensionalen und extensionalen Deutungsansätzen existieren zudem auch
funktionale:
Zur Schaffung einer Übersicht über die während eines Forschungsprojektes bzw. in Forschungsprozessen anfallenden Daten hat sich das Modell des Forschungsdatenlebenszyklus herauskristallisiert. Die eigentlich fließenden und oftmals diachronen Phasen in der Forschung werden hier holzschnittartig in üblicherweise sechs Phasen unterteilt und zirkulär angeordnet (vgl. Abbildung 1). Dieser Zyklus ist ein Beispiel für einen Zugriff auf den Datenbegriff in der Wissenschaft, der eine praktische Verwaltung der Forschungsdaten systematisch ermöglicht.
Der Datenbegriff als ›Forschungsdaten‹ ist heutzutage in allen wissenschaftlichen
Disziplinen inklusive der (Digital) Humanities von zentraler Bedeutung. Wie an den
Definitionsbeispielen ersichtlich wurde, gibt es durchaus fachspezifische
Unterschiede, was als Forschungsdaten begriffen wird und was nicht. Diese lassen sich
allerdings überwiegend auf der extensionalen Ebene finden – die intensionale und
funktionale Ebene beziehen sich auf Wissenschaftlichkeit allgemein, sowie
wissenschaftstheoretische Überlegungen, die sich beispielsweise auch in der
sogenannten guten wissenschaftlichen Praxis manifestieren
Der Dissens in den Digital Humanities in Bezug auf Forschungsdaten kann also
verdichtet werden zu der Frage: Was sind Forschungsdaten (und was nicht) in den
jeweiligen Disziplinen und warum? Die Verwaltung von Forschungsdaten sowohl auf der
Ebene einzelner Wissenschaftler*innen als auch auf institutioneller und
infrastruktureller Ebene erfordert unter Umständen sehr viele Ressourcen und steht
daher unter einem Legitimationsdruck. Dies schließt sowohl die Erzeugung von
Forschungsdaten als auch sämtliche datenkuratorische Aktivitäten ein. Daten und
Metadaten sind in diesem Sinne nie vollständig, welche sind aber notwendig? Kriterien
lassen sich aus verschiedenen Dimensionen der Ausgangsfrage ableiten und können als
Grundlage für eine intensionale bzw. funktionale Definition von Forschungsdaten
dienen.
Im Anschluss an die Frage, was Forschungsdaten in den Digital Humanities sind und was nicht, stellt
sich die Frage nach der adäquaten Form von Forschungsdaten. Hier sind vor allem die
heuristischen FAIR