Glossar

   B    C    D    E    F    G    H    I    J    K    L    M    N    O    P    Q    R    S    T    U    V    W    X Y Z

A

Wort Definition
Anonymisierung                          Die Anonymisierung von personenbezogenen Daten in der Wissenschaft gehört zur guten wissenschaftlichen Praxis. Laut BDSG (Bundesdatenschutzgesetz) § 3, Abs. 6 versteht man unter Anonymisierung jegliche Maßnahmen, die personenbezogene Daten so verändern, dass „die Einzelangaben über persönliche oder sachliche Verhältnisse nicht mehr oder nur mit einem unverhältnismäßig großen Aufwand an Zeit, Kosten und Arbeitskraft einer bestimmten oder bestimmbaren natürlichen Person zugeordnet werden können“.

B

C

Wort Definition
Creative Commons‑Lizenz         (CC) Um eine maximale Nachnutzbarkeit wissenschaftlicher Forschungsdaten zu gewährleisten, die prinzipiell dem Urheberrecht unterliegen können, kann die Vergabe zusätzlicher Nutzungsrechte z. B. durch eine entsprechende Lizenzierung der Daten in Betracht gezogen werden. Die Verwendung liberaler Lizenzmodelle, insbesondere der weltweit anerkannten Creative-Commons-Lizenzen (CC), ist dabei eine Möglichkeit, Bedingungen für die Nachnutzung der publizierten Forschungsdaten nachvollziehbar festzulegen.

D

Wort Definition
Dateiformat                                  (Datenart, Dateityp) Das Dateiformat (manchmal auch Dateiart oder Dateityp) gibt die Syntax und Semantik von Daten innerhalb einer Datei an. Damit ein Computer bzw. eine Computer­anwendung die Daten innerhalb einer Datei interpretieren kann, ist die Kenntnis des Dateiformats notwendig. Die meisten Dateiformate wurden für eine spezielle Verwendung konzipiert und können nach gewissen Kriterien gruppiert werden. Die entsprechenden Gruppen sind ausführbare Dateien, Systemdateien, Bibliotheksdateien und Nutzerdateien (Bilddateien (Vektorgraphik [SVG, ...], Rastergraphik [JPG, PNG, ...]), Textdateien, Videodateien, etc.). Bei Dateiformaten kann man zwischen proprietären und offenen Formaten unterscheiden. Proprietäre Formate werden zumeist von Softwareherstellern bzw. Plattformen zur Verfügung gestellt und unterliegen lizenz- und/oder patentrechtlichem Schutz bzw. erfordern zur Implementierung herstellerspezifisches Wissen. Offene Formate gewähren uneingeschränkten Zugriff auf ihren Quellcode und sind daher von den Nutzern adaptierbar.
Datenmanagementplan Ein Datenmanagementplan (DMP) beschreibt systematisch, wie mit in Projekten erstellten Forschungsdaten umgegangen werden wird. Er dokumentiert die Speicherung, Verzeichnung, Pflege und Verarbeitung der Daten. Der Datenmanagementplan ist wichtig, um Daten für Dritte interpretierbar und nachnutzbar zu machen. Bereits vor Projektbeginn sollten Fragen zu Verantwortlichkeiten geklärt werden, etwa: Welche Daten werden im Projekt erzeugt und verwendet? Welche Daten müssen nach Projektende archiviert werden? Wer ist für die Verschlagwortung mit Metadaten zuständig? Wie lange sollen die Daten archiviert werden? Wer darf die Daten nach Projektende nutzen und unter welchen Lizenzbestimmungen?
Datenmapping (Mapping) Datenmapping ist der Prozeß der Überführung von Forschungsdaten von einem Datenmodell zu einem anderen. Dies ist der erste Schritt zur Integration von fremden Informationen in ein eigenes Informationssystem. Es umfaßt die Datentransformation während eines elektronischen Datenaustauschs, für den sehr häufig die Auszeichnungssprache XML und das Datenformat JSON verwendet werden.
Datenrichtlinie (Research Data Policy) Eine Datenrichtlinie (auch Forschungsdatenrichtlinie oder Research Data Policy) ist ein Dokument, welches vorschreibt, wie an der betreffenden Institution mit Forschungsdaten umgegangen werden soll. Dies soll dazu beitragen, dass die wichtige Ressource Forschungsdaten effizient gemanagt wird. Es existieren in Deutschland mittlerweile sowohl Datenrichtlinien einzelner Universitäten (institutionelle Policiess) als auch interdisziplinäre und disziplinäre Richtlinien. Auch einige wissenschaftliche Journale haben sich eine solche Datenrichtlinie gegeben.
Datensicherung/-speicherung Die Sicherung von Daten wird meistens als ein Backup bezeichnet und dient der Wiederherstellung der ursprünglichen Daten im Falle eines Datenverlustes. Dabei sind verschiedene Verfahren von Datensicherung zu unterscheiden: Das Backup (Komplettsicherung) wird meistens in regelmäßigen Abständen automatisch erstellt und an einem anderen Ort als die Originaldaten aufbewahrt, damit die physische Beschädigung durch Brand und Ähnliches nicht zum vollständigen Datenverlust führt. Durch eine differenzielle Sicherung werden nur die Daten gesichert, die seit der letzten Komplettsicherung geändert wurden und hinzugekommen sind. Es handelt sich also um eine punktuelle Änderung einer Komplettsicherung, die weniger zeitaufwendig und speicherintensiv ist als eine neue Komplettsicherung. Im Gegensatz dazu werden bei einer inkrementellen Sicherung nur die Dateien oder Teile von Dateien gespeichert, die seit der letzten inkrementellen Sicherung geändert wurden und hinzugekommen sind. Bei einer Wiederherstellung muss kettenartig und aufwendig auf mehrere Teilsicherungen zurückgegriffen werden. Mit einem Speicherabbild (image backup) wird ein kompletter Datenträger (Festplatte, Netzlaufwerk etc.) gesichert, sodass außer den Daten auch alle Nutzereinstellungen und Programme sowie ggf. das Betriebssytem mitgesichert werden. Eine Wiederherstellung einer solchen Sicherung kann den Totalausfall eines Computers rückgängig machen.
Datenschutz Unter Datenschutz werden technische und organisatorische Maßnahmen gegen den Missbrauch von personenbezogenen Daten verstanden. Ein Missbrauch liegt vor, wenn solche Daten unbefugt erhoben, verarbeitet oder genutzt werden. Geregelt ist der Datenschutz in der EU Datenschutz-Grundverordnung (DSGVO), im Bundesdatenschutzgesetz und in den entsprechenden Gesetzen auf Ebene der Bundesländer. In der Forschung fallen personenbezogene Daten insbesondere in medizinischen und sozialwissenschaftlichen Studien an. Die Verschlüsselung und Aufbewahrung an besonders gesicherten Orten ist hier zwingend erforderlich. Durch nachträgliche Pseudonymisierung oder Anonymisierung kann der Personenbezug aber soweit aufgehoben werden, dass sogar eine Publikation dieser Daten rechtlich möglich wird.
Datenselektion Datenselektion bezeichnet die Auswahl der archivierungs- und publikationswürdigen Forschungsdaten aus der Gesamtheit der Daten eines Forschungsprojekts.
Digital Object Identifier (DOI) Ein Digital Object Identifier (DOI) ist eines der gebräuchlichsten Systeme zur persistenten Identifikation digitaler Dokumente. Ein DOI bleibt über die gesamte Lebensdauer eines bezeichneten Objekts gleich. Ein weiteres bekanntes System zur persistenten Identifikation ist der Uniform Resource Name (URN).

E

F

Wort Definiton
FAIR Data Der Begriff FAIR (Findable, Accessible, Interoperable und Reusable) Data steht für nachhaltiges Forschungsdatenmanagement. Hauptziel der FAIR Data Prinzipien ist eine optimale Aufbereitung der Forschungsdaten, die demnach auffindbar, zugänglich, interoperabel und wiederverwendbar sein sollen. Die FAIR Prinzipien wurden auch von der Europäischen Kommission in die Förderrichtlininen von Horizon 2020 aufgenommen.
Forschungsdaten Forschungsdaten sind (digitale) Daten, die während wissenschaftlicher Tätigkeit (z. B. durch Messungen, Befragungen, Quellenarbeit) entstehen. Sie bilden eine Grundlage wissenschaftlicher Arbeit und dokumentieren deren Ergebnisse. Daraus ergibt sich ein disziplin- und projektspezifisches Verständnis von Forschungsdaten mit unterschiedlichen Anforderungen an die Aufbereitung, Verarbeitung und Verwaltung der Daten: dem sogenannten Forschungsdatenmanagement.
Forschungsdatenlebenszyklus Der Forschungsdatenlebenszyklus umrahmt den Nutzungsverlauf von Forschungsdaten. Er beginnt mit der Fragestellung in einem Forschungsprojekt, bzw. der Antragstellung. Nach der Datenerhebung erfolgt die Verarbeitung und Analyse bzw. Interpretation der Forschungsdaten. Diese müssen anschließend gespeichert werden. Sodann erfolgt die Publikation der Forschungsergebnisse und die teilweise verpflichtende Langzeitarchivierung der Forschungsdaten. Nach der Archivierung werden die Forschungsdaten für eine mögliche Nachnutzung in einem Repositorium bereitgestellt.
Forschungsdatenmanagement   Unter Forschungsdatenmanagement versteht man den Prozess der Transformation, Selektion und Speicherung von Forschungsdaten mit dem Ziel, diese langfristig und unabhängig vom Datenerzeuger zugänglich, nachnutzbar und nachprüfbar zu halten. Es können dazu an allen Punkten des #Forschungsdatenlebenszyklus strukturierte Maßnahmen ergriffen werden, um die wissenschaftliche Aussagekraft von Forschungsdaten zu erhalten, deren Zugänglichkeit durch Dritte für Auswertung und Analyse zu bewahren und die Nachweiskette zu sichern.

G

Wort Definition
Gute wissenschaftliche Praxis     Die Leitlinien der guten wissenschaftlichen Praxis dienen als Orientierung im Rahmen wissenschaftlicher Arbeitsprozesse. In Deutschland sind diese Regeln zum Beispiel in Empfehlung 15 bis 17 der Deutschen Forschungsgemeinschaft (DFG) zu finden. Hier heißt es: „Wissenschaftlerinnen und Wissenschaftler sichern öffentlich zugänglich gemachte Forschungsdaten beziehungsweise Forschungsergebnisse sowie die ihnen zugrunde liegenden, zentralen Materialien und gegebenenfalls die eingesetzte Forschungssoftware, gemessen an den Standards des betroffenen Fachgebiets, in adäquater Weise und bewahren sie für einen angemessenen Zeitraum auf. Sofern nachvollziehbare Gründe dafür existieren, bestimmte Daten nicht aufzubewahren, legen die Wissenschaftlerinnen und Wissenschaftler dies dar. Hochschulen und außerhochschulische Forschungseinrichtungen stellen sicher, dass die erforderliche Infrastruktur vorhanden ist, die die Archivierung ermöglicht.“ Damit soll gewährleistet sein, dass Forschungsergebnisse überprüfbar bleiben.

H

I

J

Wort Definition
JavaScript Object Notation        (JSON) JSON ist ein kompaktes, leicht lesbares und softwareunabhängiges Datenformat für den Datenaustausch zwischen Anwendungen. Es wird insbesondere bei Webanwendungen zur Übertragung von strukturierten Daten eingesetzt, um diese in andere Systeme bzw. Anwendungen zu integrieren.

K

L

Wort Definition
Langzeitarchivierung                    Das Ziel der Langzeitarchivierung ist es, den Zugang zu archivierten Daten über einen langen Zeitraum zu ermöglichen. Dabei gilt es, einem Datenverlust vorzubeugen, die authentische Datenwiedergabe langfristig zu ermöglichen und ein geeignetes Archivierungssystem (Metadaten, Struktur) zu verwenden. Im Zuge der Planung werden die verschiedenen Aspekte der IT-Infrastruktur, wie Hard- und Software berücksichtigt. Zusätzlich sollten gesellschaftliche Entwicklungen mit in die Planung einbezogen werden.
LeoPARD Der LeoPARD der TU Braunschweig ermöglicht Wissenschaftler*innen Erst- oder Zweitveröffentlichungen zu publizieren. Zusätzlich stellt LeoPARD zahlreiche digitalisierte Werke aus den Altbeständen der Universitätsbibliothek und andere wertvolle Bestände aus Spezialsammlungen für Forschungszwecke zur Verfügung.

M

Wort Definition
Metadaten Metadaten sind an sich unabhängige Daten, die strukturierte Informationen über andere Daten bzw. Ressourcen und deren Merkmale enthalten. Sie werden unabhängig von oder zusammen mit den Daten, die sie näher beschreiben, abgespeichert. Eine genaue Definition von Metadaten ist schwierig, meist unterscheidet man zwischen fachlichen und technischen bzw. administrativen Metadaten. Während letztgenannte einen klaren Metadatenstatus haben, können fachliche Metadaten bisweilen auch als Forschungsdaten begriffen werden. Um die Wirksamkeit von Metadaten zu erhöhen, ist eine Standardisierung der Beschreibung unbedingt erforderlich. Durch einen Metadatenstandard können Metadaten aus unterschiedlichen Quellen miteinander verknüpft und gemeinsam bearbeitet werden.
Metadatenstandard                      Um die Interoperabilität , d. h. die Verknüpfung und gemeinsame Bearbeitung, von Metadaten zu gewährleisten, wurden für bestimmte Zwecke Metadatenstandards geschaffen. Sie dienen einer inhaltlich als auch strukturell gleichförmigen Beschreibung von ähnlichen Daten. Ein Metadatenstandard kann oft durch ein sogenanntes Datenmapping in einen anderen Metadatenstandard überführt werden.

N

Wort Definition
Nachnutzung Nachnutzung bezeichnet die Analyse/Interpretation von Forschungsdaten Dritter. Diese wurden in einem Repositorium für zukünftige Forschungsfragen archiviert und können von anderen Forschenden für die eigene Forschung genutzt werden.
Nationale Forschungsdateninfrastruktur (NFDI) Die NFDI soll eine verteilte und vernetzte Infrastruktur werden, die Dienste-Portfolios und Beratungsleistungen für die Erzeugung und Nutzung von Forschungsdaten anbietet. Sie wird in Gestalt von Konsortien entlang fachlicher Domänen oder methodischer Kriterien organisiert werden. Die NFDI soll „die Datenbestände von Wissenschaft und Forschung systematisch erschließen, nachhaltig sichern und zugänglich machen sowie (inter-)national vernetzen. Sie wird in einem aus der Wissenschaft getriebenen Prozess als vernetzte Struktur eigeninitiativ agierender Konsortien aufgebaut werden.“ DFG Die Initiative zum Aufbau der NFDI wurde von der Gemeinsamen Wissenschaftskonferenz (GWK) initiiert und wird von Bund und Ländern finanziert. Neun erste NFDI-Konsortien nahmen zum Oktober 2020 ihre Arbeit auf. Zwei weitere Auswahlrunden folgen in den Jahren 2020 und 2021.

O

Wort Definition
Open Access                                  Unter Open Access wird ein kostenloser und möglichst barrierefreier Zugang zu digitalen wissenschaftlichen Inhalten verstanden. Den Nutzer*innen werden in der Regel umfangreiche Nutzungsrechte und einfache Zugangswege ermöglicht. Die Urheberschaft verbleibt dabei in der Hand des Urhebers oder der Urheberin. Durch Open Access können wissenschaftliche Informationen maximal verbreitet, genutzt und weiterverarbeitet werden. Open Access stellt eine wichtige Errungenschaft der Open-Science-Bewegung dar.
ORCID Die Open Researcher and Contributor (ORCID) -iD ist ein international anerkannter persistenter Identifikator, mit dessen Hilfe Forschende eindeutig identifiziert werden können. Die iD ist verlagsunabhängig und kann dauerhaft sowie institutionsunabhängig von Forschenden für ihren wissenschaftlichen Output verwendet werden. Sie besteht aus 16 Ziffern, die in vier Viererblöcken dargestellt sind (z.B. 0000-0002-2792-2625). Die ORCID-iD ist als Identifizierungsnummer bei zahlreichen Verlagen, Universitäten und wissenschaftsnahen Einrichtungen etabliert und wird in den Workflow z. B. bei der Begutachtung von Zeitschriftenartikeln integriert.

P

Wort Definition
Persistenter Identifikator          (Persistent identifier) Als Persistent Identifier versteht man im Forschungsdatenmanagement einen dauerhaften (persistenten), digitalen Identifikator, bestehend aus Ziffern und/oder alphanumerischen Zeichen, welcher einem Datensatz (oder einem anderen digitalen Objekt) zugeordnet wird und direkt auf diesen verweist. Häufig verwendete Identifikator-Systeme sind DOI (Digital Object Identifiers) und URN (Uniform Resource Names) für Daten und ORCID für Forschende. Im Gegensatz zu anderen seriellen Identifikatoren (bspw. URL-Adressen) verweist ein Persistent Identifier auf das Objekt selbst und nicht auf seinen Standort im Internet. Ändert sich der Standort eines mit einem Persistent Identifier assoziierten digitalen Objekts, so bleibt der Identifikator derselbe.
Personenbezogene Daten Das Bundesdatenschutzgesetz (BDSG) definiert personenbezogene Daten als „Einzelangaben über persönliche oder sachliche Verhältnisse einer bestimmten oder bestimmbaren natürlichen Person (Betroffener)“. Daten können dann als personenbezogen gelten, wenn sie eindeutig einer bestimmten natürlichen Person zugeordnet werden können. Typische Beispiele sind Name, Beruf, Körpergröße oder Nationalität der Person. Das BDSG schreibt zudem vor, dass Angaben über ethnische Herkunft, politische Meinung, religiöse oder philosophische Überzeugung, Gewerkschaftszugehörigkeit, Gesundheit und Sexualleben eine besonders schutzwürdige Art von personenbezogenen Daten darstellen und daher strengeren Schutzauflagen unterliegen.

Q

R

Wort Definition
Rechte an Dritten Aus Sicht der Forschenden sind Rechte an Dritten Entscheidungsbefugnisse über die Daten, die sich aus der Erzeugung ergeben. Aus Sicht von Nutzer*innen handelt es sich um die Rechte, welche bei der Nachnutzung von Daten zu beachten sind. Rechte können in Form von Lizenzen und zugehörigen Lizenztexten sowie Vereinbarungen in rechtlich verbindlicher Form festgelegt und kommuniziert werden. Für die Nachnutzung von Daten gelten mindestens die Regeln der guten wissenschaftlichen Praxis, d. h. im Wesentlichen die Pflicht, Urheber*innen korrekt zu zitieren. Mit Vergabe der Creative-Commons-Lizenz CC-BY lässt sich diese Regel durch den Datenerzeuger auch lizenzrechtlich weitgehend nachbilden. Datenschutz-, patent- und persönlichkeitsrechtliche Einschränkungen können die Nachnutzung erschweren.
Repositorium Ein Repositorium kann als eine spezielle Form des Archivs betrachtet werden. Im digitalen Zeitalter wird unter dem Begriff Repositorium ein verwalteter Speicherort für digitale Objekte verstanden. Da Repositorien meistens öffentlich oder einem eingeschränkten Nutzer*innenkreis zugänglich sind, ist dieser Begriff eng mit Open Access verknüpft. Das Repositorium der TU Braunschweig LeoPARD.
Research Data Management    Organiser (RDMO) Der Research Data Management Organiser (RDMO) der TU Braunschweig ist ein Online-Werkzeug, das Forschende bei der Erstellung von Datenmanagementplänen unterstützen soll.

S

T

U

Wort Definition
Urheberrecht In Deutschland gilt das deutsche Urheberrechtsgesetz für die Nutzung von wissenschaftlichen Werken, die die dort genannten Schutzvoraussetzungen erfüllen. Sofern den Nutzern dieser Werke nicht weitere Nutzungsrechte durch eine weiterführende Lizenz (z. B. durch eine Creative Commons-Lizenz) eingeräumt werden, ist die Nachnutzung der Werke nur im Rahmen der restriktiven Schrankenregelungen des deutschen Urheberrechtsgesetzes möglich. Insofern Forschungsdaten dem Schutz des Urheberrechtsgesetzes unterliegen, müssen diese mit erweiterten Lizenzen ausgestattet werden, um eine maximale Nachnutzbarkeit wissenschaftlicher Forschungsdaten zu gewährleisten. Daher sollte die Vergabe von zusätzlichen Nutzungsrechten z. B. durch eine entsprechende Lizenzierung der Daten in Betracht gezogen werden. Die Vergabe solcher Lizenzen führt meist zu einer höheren Nutzung der Daten in der wissenschaftlichen Forschung.
URN (Uniform Resource Name)  URN ist die Bezeichnung eines Identifizierungs- und Adressierungssystems und wird ähnlich wie ein DOI zur persistenten Identifikation digitaler Objekte (Netzpublikationen, Datensätze u. a.) verwendet. Er ist vor allem im deutschsprachigen Raum sehr verbreitet, da die deutsche Nationalbibliothek URNs zur persistenten Identifikation und Adressierung anwendet, administriert und auflöst.

V

W

X/Y/Z

Wort Definition
XML (Extensible Markup Language)   XML ist eine Auszeichnungssprache zur Speicherung von hierarchisch strukturierten Informationen als einfache Textdatei. Es wird hauptsächlich für den plattformunabhängigen Datenaustausch zwischen Anwendungen bzw. Computern benutzt. Die Kodierung ist sowohl maschinen- als auch menschenlesbar. Es besteht die Möglichkeit, den Inhalt eines XML-Dokuments auf Validität (Gültigkeit) zu überprüfen, wenn zu den allgemeinen, formalen Regeln weitere inhaltliche Regeln in einer externen Datei definiert worden sind. Dadurch kann die Gestalt und der Inhalt der kodierten Informationen sehr genau beschrieben werden. Mithilfe von XSL (XML Stylesheet Language) ist es möglich, die gespeichert Informationen zu interpretieren und zur Visualisierung in andere Dateiformate umzuwandeln.