- CLARIN (B-centre)
- Text+ (Lexical Resources, Operations)
- Felix Helfer (April 23, 2024)
Das Repositorium der Sächsischen Akademie der Wissenschaften zu Leipzig bietet die langfristige Sicherung digitaler Ressourcen und ihrer Metadaten. Der Auftrag des Repositoriums ist es die Verfügbarkeit und langfristige Sicherung von Forschungsdaten sicherzustellen, Forschungsergebnisse zu sichern, den Wissenstransfer in neue Fachbereiche zu erleichtern und neuartige Methoden und Ressourcen in den universitären Lehrplan zu integrieren. Ein besonderer inhaltlicher Fokus liegt auf lexikalischen Ressourcen und Sprachressourcen für sogenannte "unterrepräsentierte" Sprachen.
Falls kein empfohlenes, standardisiertes und dokumentiertes Format verwendet wird, muss eine umfassende Dokumentation zur Syntax und Semantik der Daten bereitgestellt werden (z. B. bei Datenbank-Dumps: Namen von Tabellen und Spalten; Spezifikationen und Beispiele zum Inhalt jeder Spalte; Beispiele zum Abrufen verschiedene Arten von Daten). Diese Dokumentation (Englisch, PDF) wird zusammen mit den Daten und Metadaten im Repositorium gespeichert und allen zur Verfügung gestellt, welche die Ressource herunterladen bzw. auf sie zugreifen möchten.
Auf dem Webportal des Repositoriums sind weiterführende Informationen zu Datenhosting und Metadatenanforderungen zu finden.
Format | Domain | Level | Comments |
---|---|---|---|
CMDI | Catalogue Metadata
|
recommended | |
CMDI | Contextual Information
|
recommended | |
CMDI | Metadata
|
recommended | |
CoNLL-U | Text Annotation
|
recommended | |
CoNLL-U | Textual Source Language Data
|
recommended | |
CoNLL-X | Text Annotation
|
acceptable |
|
CoNLL-X | Textual Source Language Data
|
acceptable |
|
CSV | Metadata
|
acceptable | |
CSV | Lexical Resource
|
recommended | |
DC XML | Metadata
|
recommended | |
DOCX | Audiovisual Annotation
|
discouraged | |
DOCX | Documentation
|
discouraged | |
DOCX | Metadata
|
discouraged | |
DOCX | Textual Source Language Data
|
acceptable | |
HTML | Documentation
|
recommended | |
HTML | Textual Source Language Data
|
acceptable | |
JSON | Text Annotation
|
acceptable | |
JSON | Metadata
|
acceptable |
|
JSON | Textual Source Language Data
|
acceptable | |
JSON-LD | Text Annotation
|
recommended | |
JSON-LD | Metadata
|
recommended | |
LMF | Lexical Resource
|
recommended | |
Markdown | Documentation
|
recommended | |
Markdown | Textual Source Language Data
|
acceptable | |
Text Annotation
|
discouraged | ||
Documentation
|
acceptable |
|
|
Textual Source Language Data
|
acceptable | ||
PDF/A | Documentation
|
recommended | |
plainText | Audiovisual Annotation
|
discouraged | |
plainText | Text Annotation
|
discouraged | |
plainText | Documentation
|
recommended | |
plainText | Textual Source Language Data
|
recommended | |
RDFXML![]() |
Text Annotation
|
recommended | |
TEI | Audiovisual Annotation
|
recommended | |
TEI | Text Annotation
|
recommended | |
TEIHeader | Metadata
|
recommended | |
TEISpoken | Audiovisual Annotation
|
recommended | |
TSV | Lexical Resource
|
acceptable | |
XML | Audiovisual Annotation
|
recommended | |
XML | Image Annotation
|
recommended | |
XML | Text Annotation
|
recommended | |
XML | Catalogue Metadata
|
acceptable | |
XML | Contextual Information
|
acceptable | |
XML | Metadata
|
acceptable | |
XML | Language Description
|
recommended | |
ZIP | Packaging
|
recommended |