Your browser doesn't support the features required by impress.mod.js, so you are presented with a simplified version of this presentation.

For the best experience please use the latest Chrome, Safari or Firefox browser.

2018-09-20 | Darmstadt DARIAH-DE Grand Tour
workshop: Annotieren, analysieren, visualisieren

Repositorien mergen, analysieren und visualisieren

Präsentation https://digicademy.github.io/DARIAH-GT
Max Grüntgens | Thomas Kollatz
@inschriften | @_epidat | Twitter digicademy | CC-BY 4.0

Werkstattbericht

  1. Repositorien
  2. merge
  3. analyse
  4. visualize
  5. the real thing

01

Repositiorien: epidat und DIO

Inschriftenrepositorien

EPIDAT – Forschungsplattform jüdische Grabsteinepigraphik DIO – Deutsche Inschriften Online
online
Inschriften 35.411 ca. 18.000
Zeit Mitte 11tes - 20tes Jahrhundert 500-1650 CE
Raum Deutschland | Niederlande | Tschechische Republik | Litauen Deutschland | Österreich | Südtirol
Genre(s) Grabinschriften Verschiedene

Gemeinsamkeiten

Standardformat – OPEN DATA – OPEN ACCESS
EPIDAT DIO
Format EpiDoc: TEI XML for Epigraphic Documents
Schnittstellen

Lizenz CC-BY WIP

EpiDoc als Archiv- und Austauschformat

Entwicklungsgeschichte – in Kürze

  • Subset der TEI
  • seit 1999 kollaborativ entwickelt
  • im Dezember 2017 Release von Schema und Guidelines Version 9.0
  • Mittlerweile wird das TEI-Subset EpiDoc von zahlreichen – zunehmend auch nicht primär epigraphischen –  Projekten verwendet
  • mehr zur Geschichte https://sourceforge.net/p/epidoc/wiki/About/

Epigraphic Documents in TEI XML

Beispiel: Angaben zu Person | Sprachgebrauch

<profileDesc>
 <particDesc> <!-- participation description -->
    <listPerson>
        <person xml:id="ffb-80-1" sex="1">
            <persName ref="http://d-nb.info/gnd/11879132X">
             Meir Rothschild ben Anschel Rothschild
            </persName> <death when="1812-09-19"/> 
        </person>
    </listPerson>
 </particDesc>
 <langUsage> <language ident="he" usage="100">Hebrew</language> </langUsage>
</profileDesc>

List of All Transcription Guidelines

Datenschnittstellen

collections -- collection

collection -- resource

file

Licences

CreativeCommons Choose a licence Bildquelle Rufus Pollock

Beispiele

EPIDAT DIO
Datensatz ffb-80-teip5 di060-0007
xPath
/TEI//div[@type='edition']
Ergebnis

02

Merge

Repositorienübergreifende Fragestellungen finden

Semantische Fragestellungen

Äpfel und Birnen
Am Anfang sollten sinnvolle repositorienübergreifende Forschungsfragen stehen.
Frage nach der Genderdistribution:
Gibt es einen signifikanten Unterschied hinsichtlich der Genderdistribution zwischen jüdischen und christlichen Inschriftenrepositorien?
Frage nach den verwendeten Materialien (Stofflichkeit):
Welche Materialien werden für Grabmale verwendet ?

XTripels Webservice

A generic webservice to extract RDF statements from XML resources.
With the XTriples webservice you can crawl XML repositories and extract RDF statements using a simple configuration based on XPATH/XQuery expressions. The webservice can be used with direct POST, form-style POST or GET requests.

Konfiguration

Beispielkonfiguration für DIO und EPIDAT

Ergebnis des RDF lifting aus DIO und EPIDAT

03

Analyse

Von der Fragestellung …

  1. Inschriftentexte – zumal Grabinschriften – enthalten in der Regel Aussagen über Personen.
  2. Wieviele Inschriften über Männer und Frauen sind in den Korpora überliefert (Genderdistribution/Korpus)?

… zur Sparql Query

# SPARQL-Request GENDERDISTRIBUTION in DIO and EpiDat
PREFIX dio: <http://nbn-resolving.de/>
PREFIX epi: <http://www.steinheim-institut.de/cgi-bin/epidat/>
PREFIX mat: <http://www.inschriften.de/material/>
PREFIX obj: <http://www.inschriften.de/objecttype/>
PREFIX foaf: <http://xmlns.com/foaf/0.1/>
PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#>

SELECT DISTINCT ?gender (COUNT(?gender) as ?counter) ?corpus
WHERE {
	?s foaf:gender ?gender .
 ?s rdf:type ?corpus . FILTER ( ?corpus = "EPI" || ?corpus = "DIO")
 	
}
GROUP BY ?gender ?corpus

Eclipse RDF4J is a Java API for RDF: it allows you to create, parse, write, store, query and reason with RDF data in a highly scalable manner. Beispielquery für eine korpusübergreifende Recherche in DIO und EPIDAT.

Ergebnis

Legende

1 male
2 female
0 unknown
9 not defined

04

Visualisierung

Form follows function

Genderdistribution

DIO 0 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 160 170 180 190 200 EPI 0 50 100 150 200 250 300 350 400 450 500 550 0 1 2 9

bar chart Legende

1 male
2 female
0 unknown
9 not defined
Konfiguration

Visualisierung http://app.rawgraphs.io

05

one more thing … 

Linked Open Data

DARIAH-DE USE-CASE: CIDOC-Datenmodellierung

d1e255 A1 crm:E55_Type: "Mann" "Mann" A1->"Mann" crm:P3_has_note A3 crm:E21_Person: A4 crm:E55_Type: A3->A4 crm:P2_has_type A5 crm:E82_Actor_Appellation: A3->A5 crm:P131_is_identified_by A4->"Mann" crm:P3_has_note "Jehuda" "Jehuda" A5->"Jehuda" crm:P3_has_note http://www.steinheim-institut.de/cgi-bin/epidat?id=aha-13 crm:E19_Physical_Object: http://www.steinheim-institut.de/cgi-bin/epidat?id=aha-13 http://www.steinheim-institut.de/cgi-bin/epidat?id=aha-13->A3 crm:P131i_identifies "Breite, hochrechteckige Sandsteinstele mit geradem\nAbschluss. Das ver [...]" "Breite, hochrechteckige Sandsteinstele mit geradem Abschluss. Das ver [...]" http://www.steinheim-institut.de/cgi-bin/epidat?id=aha-13->"Breite, hochrechteckige Sandsteinstele mit geradem\nAbschluss. Das ver [...]" crm:P3_has_note A0 crm:E21_Person: http://www.steinheim-institut.de/cgi-bin/epidat?id=aha-13->A0 crm:P131i_identifies A0->A1 crm:P2_has_type A2 crm:E82_Actor_Appellation: A0->A2 crm:P131_is_identified_by "Elieser ben Josef Hakohen" "Elieser ben Josef Hakohen" A2->"Elieser ben Josef Hakohen" crm:P3_has_note
demo: http://xtriples.spatialhumanities.de | code: https://github.com/spatialhumanities/xtriples
presentation: Torsten Schrade (Digitale Akademie Mainz): CIDOC-CRM Modellierung epigraphischer Fachdaten mit dem XTriples Webservice - Werkstattbericht aus dem DARIAH UseCase 6.1 (Steinheim-Institut & ADWLM)

F I N I S

סוף דבר הכל נשמע

Literatur & Software

XTripels
Visualisierung

EpiDoc

Die Korpora

Digitale Epigraphik