
Digital Icons 20+ kao TEI korpus anotiran imenovanim entitetima i povezan sa Wikidata bazom, objavljen u NIF 2.1 formatu za interoperabilnu upotrebu u LLOD okruženju.
Dataset sadrži segmente teksta, anotirane NER pojave, tipove entiteta i veze ka Wikidata QID identifikatorima, uz pripremljene VoID/DCAT metapodatke i SPARQL primere za istraživačku i infrastrukturnu upotrebu.
DigIko predstavlja LLOD izdanje TEI korpusa Digitalne ikone 20+. Svaki tei:seg
izvorno anotiranog TEI dokumenta transformisan je u nif:Context, a svaka pojava entiteta
(tei:ner) u nif:Phrase sa pozicionim indeksima, tekstualnim sidrom,
klasom i, kada postoji, vezom ka odgovarajućem Wikidata entitetu.
Ovakva reprezentacija omogućava jednostavnu pretragu, povezivanje sa drugim LLOD resursima, semantičku analizu i ponovljivu obradu u okviru istraživanja iz digitalne humanistike, korpusne lingvistike i semantičkog weba.
tei:seg → nif:Contexttei:ner → nif:Phraseqid → itsrdf:taIdentRefclass → itsrdf:taClassRefPREFIX nif: <http://persistence.uni-leipzig.org/nlp2rdf/ontologies/nif-core#>
PREFIX itsrdf: <http://www.w3.org/2005/11/its/rdf#>
SELECT ?mention ?text ?class ?wikidata
WHERE {
?mention a nif:Phrase ;
nif:anchorOf ?text ;
itsrdf:taClassRef ?class .
OPTIONAL { ?mention itsrdf:taIdentRef ?wikidata . }
}
LIMIT 100
digiko u GraphDB ili Fuseki i uvesti digiko_nif.ttl kao glavni graf.Ukoliko koristite DigIko corpus, molimo da citirate sledeći rad:
@inproceedings{lrec2026-digiko,
author = {Ranka Stanković and Tamara Vučenović and Biljana Rujević and Milica Ikonić Nešić and Mihailo Škorić},
title = {Integrating TEI, NER/NEL, Textometry, and Linked Data for a Semantically Enriched Interview Corpus},
booktitle = {Proceedings of LREC 2026},
year = {2026},
address = {Palma de Mallorca, Spain}
}