paint-brush
OpenCitations Metası: Metodolojiile@categorize

OpenCitations Metası: Metodoloji

Çok uzun; Okumak

featured image - OpenCitations Metası: Metodoloji
Categorize.Tech: Organizing the World of Software HackerNoon profile picture
0-item

Yazarlar:

(1) Arcangelo Massari, Açık Bilimsel Meta Veri Araştırma Merkezi, Klasik Filoloji ve İtalyan Araştırmaları Bölümü, Bologna Üniversitesi, Bologna, İtalya {[email protected]};

(2) Fabio Mariani, Felsefe ve Sanat Bilimleri Enstitüsü, Leuphana Üniversitesi, Lüneburg, Almanya {[email protected]};

(3) Ivan Heibi, Açık Bilimsel Meta Veri Araştırma Merkezi, Klasik Filoloji ve İtalyan Çalışmaları Bölümü, Bologna Üniversitesi, Bologna, İtalya ve Dijital Beşeri Bilimler İleri Araştırma Merkezi (/DH.arc), Klasik Filoloji ve İtalyan Çalışmaları Bölümü, Üniversite Bologna, Bologna, İtalya {[email protected]};

(4) Silvio Peroni, Açık Bilimsel Meta Veri Araştırma Merkezi, Klasik Filoloji ve İtalyan Çalışmaları Bölümü, Bologna Üniversitesi, Bologna, İtalya ve Dijital Beşeri Bilimler İleri Araştırma Merkezi (/DH.arc), Klasik Filoloji ve İtalyan Çalışmaları Bölümü, Üniversite Bologna, Bologna, İtalya {[email protected]};

(5) David Shotton, Oxford e-Araştırma Merkezi, Oxford Üniversitesi, Oxford, Birleşik Krallık {[email protected]}.

Bağlantı Tablosu

3. Metodoloji

OpenCitations Meta, CSV formatındaki (yani tablo biçiminde) giriş verilerinden doldurulur. Bu seçim tesadüfi değildir. OpenCitations tarafından CSV formatında sunulan verilerin (örn. COCI'den (OpenCitations, 2022)) daha yapılandırılmış formatlardaki (örn. JSON Scholix ve RDF N-Quads) aynı verilerle karşılaştırıldığında daha sık indirildiğini bulduk. Bunun nedeni, dosya boyutunun daha küçük olmasıdır (N-Quads ve Scholix ile karşılaştırıldığında) ve her şeyden önce tablo formatının insanlar için daha yüksek okunabilirliğidir. İkincisi, OpenCitations Meta'nın benimsediği girdi formatının CSV olmasının ana nedenidir; böylece bibliyografik meta verilerin insan küratöryel faaliyetlerinden gelecekte kitlesel olarak elde edilmesini kolaylaştırır (Heibi ve diğerleri, 2019a).


OpenCitations Meta'nın giriş tablosunda OCDM'nin doğrusallaştırılmasına karşılık gelen on bir sütun bulunur (Daquino ve diğerleri, 2020): kimlik, başlık, yazar, editör, yayın tarihi, mekan, cilt, sayı, sayfa, tür ve yayıncı. Her alanın nasıl yapılandırıldığına dair ayrıntılı bir açıklama için lütfen bkz. (Massari ve Heibi, 2022).


Tablo 1: İçerdiği araştırma birimlerinin sayısına göre sıralanan ve değişiklik izleme, kaynak, belirsizliği giderme yöntemi, dahili kimliğin varlığı, erişilebilirlik ve veri kullanım lisansına göre karşılaştırılan açık bilimsel veri kümeleri


CSV tablo verileri alındıktan sonra, veriler ilk önce otomatik olarak düzenlenir (Küratör adımı) ve ardından OCDM'ye (Yaratıcı adımı) dayalı olarak RDF'ye dönüştürülür. Son olarak, seçilen CSV ve RDF dosyalar olarak depolanırken karşılık gelen üçlü depo artımlı olarak doldurulur. Şekil 2 iş akışını özetlemektedir.


Şekil 2: OpenCitations Meta iş akışı. İlk olarak, CSV formatındaki giriş verileri otomatik olarak düzeltilir (1), tekilleştirilir ve üçlü depodan (2) önceden var olan bilgilerle zenginleştirilir. Düzeltilen CSV çıktı (3a) olarak döndürülür. İkinci olarak veriler RDF'ye (3b) dönüştürülür, dosyaya (4a) kaydedilir ve son olarak üçlü depoya (4b) girilir.

3.1 Küratör: tekilleştirme, zenginleştirme ve düzeltme

İyileştirme süreci, alınan verilerin kalitesini artırmak için üç ana eylemi gerçekleştirir: tekilleştirme, zenginleştirme ve düzeltme.


Veri tekilleştirme için seçilen yaklaşım kesinlikle tanımlayıcılara dayanmaktadır. Başka bir deyişle, iki farklı varlık ancak ve ancak her ikisinin de aynı tanımlayıcıya sahip olması durumunda aynı kabul edilir; örneğin makaleler için bir DOI, kişiler için bir ORCID, kitaplar için bir ISBN ve yayın yerleri (örneğin dergiler) için bir ISSN.


Aynı tanımlayıcıya sahip farklı kaynaklar kesin bir kurala göre birleştirilir: (1) kaynaklar aynı CSV dosyasının parçasıysa, ilk oluşuma ait bilgi tercih edilir. Ancak (2) eğer kaynak zaten üçlü depoda tanımlanmışsa, üçlü depodaki bilgiler tercih edilecektir. Başka bir deyişle, üçlü depoda saklanan bilgilerin güvenilir olduğunu düşünüyoruz ve bu bilgiler yalnızca bir CSV kaynağından gelen ek verilerle artırılabilir.


Bir varlık tekilleştirildiğinde ona OpenCitations Meta Tanımlayıcı (OMID) adı verilen yeni, kalıcı bir dahili tanımlayıcı atanır. OMID, [entity_type_abbreviation]/[supplier_prefix][sequential_number] yapısına sahiptir. Örneğin, şimdiye kadar işlenen ilk dergi makalesi OMID br/0601'e sahiptir; burada br, "bibliyografik kaynak"ın kısaltmasıdır ve 060, bibliyografik kaynağın ait olduğu veritabanını belirten tedarikçi önekine karşılık gelir (bu durumda OpenCitations). Meta). Son olarak 1, bu OMID'nin, dizinin söz konusu önek için kaydedilen ilk bibliyografik kaynağını tanımladığını gösterir.


Daha kesin olarak, OpenCitations Meta için kullanılan tedarikçi öneki “06[1-9]*0”dır, yani “06” isteğe bağlı olarak ardından sıfır ve sonunda “0” hariç herhangi bir sayı gelir. Örneğin, "060", "0610" ve "06230" OpenCitations Meta'daki geçerli tedarikçi önekleridir.


Tekilleştirmeye tabi olan ve daha sonra bir OMID ile tanımlanan varlıklar, harici tanımlayıcılar (kısaltılmış kimlik), temsilci rolleri (yani yazarlar, editörler, yayıncılar, kısaltılmış ar), sorumlu aracılar (yani kişiler ve kuruluşlar, kısaltılmış ra), kaynak düzenlemeleri (yani sayfalar, kısaltılmış yeniden) ve mekanlar, ciltler ve sayılar (bunların tümü bibliyografik kaynaklardır, kısaltılmış br). Ciltler ve sayılar OMID'lere sahiptir çünkü bunlara makalelerin nitelikleri değil, birinci sınıf vatandaş muamelesi yapılır. Bunun, örneğin belirli bir sayıdaki makaleleri, adı geçen bir derginin ciltlerini veya belirli bir zaman dilimi içinde yayınlanan dergi sayılarını aramasına izin verme avantajı vardır. Bunun aksine, başlıklar ve tarihler varlıklar olarak değil, gerçek değerler olarak ele alınır.


Şekil 3 tekilleştirme karar ağacını göstermektedir. Bir girdi varlığı ve onun tanımlayıcıları göz önüne alındığında altı olası sonuç vardır:


  1. Varlığın tanımlayıcıları yoksa veya bunlar üçlü depoda mevcut değilse varlık için yeni bir OMID oluşturulur;


  2. Varlığın bir OMID'si yoksa ve harici tanımlayıcılarından biri zaten bir ve yalnızca bir başka varlıkla ilişkilendirilmişse, bu durumda iki varlık birleştirilir ve aynı şekilde ele alınır;


  3. Varlığın CSV'deki harici tanımlayıcıları, üçlü depo içinde şimdiye kadar farklı olan iki veya daha fazla varlığı birbirine bağlarsa ve CSV'de hiçbir OMID belirtilmezse, otomatik olarak çözülemeyen ve manuel müdahale gerektirecek bir çakışma ortaya çıkar. Bu çelişkili varlık için yeni bir OMID üretildi. Örneğin, CSV'de aynı günlük adı iki tanımlayıcıyla ilişkilidir: issn:1588-2861 ve issn:0138-9130; ancak üçlü depoda, biri issn:1588-2861 tanımlayıcısına ve diğeri issn:0138-9130 tanımlayıcısına sahip iki ayrı varlık için girişler vardır; bunlar gerçekte aynı varlığa atıfta bulunur;


  4. CSV'deki bir varlığın üçlü depoda bulunan bir OMID'si varsa ve başka kimlik yoksa, üçlü depodaki bilgiler CSV'deki bilgilerin üzerine yazar. Daha sonra üçlü mağaza yalnızca eksik ayrıntıların eklenmesiyle güncellenir. Başka bir deyişle, CSV'deki bir varlık için OMID'yi belirtmek, OpenCitations Meta'daki mevcut bir varlığı güncellemenin bir yoludur;


  5. Bir varlığın mevcut bir OMID'si varsa ve ek tanımlayıcılar, OMID'si olmayan (CSV'de) veya aynı OMID'ye (CSV'de veya üçlü depoda) sahip diğer varlıklarla ilişkilendirilmişse varlıklar birleştirilir. Ayrıca, CSV'deki bilgilerin üzerine üçlü depoda zaten mevcut olan bilgiler yazılır ve CSV'de bulunan eksik ayrıntılar daha sonra üçlü depoya eklenir;


  6. Son olarak, harici tanımlayıcılar üçlü depodaki çeşitli varlıkları farklı OMID'lerle bağlarsa bir çakışma ortaya çıkar. Bu durumda CSV'de belirtilen OMID öncelikli olur ve yalnızca bu OMID'ye sahip varlıklar birleştirilir.


Bu genel kurallar göz önüne alındığında, üç özel durum özel ilgiyi hak etmektedir. Dikkate değer ilk konu, OCDM'ye göre korunması gereken yazar ve editör sırası ile ilgilidir. Birleşme durumunda, varlık ilk yaratıldığında kaydedilen sıra sonrakilerin üzerine yazılır ve Şekil 4'te gösterildiği gibi yeni yazarlar veya editörler mevcut listenin sonuna eklenir.


Şekil 3: Tekilleştirme karar ağacı


Şekil 4: Birleştirme sırasında bulunan ilk bilgi önceliklidir. Bu örnekte David Shotton, yazarlar listesinde Silvio Peroni'den sonra eklenmiştir çünkü Shotton ikinci durumda Peroni'den önce görünse bile Peroni zaten ilk yazar olarak kaydedilmiştir.


İkinci olarak, iki bibliyografik kaynağın birleştirilmesi bağlamında, bir tanımlayıcı olmaksızın yazar veya editör olarak yer alan kişiler, verilen adlara ve aile adlarına göre netleştirilir.


Son önemli durum makaleler, sayılar, ciltler ve mekânlar arasındaki kapsama ilişkisini içeriyor. Bu yapı, iki cildin veya sayının yalnızca aynı değere sahip olmaları durumunda aynı kabul edildiği, yani sıralı bir sayı (örneğin "Cilt 1") veya isteğe bağlı bir ad (örneğin "Clin_Sect") olabilen birleştirme durumunda korunur. ).

3.2 Küratör: hata önleme

Tüm varlıklar bir OMID aldıktan sonra veriler normalleştirilir ve otomatik olarak işlenebilen hatalar düzeltilir. Tüm tanımlayıcılar, tanımlayıcı şemalarına göre kontrol edilir; örneğin, ISBN'lerin, ISSN'lerin ve ORCID'lerin sözdizimsel doğruluğu, tanımlayıcı şemasının dokümantasyonu tarafından sağlanan özel formüller kullanılarak hesaplanır. Bununla birlikte, tanımlayıcıların semantik doğruluğu yalnızca ORCID'ler ve DOI'ler için doğrulanır; bu, onların gerçek varlığını doğrulamak için açık API'ler kullanılarak yapılır; örneğin, sözdizimsel olarak geçerli olan ancak gerçekte geçerli olmayan bir ORCID üretmek mümkündür. bir kişiye atanır.


Boşluk için kullanılan tüm belirsiz ve alternatif karakterler (örneğin sekme, aralıksız boşluk, em boşluğu) boşluğa dönüştürülür (Unicode karakter U+0020). Benzer şekilde, kimlikler, sayfalar, ciltler, sayılar, yazarlar ve editörler içindeki kısa çizgilerin belirsiz karakterleri (örneğin, bölünemeyen kısa çizgiler, kısa çizgi, eksi işareti) kısa çizgi eksi (Unicode karakteri U+002D) olarak değiştirilir.


Bibliyografik kaynakların başlıklarına ilişkin olarak (“yer” ve “başlık” sütunları), büyük harflerle yazılanlar (muhtemelen kısaltmalardır, örneğin “FaBiO” ve “CiTO”) hariç, başlıktaki her kelime büyük harfle yazılmıştır. Ancak bu istisna tamamen büyük harfle yazılan unvanları kapsamaz. Aynı kural, ister birey ister kuruluş olsun, yazarlar ve editörler için de uygulanır.


Tarihler, hem ISO 8601'e (YYYYAA-GG) (Wolf & Wicksteed, 1997) dayalı format geçerliliği hem de değer (örn. 30 Şubat geçerli bir tarih değil) dikkate alınarak ayrıştırılır. Gerektiğinde tarih kısaltılır. Örneğin 2020-02-30 tarihi, verilen tarihin günü geçersiz olduğundan 2020-02'ye dönüştürüldü. benzer şekilde, ay (ve dolayısıyla gün) geçersiz olduğundan 2020-27-12, 2020'ye kısaltılacaktır. Yıl geçersizse (örneğin 9999'dan büyük bir yıl) tarih atılır.


Cilt ve sayı numaralarının düzeltilmesi, özel olarak anılmayı hak eden çok sayıda kurala dayanmaktadır. Genel olarak oluşabilecek altı hata sınıfını belirledik ve her farklı sınıf buna göre ele alındı:


  1. Aynı alanda cilt numarası ve sayı numarası (örn. “Cilt 35 N° özel 1”). İki değer ayrılır ve ilgili alana atanır.


  1. Önek hataları (örn. “.38”). Önek silinir.


  2. Sonek hataları (örneğin “19/”). Sonek silinir.


  3. Kodlama hataları (örneğin “5â\x80\x926”, “38â39”, “3???4”). Yalnızca uçlardaki sayılar korunur ve tek bir kısa çizgiyle ayrılır. Bu nedenle “â\x80\x92”, “â” ve “???” nedeniyle örnekler sırasıyla “5-6”, “38-39” ve “3-4” olarak düzeltilmiştir. yanlış kodlanmış kısa çizgilerdir.


  4. Sayı olarak sınıflandırılan cilt (örn. "Sayı" alanında "Cilt 1"). "Sorun" alanında hacim deseni bulunursa ve "cilt" alanı boşsa içerik "cilt" alanına taşınır ve "sorun" alanı boş olarak ayarlanır. Ancak, "sorun" alanı bir hacim modeli içeriyorsa ve "hacim" alanı bir sorun modeli içeriyorsa, iki değer değiştirilir.


  5. Cilt olarak sınıflandırılan sayı (örneğin “cilt” alanında “Özel Sayı 2”). Durum 5 ile aynı şekilde, ancak ters rollerde ele alınır.


Fransızca'da 'tome', Türkçe'de 'cilt' gibi çeşitli dillerde “orijinal seri”, “hacim”, “cilt” ve hacim kelimelerini içeren kalıpları cilt olarak değerlendirdik. Örneğin, “Orijinal Seri”, “Cilt 1”, “Cilt 71”, “Cilt 1” ve “Cilt: 1” cilt olarak sınıflandırılır. Bunun yerine, “horssérie” (Fransızca özel sayı) ve “özel sayı” (Türkçe özel sayı) gibi “sayı”, “özel sayı” ve çeşitli dillerdeki sayı kelimelerini içeren kalıpları nüsha olarak değerlendirdik. Örneğin “sayı 2”, “özel sayı 2”, “Özel sayı 'Kent Morfolojisi'', “Özel Sayı 5” ve “Hors-série 5” sayı olarak sınıflandırılmaktadır.


Son olarak, bir değerin hem format olarak geçersiz olması hem de yanlış alanda olması nedeniyle geçersiz olması durumunda, bu tür bir değer önce düzeltilir ve daha sonra uygunsa sağ alana taşınır.


Giriş verileri netleştirildikten, zenginleştirildikten ve düzeltildikten sonra yeni bir CSV dosyası oluşturulur ve saklanır. Bu dosya sürecin ilk çıktısını temsil eder (Şekil 2'de 3a).

3.3 Oluşturan: anlamsal haritalama

Bu aşamada veriler OCDM'yi takiben RDF'de modellenir (Daquino ve diğerleri, 2020). Bu ontoloji, bibliyografik varlıkları (fabio:Expression), tanımlayıcıları (datacite:Identifier), aracı rollerini (pro:RoleInTime), sorumlu aracıları (foaf:Agent) ve yayın formatı ayrıntılarını (fabio:Manifestation) temsil etmek için SPAR Ontolojilerinde tanımlanan varlıkları yeniden kullanır. . Aracı rolü (yani yazar, editör veya yayıncı), bibliyografik kaynak ile sorumlu aracı, yani kişi veya kuruluş arasında vekil olarak kullanılır. Bu yaklaşım, yazarların sırası gibi zamana bağlı ve bağlama bağlı rolleri ve durumları tanımlamamıza yardımcı olur (Peroni ve diğerleri, 2012). Şekil 5, Graffoo grafik çerçevesi aracılığıyla çeşitli varlıklar arasındaki ilişkileri göstermektedir (Falco ve diğerleri, 2014).


Şekil 5: OpenCitations Meta'da kullanılan OCDM'nin bir kısmı. Sarı dikdörtgenler sınıfları, yeşil çokgenler veri türlerini, mavi ve yeşil oklar sırasıyla nesne özelliklerini ve veri özelliklerini temsil eder.


Örneğin, OpenCitations Meta'da OMID omid:br/062601067530 olan varlığın başlığı Açık Erişim ve Çevrimiçi Yayıncılık: Hemşirelikte Yeni Bir Sınır mı? (dcterms:title) ve 2012-07-25'te yayınlandı (prism:publicationDate). FRBR (Tillett, 2005) kullanıldığında, makale, orijinal çalışmanın yayınlanmış son versiyonu veya bir ifadesidir (fabio:Expression), örnek olarak omid:re/06260837633 (frbr:embodiment) varlığına sahiptir; Dergi cildinin 1905-1908 sayfalarına karşılık gelen basılı yayın (prism:startingPage, prizma:endingPage). Daha doğrusu, makale Journal Of Advanced Nursing'in (fabio:Journal) 68 numaralı cildinde (fabio:JournalVolume) yer alan (fabio:JournalIssue) 9 numaralı sayısının (fabio:hasSequenceIdentifier) (frbr:partOf) bir parçasıdır. ).


Ayrıca, (foaf:Agent) Glenn Hunt (foaf:givenName, foaf:familyName) adlı kişi bu makalenin (pro:isDocumentContextFor) bağlamındaki ilk yazardır (pro:RoleInTime). Benzer şekilde ikinci yazar Michelle Cleary'dir (pro:hasNext).


Son olarak, bu yayında, datacite:Identifier türünde bir varlık olan OpenCitations Meta Tanımlayıcısı (OMID) omid:id/062601093630 (datacite:hasIdentifier) bulunmaktadır. Aynı zamanda, tanımlayıcı şeması olarak Dijital Nesne Tanımlayıcıyı (DOI) (datacite:usesIdentifierScheme) kullanan ve “10.1111/j.1365- 2648.2012.06023.x” (literal:hasLiteralValue) değişmez değerine sahip olan harici bir tanımlayıcıya sahiptir.


Haritalama tamamlandığında, üretilen RDF verileri depolanabilir (Şekil 2'de 4a) ve üçlü depoya (Şekil 2'de 4b) yüklenebilir.

3.4 Oluşturucu: kaynak ve değişiklik takibi

OpenCitations Meta'da meta verilerinin işlenmesinin yanı sıra varlıklar için kaynak ve değişiklik takibine de büyük önem verilmektedir. Kaynak, belirli bir varlığı kimin oluşturarak, silerek, değiştirerek veya birleştirerek işlediğinin, bu eylemin ne zaman gerçekleştirildiğinin ve birincil kaynağın ne olduğunun kaydıdır (Gil ve diğerleri, 2010). OpenCitations Meta'daki meta verilerin güvenilirliğini sağlamak için bu bilgilerin takibi çok önemlidir. Gerçekten de Web ve Anlamsal Web'deki bir ifadenin doğruluğu hiçbir zaman mutlak değildir ve bütünlüğün, bilgiyi işleyen her uygulama tarafından bağlamını değerlendirerek değerlendirilmesi gerekir (Koivunen ve Miller, 2001).


Bununla birlikte, kaynak bilgisini saklamanın yanı sıra, varlıkların evrimini anlamaya yönelik mekanizmalar, düzeltmeler veya yanlış tanımlama nedeniyle yapılan değişikliklerin bir bilim insanının, bir araştırma grubunun veya bir araştırma grubunun genel değerlendirmesini etkileyebildiği araştırma değerlendirme alıştırmaları gibi faaliyetlerle uğraşırken kritik öneme sahiptir. bütün bir kurum. Örneğin, bir kurumun adı zaman içinde değişebilir ve bu değişikliklerin veri tabanına yansıması “kurumun geçmişine dair herhangi bir bilgi olmadan tüm kurumun adlarının ve birimlerinin tanımlanmasını zorlaştırır” (Pranckut˙e, 2021). Bu senaryo, veri tabanındaki verilerin nasıl geliştiği takip edilerek önlenebilir, böylece kullanıcıların harici arka plan bilgisine erişmeden bu dinamikleri anlamaları sağlanır. Bildiğimiz kadarıyla, bilimsel meta verileri içeren başka hiçbir semantik veritabanı, standart RDF 1.1'deki değişiklikleri ve kökenleri takip etmemektedir.


OpenCitations tarafından kullanılan kaynak mekanizması, her saklanan varlık için bir ilk oluşturma anlık görüntüsünü tanımlar ve bunu potansiyel olarak Şekil 6'da özetlendiği gibi her biri kendi anlık görüntü numarasıyla işaretlenmiş, verilerin değiştirilmesini, birleştirilmesini veya silinmesini detaylandıran diğer anlık görüntüler takip eder.


Şekil 6: Bir varlıktaki değişiklikleri takip etmek için OCDM'nin kaynak katmanının üst düzey açıklaması. Bir varlığın tam geçmişini takip etmek için, onun en son anlık görüntüsünün tüm üçlülerini ve önceki anlık görüntüleri değiştirerek oluşturulan tüm deltaları saklamamız gerekir.


Anlamsal temsille ilgili olarak, kaynak modelleme (Sikos ve Philp, 2020) ve RDF'de değişiklik izleme (Pelgrin ve diğerleri, 2021) sorunu bilimsel literatürde tartışılmıştır. Bugüne kadar hiçbir ortak standart her iki amaca da ulaşamıyor. Bu nedenle OpenCitations, adlandırılmış grafikler (Carroll ve diğerleri, 2005), Provenance Ontology (Lebo ve diğerleri, 2013) ve Dublin Core (Board, 2020) gibi en yaygın olarak paylaşılan yaklaşımları kullanır.


Özellikle, her anlık görüntü bir öncekine prov:wasDerivedFrom yüklemi aracılığıyla bağlanır ve tanımladığı varlığa prov:specializationOf aracılığıyla bağlanır. Ek olarak, her bir anlık görüntü, kaynak meta verilerinin, yani sorumlu aracının (prov:wasAttributedTo), birincil kaynağın (prov:hadPrimarySource), oluşturma zamanının (prov:geneatedAtTime) ve ek bir anlık görüntünün oluşturulması, geçersiz kılma süresi (prov:invalidatedAtTime). Her bir anlık görüntü, isteğe bağlı olarak, olup bitenlerin doğal dildeki açıklamasıyla da temsil edilebilir (dcterms:description).


Ek olarak, OCDM kaynak modeli, OpenCitations Ontology'de (Daquino ve Peroni, 2019) tanımlanan ve bir SPARQL UPDATE sorgusu yoluyla bir varlığın iki versiyonu arasındaki deltayı ifade eden yeni bir yüklem olan oco:hasUpdateQuery'yi ekler. Şekil 7, modeli bir Graffoo diyagramı aracılığıyla göstermektedir.


Şekil 7: Bir varlığın (prov:specializationOf aracılığıyla bağlantılı) anlık görüntülerini (prov:Entity) ve ilgili kaynak bilgisini açıklayan Graffoo diyagramı


Bölüm 3.1'de açıklanan veri tekilleştirme işlemi, yalnızca veri kümesinin mevcut durumu üzerinde değil, aynı zamanda değişiklik izleme mekanizmasını zorlayarak tüm geçmişi üzerinde de gerçekleşir. Başka bir deyişle, eğer bir tanımlayıcı üçlü depodan silinmiş bir varlığa kadar izlenebiliyorsa, bu tanımlayıcı silinen varlığın OMID'si ile ilişkilendirilecektir. Silme işlemi bir birleştirme zincirinden kaynaklanıyorsa, ortaya çıkan varlığın OMID'si öncelikli olur. Zaman geçişi sorguları metodolojisi hakkında daha fazla bilgi için bkz. (Massari ve Peroni, 2022). SPAR Ontolojilerine göre veri oluşturmaya ve değişiklikleri izlemeye yönelik programlama arayüzü hakkında daha fazla ayrıntı için başvurun (Persiani ve diğerleri, 2022).