paint-brush
OpenCitations Meta: Tartışmaile@categorize
108 okumalar

OpenCitations Meta: Tartışma

Çok uzun; Okumak

featured image - OpenCitations Meta: Tartışma
Categorize.Tech: Organizing the World of Software HackerNoon profile picture
0-item

Yazarlar:

(1) Arcangelo Massari, Açık Bilimsel Meta Veri Araştırma Merkezi, Klasik Filoloji ve İtalyan Araştırmaları Bölümü, Bologna Üniversitesi, Bologna, İtalya {[email protected]};

(2) Fabio Mariani, Felsefe ve Sanat Bilimleri Enstitüsü, Leuphana Üniversitesi, Lüneburg, Almanya {[email protected]};

(3) Ivan Heibi, Açık Bilimsel Meta Veri Araştırma Merkezi, Klasik Filoloji ve İtalyan Çalışmaları Bölümü, Bologna Üniversitesi, Bologna, İtalya ve Dijital Beşeri Bilimler İleri Araştırma Merkezi (/DH.arc), Klasik Filoloji ve İtalyan Çalışmaları Bölümü, Üniversite Bologna, Bologna, İtalya {[email protected]};

(4) Silvio Peroni, Açık Bilimsel Meta Veri Araştırma Merkezi, Klasik Filoloji ve İtalyan Çalışmaları Bölümü, Bologna Üniversitesi, Bologna, İtalya ve Dijital Beşeri Bilimler İleri Araştırma Merkezi (/DH.arc), Klasik Filoloji ve İtalyan Çalışmaları Bölümü, Üniversite Bologna, Bologna, İtalya {[email protected]};

(5) David Shotton, Oxford e-Araştırma Merkezi, Oxford Üniversitesi, Oxford, Birleşik Krallık {[email protected]}.

Bağlantı Tablosu

5. Tartışma

Bölüm 2'de gösterildiği gibi, yalnızca semantik yayınlama veri kümeleri dikkate alındığında, şu anda Crossref, DataCite ve NIH Open Citation Collection'dan (ICite ve diğerleri, 2022) verileri içeren OpenCitations Meta, veri hacmi açısından ilk sırada yer almaktadır. Dahası, Japan Link Center (Hara, 2020), OpenAIRE Araştırma Grafiği (Atzori ve diğerleri, 2017) ve Dryad Digital Repository (Vision, 2010) gibi yeni kaynaklardan veri alma çalışmaları halihazırda devam etmektedir.


OpenAIRE Araştırma Grafiği ile karşılaştırıldığında, OpenCitations Meta'nın işlevsellik açısından avantajları vardır: yani, OpenCitations Meta içindeki her varlığı tanımlamak için dahili olarak kullanılan global benzersiz kalıcı tanımlayıcılar olan OMID'lerin kullanımı. Bu kullanım, Dijital Nesne Tanımlayıcı (DOI) gibi harici bir kalıcı tanımlayıcıya sahip olmayan bibliyografik kaynaklar arasındaki alıntıların temsil edilmesini ve indekslenmesini mümkün kılar. Bu özellik, OpenCitations Dizinleri için önemli bir değer katmaktadır; çünkü ilk kez şimdiye kadar karakterize edilmesi mümkün olmayan birçok alıntının, özellikle de beşeri bilimler ve sosyal bilimlerdeki yayınlar arasındaki alıntıların alınmasına olanak sağlamaktadır (Gorraiz ve diğerleri, 2016). ve genellikle kalıcı bir tanımlayıcı içermeyen bir heykel, tablo veya kodeks gibi birincil kaynakları içeren alıntılar. Daha da önemlisi, bir OMID'ye sahip olmak, tanımlanan kaynağa benzersiz bir URL atanmasına da izin verir; örneğin omid:br/061401975837 için https://w3id.org/oc/meta/br/061401975837.


Bildiğimiz kadarıyla yalnızca OpenCitations Meta'da bulunan bir diğer özellik, RDF'de saklanan kaynak bilgileri içindeki değişiklik izleme yönetimi mekanizmasıdır. Bu bilgiler Python zaman agnostik kütüphane yazılımı kullanılarak sorgulanabilir (Massari ve Peroni, 2022). Zaman geçişli SPARQL sorgularını, yani kaynak bilgileriyle birlikte farklı anlık görüntülerdeki sorguları gerçekleştirebilir.


Anlamsal Web teknolojilerini kullanmayan diğer bibliyografik veri kümeleri açısından OpenAlex (Priem ve diğerleri, 2022), OpenCitations Meta ile karşılaştırma için dikkate alınması gereken önemli bir durumdur. OpenAlex, OpenCitations Meta ile karşılaştırıldığında kaynakların verilerinde görünen daha fazla sayıda hatayı otomatik olarak düzeltmesine olanak tanıyan bir özellik olan eksik meta verileri eklemek için web taramalarını kullanır.


Aslında şu anda OpenCitations Meta'nın ana sınırlaması, kesinlikle kaynakların kalitesine bağlı olan verilerin kalitesiyle ilgilidir. Crossref, yayıncılar tarafından sağlanan meta verileri tekrar kontrol etmez ve bu nedenle birçok hata korunur. Örneğin gelecekte yayınlanacak makalelere rastlamak mümkün (https://api.crossref.org/v1/works/10.12960/tsh.2020.0006 adresinde bulunan meta veriler, makalenin 2029 yılında basılı olarak yayınlanacağını söylüyor). Bu hataların bazıları herhangi bir arka plan bilgisi gerektirmeden otomatik olarak düzeltilebilirken, bazıları ise web tarayıcılarının kullanımını veya manuel müdahaleyi gerektirir. OpenAlex web tarama yolunu takip ederken, OpenCitations da verilerin güvenilir insan alanı uzmanları (akademik kütüphaneciler gibi) tarafından düzenlenmesine ve iyileştirilmesine olanak sağlayacak bir çerçeve üzerinde çalışıyor.


OpenCitations Meta, temel amacını, OpenCitations Dizinleri içindeki alıntılarda yer alan alıntıları ve alıntı yapılan yayınları tanımlamak için gereken bibliyografik meta verileri tutarak yerine getirir. Bununla birlikte, bu bibliyografik meta veri öğelerine ek olarak, akademik topluluk için büyük önem taşıyan ek meta veri öğelerinin de bulunduğunun bilincindeyiz: Metin madenciliği için özetler, alan ve konu alanı belirleme ve indeksleme (bu kitabın tam metinleri olsa bile). yayınlar başka yerlerde açık erişime açıktır) ve Fon Sağlayıcı Kimlikleri, Finansman bilgileri ve Kurumsal tanımlayıcılar, performans ölçütlerinin belirlenmesi ve araştırma değerlendirmesinin yapılması için gereklidir. Metinsel arama operasyonlarımızın sağlanmasını tamamladıktan, kapsamımızı belirtilen şekillerde genişlettikten ve OpenCitations Meta ve OpenCitations Dizinlerinin üzerinde çalıştığı hesaplama altyapısını geliştirdikten sonra, bu ek meta veri alanlarını entegre etmeye ve doldurmaya devam edeceğiz.


Yüksek kaliteli bibliyografik meta verilerin sağlanması, otomatik işlemlerle gerçekleştirilmesi karmaşık ve zor bir hedeftir; işlemlerin ölçeği ise, kayıtların azınlığı dışında manuel düzenlemeyi engellemektedir. Şu anda hiçbir bibliyografik veri seti bu hedefe tek başına ulaşamamaktadır. Bu nedenle mevcut tüm bibliyografik veritabanları tamamlayıcı olarak görülmelidir. Örneğin, OpenAlex şu anda daha kaliteli meta veriler sağlarken, OpenCitations Meta'da tam kaynak verileri açık olarak mevcuttur ve Anlamsal Web teknolojilerinin sağladığı olanaklar sayesinde daha karmaşık aramalara olanak sağlar. Örneğin, "2009'dan sonra Springer tarafından yayınlanan konferans bildirilerinde Silvio Peroni veya Fabio Vitali ile birlikte yazan tüm yazarları arayın". Ayrıca, OpenAlex yalnızca kısmen ücretsizdir, çünkü API aracılığıyla günde yüz binden fazla istek yapmak ve API aracılığıyla her saat güncellenen verilere (dump aracılığıyla her ay yerine) erişmek için bir ücret ödenmesi gerekir[9]. Buna karşılık, kullanıcılar OpenCitations Meta'nın en son sürümüne ücretsiz olarak sınırsız istekte bulunabilir.


Ayrıca, OpenAIRE Araştırma Grafiği şu anda daha fazla meta veri içerse de, bu tür veriler bir CC-BY atıf lisansı altında yayınlanırken, OpenCitations Meta tarafından yayımlanan veriler CC0 kamu malı feragati altındadır ve ticari yeniden kullanım da dahil olmak üzere yeniden kullanım için tam bir özgürlüğe izin verir ve herhangi bir atıf gerekmeksizin makineyle işleme için.