Yazarlar:
(1) Arcangelo Massari, Açık Bilimsel Meta Veri Araştırma Merkezi, Klasik Filoloji ve İtalyan Araştırmaları Bölümü, Bologna Üniversitesi, Bologna, İtalya {[email protected]};
(2) Fabio Mariani, Felsefe ve Sanat Bilimleri Enstitüsü, Leuphana Üniversitesi, Lüneburg, Almanya {[email protected]};
(3) Ivan Heibi, Açık Bilimsel Meta Veri Araştırma Merkezi, Klasik Filoloji ve İtalyan Çalışmaları Bölümü, Bologna Üniversitesi, Bologna, İtalya ve Dijital Beşeri Bilimler İleri Araştırma Merkezi (/DH.arc), Klasik Filoloji ve İtalyan Çalışmaları Bölümü, Üniversite Bologna, Bologna, İtalya {[email protected]};
(4) Silvio Peroni, Açık Bilimsel Meta Veri Araştırma Merkezi, Klasik Filoloji ve İtalyan Çalışmaları Bölümü, Bologna Üniversitesi, Bologna, İtalya ve Dijital Beşeri Bilimler İleri Araştırma Merkezi (/DH.arc), Klasik Filoloji ve İtalyan Çalışmaları Bölümü, Üniversite Bologna, Bologna, İtalya {[email protected]};
(5) David Shotton, Oxford e-Araştırma Merkezi, Oxford Üniversitesi, Oxford, Birleşik Krallık {[email protected]}.
Bu makale, OpenCitations Dizinlerinde yer alan tüm yayınlar için bibliyografik meta verileri saklayan ve sağlayan bir veritabanı olan OpenCitations Meta'yı geliştirmek için kullanılan metodolojiyi ayrıntılı olarak açıkladı. Bu süreç iki ana aşamayı içerir: (1) varlıkları tekilleştirmeyi, hataları düzeltmeyi ve bilgileri zenginleştirmeyi amaçlayan otomatik bir iyileştirme analizi ve (2) RDF'deki değişiklikleri ve kaynağı takip ederken RDF'ye veri dönüştürme.
Crossref, DataCite ve PubMed'e yeni yayınlarla ilgili bilgiler sürekli olarak eklenmektedir ve bu yeni meta verileri OpenCitations Meta'ya düzenli ve zamanında almak için prosedürler geliştireceğiz. Ayrıca, Japan Link Center ve OpenAIRE Araştırma Grafiğinden bibliyografik meta verileri alma çalışmaları halihazırda devam etmektedir ve diğer kaynaklar, insan ve hesaplama kaynaklarımızın izin vermesi halinde dahil edilecektir. OpenCitations Meta böylece büyümeye devam edecek.
OpenCitations Meta'nın üç önemli faydası vardır. İlk olarak, tüm depolanan varlıklar için OMID'lerin (OpenCitation Meta Tanımlayıcıları) kullanılması, OpenCitations Meta'nın birden fazla harici PID'ye (örneğin, DOI (Dijital Nesne Tanımlayıcı) sahip Crossref'te açıklanan bir dergi makalesi) sahip olabilecek yayınlar için bir eşleme merkezi görevi görmesini sağlar. ) ve PubMed'de bir PMID (PubMed Tanımlayıcı) ile tanımlanan aynı yayın, aynı zamanda herhangi bir harici PID'ye sahip olmayan kaynakları içeren alıntıların karakterize edilmesini mümkün kılar. Sonuç olarak, OpenCitations Meta'nın OpenCitations Dizinlerindeki alıntıların şu şekilde tanımlanmasına izin vermesidir. OMID'den OMID'ye, farklı tanımlayıcı şemalara sahip belgeler arasındaki alıntıların belirsizliğini ortadan kaldırır; örneğin Crossref'te DOI'den DOI'ye ve PubMed'de PMID'den PMID'ye olarak temsil edilir. Üçüncüsü, OpenCitations Meta, alıntılarda yer alan yayınlara ilişkin meta verileri almak için arama işlemlerini hızlandırır. Bu meta veriler artık harici kaynaklara yapılan anında API çağrılarıyla alınmak yerine şirket içinde tutulduğundan, OpenCitations Atıf Dizinlerinde depolanır.
Gelecekteki zorluklar, ORCID tanımlayıcısı olmayan kişiler için bir netleştirme sistemi geliştirmek, mevcut meta verilerin kalitesini artırmak, arama operasyonlarını ve depolama verimliliğini artırmak, Özetler, Fon Sağlayıcı Kimlikleri, Finansman bilgileri ve için ek meta veri alanları eklemek olacaktır. Kurumsal tanımlayıcılar ve bu meta verilerin kaynaklarımızda mevcut olduğu yerlerde bunları doldurmak.
Son olarak, OpenCitations Meta tarafından tutulan meta verilerin doğrudan gerçek zamanlı manuel olarak düzenlenmesine olanak tanıyan bir arayüz uygulanacak ve güvenilir alan uzmanlarının kullanımına sunulacak. Böyle bir sistem, değişiklikleri ve kaynağı izleyecek, her varlığın farklı sürümleri arasındaki deltayı koruyacak ve değişiklikten sorumlu aracı, birincil kaynak ve tarih gibi bilgileri koruyacaktır. Bu şekilde, OpenCitations Meta'yı yalnızca kapsamlı değil aynı zamanda bilimsel topluluğun üyelerinin doğrudan katkıda bulunabileceği doğru, tamamen açık ve yeniden kullanılabilir bir bibliyografik meta veri kaynağı haline getirmeye çalışacağız.
Bu çalışma, 101017452 numaralı hibe sözleşmesi (OpenAIRE-Nexus Projesi) kapsamında Avrupa Birliği'nin Horizon 2020 Araştırma ve Yenilik Programı tarafından kısmen finanse edilmiştir.
Abramatic, J.-F., Di Cosmo, R. ve Zacchiroli, S. (2018). Kaynak kodun evrensel arşivini oluşturmak. ACM İletişimleri, 61 (10), 29–31. https://doi.org/10.1145/3183558
Atzori, C., Bardi, A., Manghi, P. ve Mannocci, A. (2017). Veri Yönetimi için OpenAIRE İş Akışları [Seri Başlığı: Bilgisayar ve Bilgi Biliminde İletişim]. C. Grana & L. Baraldi (Ed.), Dijital Kütüphaneler ve Arşivler (s. 95–107). Springer Uluslararası Yayıncılık. https://doi.org/10.1007/978-3-319-68130-6_8
Auer, S., Oelen, A., Haris, M., Stocker, M., D'Souza, J., Farfar, KE, Vogt, L., Prinz, M., Wiens, V. ve Jaradeh, MY (2020). Bilgi Grafikleriyle Bilimsel Literatüre Erişimi Artırma. Bibliothek Forschung und Praxis, 44 (3), 516–529. https://doi.org/10.1515/bfp-2020-2042
Yönetim Kurulu, DU (2020). DCMI Meta Veri Koşulları. 16 Temmuz 2021'de http://dublincore.org/specations/dublin-core/dcmi-terms/2020-01-20/ adresinden erişildi.
Brase, J. (2009). DataCite - Araştırma Verileri için Küresel Kayıt Ajansı. 2009 Dördüncü Uluslararası Bilim ve Teknolojide Bilgi Kaynaklarının İşbirliği ve Teşviki Konferansı, 257–261. https: //doi.org/10.1109/COINFO.2009.66
Brase, J. (2010). Datacite - Araştırma Verileri için Küresel Kayıt Ajansı. SSRN Elektronik Dergisi. https://doi.org/10.2139/ssrn.1639998
Carroll, JJ, Bizer, C., Hayes, P. ve Stickler, P. (2005). Adlandırılmış grafikler, kaynak ve güven. 14. Uluslararası World Wide Web konferansının bildirileri - WWW '05, 613. https://doi.org/10.1145/1060745. 1060835
Daquino, M. ve Peroni, S. (2019). OCO, OpenCitations Ontolojisi. 4 Eylül 2021'de https://w3id.org/oc/ontology/2019-09-19 adresinden alındı.
Daquino, M., Peroni, S. ve Shotton, D. (2020). OpenCitations Veri Modeli [Çizim Boyutu: 836876 Bayt Yayıncı: figshare], 836876 Bayt. https://doi.org/10.6084/M9.FIGSHARE.3443876.V7
Dhakal, K. (2019). Ödeme duvarını kaldır. Tıp Kütüphaneleri Derneği Dergisi, 107 (2). https://doi.org/10.5195/jmla.2019.650
Avrupa Komisyonu. Araştırma ve Yenilik Genel Müdürlüğü. (2016). Avrupa açık bilim bulutunun hayata geçirilmesi: Komisyon'un üst düzey uzman grubunun Avrupa açık bilim bulutuna ilişkin ilk raporu ve tavsiyeleri. Yayınlar Ofisi. 17 Ekim 2022'de https://data.europa.eu/doi/10.2777/940154 adresinden erişildi.
Falco, R., Gangemi, A., Peroni, S., Shotton, D. ve Vitali, F. (2014). Graffoo ile OWL Ontolojilerinin Modellenmesi [Seri Başlığı: Bilgisayar Bilimlerinde Ders Notları]. V. Presutti, E. Blomqvist, R. Troncy, H. Sack, I. Papadakis ve A. Tordai (Ed.), The Semantic Web: ESWC 2014 Satellite Events (s. 320–325). Springer Uluslararası Yayıncılık. https://doi.org/10. 1007/978-3-319-11955-7_42
Fricke, S. (2018). Semantik Araştırmacı. Tıp Kütüphaneleri Derneği Dergisi, 106 (1). https://doi.org/10.5195/jmla.2018.280
Garcia, A., Lopez, F., Garcia, L., Giraldo, O., Bucheli, V. ve Dumontier, M. (2018). Biotea: Pubmed Central için Anlambilim. PeerJ, 6, e4201. https: //doi.org/10.7717/peerj.4201
Gentile, AL ve Nuzzolese, AG (2015). cLODg-Konferans Bağlantılı Açık Veri Oluşturucu. ISWC (Posterler ve Demolar).
Gil, Y., Cheney, J., Groth, P., Hartig, O., Miles, S., Moreau, L. ve Silva, P. (2010). Provenance XG Nihai Raporu [Tür: W3C.]. http://www.w3. org/2005/Incubator/prov/XGR-prov-20101214/
Gorraiz, J., Melero-Fuentes, D., Gumpenberger, C. ve Valderrama-Zurián, J.-C. (2016). Web of Science ve Scopus'ta dijital nesne tanımlayıcıların (DOI'ler) kullanılabilirliği. Informetrics Dergisi, 10 (1), 98–109. https://doi.org/ 10.1016/j.joi.2015.11.008
Haak, LL, Fenner, M., Paglione, L., Pentz, E. ve Ratner, H. (2012). ORCID: Araştırmacıları benzersiz şekilde tanımlayan bir sistem. Öğrenilmiş Yayıncılık, 25 (4), 259–264. https://doi.org/10.1087/20120404
Hammond, T., Pasin, M. ve Theodoridis, E. (2017). Veri entegrasyonu ve parçalanması: Springer Nature SciGraph'ın SHACL ve OWL ile yönetilmesi. ISWC (Posterler, Demolar ve Endüstri Parçaları). http://ceur-ws.org/Vol1963/paper493.pdf
Hara, M. (2020). Japan Link Center'ın (JaLC) Tanıtımı [Artwork Size: 2213661 Bytes Yayımcı: ORCID], 2213661 Bytes. https://doi.org/10. 23640/07243.12469094.V1
Heibi, I., Peroni, S. ve Shotton, D. (2019a). CROCI ile açık alıntıların kitle kaynak kullanımı – Açık alıntıların mevcut durumunun analizi ve bir öneri [arXiv: 1902.02534]. arXiv:1902.02534 [cs]. 15 Eylül 2021'de http://arxiv.org/abs/1902.02534 adresinden erişildi.
Heibi, I., Peroni, S. ve Shotton, D. (2019b). Yazılım incelemesi: COCI, Crossref'in OpenCitations Dizini açık DOI'den DOI'ye alıntılar. Scientometrics, 121 (2), 1213–1228. https://doi.org/10.1007/s11192-019-03217-6
Hendricks, G., Tkaczyk, D., Lin, J. ve Feeney, P. (2020). Crossref: Topluluğa ait bilimsel meta verilerin sürdürülebilir kaynağı. Nicel Bilim Çalışmaları, 1 (1), 414–427. https://doi.org/10.1162/qss_a_00022
ICite, Hutchins, BI ve Santangelo, G. (2022). iCite Veritabanı Anlık Görüntüleri (NIH Açık Alıntı Koleksiyonu) [Yayıncı: NIH Figshare Arşivi]. https: //doi.org/10.35092/YHJC.C.4586573
Koivunen, M.-R. ve Miller, E. (2001). Anlamsal Web Etkinliği [Baskı: W3C Cilt: 11 02]. https://www.w3.org/2001/12/semweb-fin/w3csw
Lammey, R. (2020). Kimlik belirleme sorunlarına yönelik çözümler: Araştırma Kuruluşu Siciline bir bakış. Bilim Düzenlemesi, 7 (1), 65–69. https://doi.org/ 10.6087/kcse.192
Lebo, T., Sahoo, S. ve McGuinness, D. (2013). PROV-O: PROV Ontolojisi [Yer: PROV-O Cilt: 04 30]. 16 Temmuz 2021'de http: //www.w3.org/TR/2013/REC-prov-o-20130430/ adresinden erişildi.
Maloney, C., Sequeira, E., Kelly, C., Orris, R. ve Beck, J. (2013). PubMed Merkezi. NCBI El Kitabı'nda.
Manghi, P., Manola, N., Horstmann, W. ve Peters, D. (2010). Avrupa Komisyonu Tarafından Finanse Edilen Araştırma Çıktılarının Yönetilmesine Yönelik Bir Altyapı: OpenAIRE Projesi. Gri Dergisi (TGJ), 6 (1).
Massari, A. ve Heibi, I. (2022). Alıntı verilerinin ve bibliyografik meta verilerin OpenCitations'ın kabul ettiği formatta nasıl yapılandırılacağı. Akademik tam metindeki Edebiyat referanslarını Anlama Çalıştayı Bildirileri, 3220. http://ceur-ws.org/Vol-3220/invited-talk2.pdf
Massari, A. ve Peroni, S. (2022). RDF veri kümelerinde SPARQL aracılığıyla canlı zaman geçişi sorguları gerçekleştirme [Yayıncı: arXiv Sürüm Numarası: 2]. https: //doi.org/10.48550/ARXIV.2210.02534
Mora-Cantallops, M., Sánchez-Alonso, S. ve Garcia-Barriocanal, E. (2019). Vikiveri üzerine sistematik bir literatür taraması. Veri Teknolojileri ve Uygulamaları, 53 (3), 250–268. https://doi.org/10.1108/DTA-12-2018-0110
Morrison, H. (2017). Açık Erişim Dergileri Dizini (DOAJ). Charleston Danışmanı, 18 (3), 25–28. https://doi.org/10.5260/chara.18.3.25
Nielsen, F. Å., Mietchen, D. ve Willighagen, EL (2017). Scholia, Scientometrics ve Wikidata. E. Blomqvist, K. Hose, H. Paulheim, A. Lawrynowicz, F. Ciravegna ve O. Hartig (Ed.), The Semantic Web: ESWC 2017 Uydu Etkinlikleri - ESWC 2017 Uydu Etkinlikleri, Portorož, Slovenya, 28 Mayıs'ta - 1 Haziran 2017, Gözden Geçirilmiş Seçilmiş Makaleler (s. 237–259). Springer. https://doi.org/10.1007/978-3-319-70407-4_36
Nuzzolese, AG, Gentile, AL, Presutti, V. ve Gangemi, A. (2016). Anlamsal web konferansı ontolojisi - yeniden düzenleme çözümü. Avrupa anlamsal web konferansı, 84–87.
OpenCitations. (2022). Tüm alıntı verilerinin COCI CSV veri kümesi. https://doi. org/10.6084/M9.FIGSHARE.6741422.V18
OpenCitations. (2023a). Tüm bibliyografik meta verileri içeren OpenCitations Meta CSV veri kümesi. https://doi.org/10.6084/M9.FIGSHARE.21747461.V3
OpenCitations. (2023b). Tüm bibliyografik meta verileri ve kaynak bilgilerini içeren OpenCitations Meta RDF veri kümesi. https://doi.org/10.6084/M9. FIGSHARE.21747536.V3
Pelgrin, O., Galárraga, L. ve Hose, K. (2021). RDF veri kümeleri için tam kapsamlı arşivlemeye doğru (A.-C. Ngonga Ngomo, M. Saleem, R. Verborgh, M. Saleem, R. Verborgh, MI Ali ve O. Hartig, Eds.). Anlamsal Web Dergisi, 12 (6), 903–925. https://doi.org/10.3233/SW-210434
Peroni, S. ve Shotton, D. (2018). Açık Alıntı: Tanım [Artwork Size: 95436 Bytes Yayıncı: figshare], 95436 Bytes. https://doi.org/10.6084/M9. FIGSHARE.6683855.V1
Peroni, S. ve Shotton, D. (2020). Açık burs için bir altyapı kuruluşu olan OpenCitations [_eprint: https://direct.mit.edu/qss/articlepdf/1/1/428/1760920/qss_a_00023.pdf]. Nicel Bilim Çalışmaları, 1 (1), 428–444. https://doi.org/10.1162/qss_a_00023
Peroni, S., Shotton, D. ve Vitali, F. (2012). Bilimsel yayınlama ve bağlantılı veriler: Rollerin, durumların, zamansal ve bağlamsal kapsamların tanımlanması. 8. Uluslararası Anlamsal Sistemler Konferansı Bildirileri - I-SEMANTICS '12, 9. https://doi.org/10.1145/2362499.2362502
Persiani, S., Daquino, M. ve Peroni, S. (2022). SPAR Ontolojilerine ve OpenCitations Veri Modeline Göre Veri Oluşturmaya Yönelik Bir Programlama Arayüzü [Seri Başlığı: Bilgisayar Bilimlerinde Ders Notları]. P. Groth, M.-E. Vidal, F. Suchanek, P. Szekley, P. Kapanipathi, C. Pesquita, H. Skaf-Molli ve M. Tamper (Ed.), The Semantic Web (s. 305–322). Springer Uluslararası Yayıncılık. https://doi.org/10. 1007/978-3-031-06981-9_18
Pranckut˙e, R. (2021). Web of Science (WoS) ve Scopus: Günümüzün Akademik Dünyasında Bibliyografik Bilginin Devleri. Yayınlar, 9 (1), 12. https://doi.org/10.3390/publications9010012
Priem, J., Piwowar, HA ve Orr, R. (2022). OpenAlex: Bilimsel çalışmalar, yazarlar, mekanlar, kurumlar ve kavramlardan oluşan tamamen açık bir dizin [arXiv: 2205.01833]. CoRR, abs/2205.01833. https://doi.org/10.48550/arXiv. 2205.01833
Araştırma, EOFN ve OpenAIRE. (2013). Zenodo: Araştırma. Paylaşıldı. [Yayıncı: CERN]. https://doi.org/10.25495/7GXK-RD71
Sigurdsson, S. (2020). arXiv'in geleceği ve açık bilimde bilgi keşfi. Bilimsel Belge İşleme Üzerine Birinci Çalıştay Bildirileri, 7-9. https://doi.org/10.18653/v1/2020.sdp-1.2
Sikos, LF ve Philip, D. (2020). Kaynak Farkında Bilgi Temsili: Veri Modelleri ve Bağlamsallaştırılmış Bilgi Grafikleri Üzerine Bir Araştırma. Veri Bilimi ve Mühendisliği, 5 (3), 293–316. https: // doi. org / 10. 1007 / s41019-020-00118-0
Subramanian, S., King, D., Downey, D. ve Feldman, S. (2021). S2AND: Yazar Adı Belirsizliğinin Belirlenmesi için Bir Karşılaştırma ve Değerlendirme Sistemi. 2021 ACM/IEEE Dijital Kütüphaneler Ortak Konferansı (JCDL), 170– 179. https://doi.org/10.1109/JCDL52503.2021.00029
Tanon, TP, Vrandecic, D., Schaffert, S., Steiner, T. ve Pintscher, L. (2016). Freebase'den Wikidata'ya: Büyük Göç. J. Bourdeau, J. Hendler, R. Nkambou, I. Horrocks, & BY Zhao (Ed.), 25. Uluslararası World Wide Web Konferansı Bildirileri, WWW 2016, Montreal, Kanada, 11 - 15 Nisan 2016 ( s. 1419–1428). ACM. https: //doi.org/10.1145/2872427.2874809
Avrupa PMC Konsorsiyumu. (2015). Europe PMC: Yaşam bilimleri ve inovasyon platformu için tam metinli bir literatür veritabanı. Nükleik Asitler Araştırması, 43 (D1), D1042–D1048. https://doi.org/10.1093/nar/gku1061
Tillett, B. (2005). FRBR nedir? Bibliyografik evren için kavramsal bir model. Avustralya Kütüphane Dergisi, 54 (1), 24–30. https://doi. org/10.1080/00049670.2005.10721710
Vizyon, T. (2010). Dryad Dijital Deposu: Daha büyük veri ekosisteminin bir parçası olarak yayınlanan evrimsel veriler. Doğa Önsözleri. https://doi. org/10.1038/npre.2010.4595.1
Wilkinson, MD, Dumontier, M., Aalbersberg, IJ, Appleton, G., Axton, M., Baak, A., Blomberg, N., Boiten, J.-W., da Silva Santos, LB, Bourne, PE , Bouwman, J., Brookes, AJ, Clark, T., Crosas, M., Dillo, I., Dumon, O., Edmunds, S., Evelo, CT, Finkers, R., . . . Mons, B. (2016). FAIR Bilimsel veri yönetimi ve yönetimi için Yol Gösterici İlkeler. Bilimsel Veriler, 3 (1), 160018. https://doi.org/10. 1038/sdata.2016.18
Wolf, M. ve Wicksteed, C. (1997). Tarih ve Saat Formatları. 9 Mayıs 2022'de https://www.w3.org/TR/NOTE-datetime adresinden erişildi.
Zhang, Z., Nuzzolese, AG ve Gentile, AL (2017). ScholarlyData'da Varlık Tekilleştirmesi [Seri Başlığı: Bilgisayar Bilimlerinde Ders Notları]. E. Blomqvist, D. Maynard, A. Gangemi, R. Hoekstra, P. Hitzler ve O. Hartig (Eds.), The Semantic Web (s. 85–100). Springer Uluslararası Yayıncılık. https://doi.org/10.1007/978-3-319-58068-5_6
Bu makale arxiv'de CC 4.0 DEED lisansı altında mevcuttur .