저자:
(1) Arcangelo Massari, 이탈리아 볼로냐 소재 볼로냐 대학교 고전 문헌학과 이탈리아학과 개방형 학술 메타데이터 연구 센터 {[email protected]};
(2) 파비오 마리아니(Fabio Mariani), 독일 뤼네부르크 소재 류파나 대학교 예술철학연구소 {[email protected]};
(3) Ivan Heibi, 이탈리아 볼로냐 대학 고전 언어학 및 이탈리아 연구과 오픈 학술 메타데이터 연구 센터 및 대학 고전 언어학 및 이탈리아 연구과 디지털 인문학 고급 연구 센터(/DH.arc) 이탈리아 볼로냐 볼로냐 {[email protected]};
(4) 실비오 페로니(Silvio Peroni), 이탈리아 볼로냐 대학 고전 언어학 및 이탈리아 연구과 오픈 학술 메타데이터 연구 센터 및 대학 고전 언어학 및 이탈리아 연구과 디지털 인문학 고급 연구 센터(/DH.arc) 이탈리아 볼로냐 볼로냐 {[email protected]};
(5) David Shotton, 영국 옥스퍼드 대학교 옥스퍼드 전자 연구 센터 {[email protected]}.
이 문서에서는 OpenCitations Index와 관련된 모든 출판물에 대한 서지 메타데이터를 저장하고 제공하는 데이터베이스인 OpenCitations Meta를 개발하는 데 사용된 방법론을 자세히 설명했습니다. 이 프로세스에는 (1) 개체 중복 제거, 오류 수정 및 정보 강화를 목표로 하는 자동 큐레이션 분석, (2) RDF의 변경 사항 및 출처를 추적하면서 RDF로의 데이터 변환이라는 두 가지 주요 단계가 포함됩니다.
새로운 출판물에 대한 정보는 Crossref, DataCite 및 PubMed에 지속적으로 추가되고 있으며, 이러한 새로운 메타데이터를 정기적이고 시기적절하게 OpenCitations Meta에 수집하는 절차를 개발할 것입니다. 또한 Japan Link Center 및 OpenAIRE Research Graph에서 서지 메타데이터를 수집하는 작업이 이미 진행 중이며, 인적 및 컴퓨터 리소스가 허용하는 대로 기타 소스도 포함될 예정입니다. 따라서 OpenCitations Meta는 계속해서 성장할 것입니다.
OpenCitations Meta에는 세 가지 주요 이점이 있습니다. 첫째, 저장된 모든 엔터티에 대해 OMID(OpenCitation Meta Identifier)를 사용하면 OpenCitations Meta가 두 개 이상의 외부 PID를 가질 수 있는 출판물(예: DOI(Digital Object Identifier)가 있는 Crossref에 설명된 저널 기사에 대한 매핑 허브 역할을 할 수 있습니다. ) 및 PMID(PubMed 식별자)를 사용하여 PubMed에 설명된 동일한 출판물을 사용하여 외부 PID가 없는 리소스와 관련된 인용을 특성화할 수 있습니다. 결과적으로 두 번째 이점은 OpenCitations Meta를 사용하여 OpenCitations 색인의 인용을 다음과 같이 설명할 수 있다는 것입니다. OMID-OMID, 서로 다른 식별자 체계를 사용하여 문서 간의 인용을 명확하게 합니다(예: Crossref의 DOI-DOI 및 PubMed의 PMID-PMID로 표시). 셋째, OpenCitations Meta는 인용과 관련된 출판물에 대한 메타데이터를 검색하는 검색 작업 속도를 높입니다. OpenCitations 인용 색인에 저장됩니다. 이제 이러한 메타데이터는 외부 리소스에 대한 즉석 API 호출을 통해 검색되지 않고 내부에 보관되기 때문입니다.
앞으로의 과제는 ORCID 식별자가 부족한 사람들을 위한 명확화 시스템을 정교화하고, 기존 메타데이터의 품질을 개선하고, 검색 작업 및 저장 효율성을 향상하고, 초록, 자금 제공자 ID, 자금 정보 등에 대한 추가 메타데이터 필드를 추가하는 것입니다. 기관 식별자 및 이러한 메타데이터를 당사 소스에서 사용할 수 있는 경우 이를 채우기 위해 사용됩니다.
마지막으로, 인터페이스가 구현되어 신뢰할 수 있는 도메인 전문가가 사용할 수 있게 되어 OpenCitations Meta에 보관된 메타데이터를 직접 실시간으로 수동으로 선별할 수 있습니다. 이러한 시스템은 변경 사항과 출처를 추적하고, 각 엔터티의 서로 다른 버전 간의 델타를 보존하며, 변경을 담당하는 에이전트, 기본 소스 및 날짜와 같은 정보를 유지합니다. 이러한 방식으로 우리는 OpenCitations Meta를 포괄적일 뿐만 아니라 학계 구성원이 직접 기여할 수 있는 정확하고 완전히 개방적이며 재사용 가능한 서지 메타데이터 소스로 만들기 위해 노력할 것입니다.
이 작업은 보조금 계약 번호 101017452(OpenAIRE-Nexus 프로젝트)에 따라 유럽 연합의 Horizon 2020 연구 및 혁신 프로그램에서 부분적으로 자금을 지원 받았습니다.
Abramatic, J.-F., Di Cosmo, R., & Zacchiroli, S. (2018). 소스 코드의 범용 아카이브 구축. ACM 커뮤니케이션, 61 (10), 29-31. https://doi.org/10.1145/3183558
Atzori, C., Bardi, A., Manghi, P., & Mannocci, A. (2017). 데이터 관리를 위한 OpenAIRE 워크플로 [시리즈 제목: 컴퓨터 및 정보 과학의 커뮤니케이션]. C. Grana & L. Baraldi(Eds.), 디지털 도서관 및 기록 보관소(pp. 95–107). 스프링거 국제 출판. https://doi.org/10.1007/978-3-319-68130-6_8
Auer, S., Oelen, A., Haris, M., Stocker, M., D'Souza, J., Farfar, KE, Vogt, L., Prinz, M., Wiens, V., & Jaradeh, MY (2020). 지식 그래프를 통해 과학 문헌에 대한 접근성 향상. Bibliothek Forschung und Praxis, 44 (3), 516–529. https://doi.org/10.1515/bfp-2020-2042
이사회, DU (2020). DCMI 메타데이터 용어. 2021년 7월 16일, http://dublincore.org/specations/dublin-core/dcmi-terms/2020-01-20/에서 검색함
브레이스, J. (2009). DataCite - 연구 데이터를 위한 글로벌 등록 기관입니다. 2009 과학기술 정보자원 협력 및 증진에 관한 제4차 국제회의, 257-261. https: //doi.org/10.1109/COINFO.2009.66
브레이즈, J. (2010). Datacite - 연구 데이터를 위한 글로벌 등록 기관입니다. SSRN 전자 저널. https://doi.org/10.2139/ssrn.1639998
Carroll, JJ, Bizer, C., Hayes, P., & Stickler, P. (2005). 명명된 그래프, 출처 및 신뢰. 제14차 월드와이드웹 국제회의 간행물 - WWW '05, 613. https://doi.org/10.1145/1060745. 1060835
다퀴노, M., & 페로니, S. (2019). OCO, OpenCitations 온톨로지. 2021년 9월 4일, https://w3id.org/oc/ontology/2019-09-19에서 검색함
Daquino, M., Peroni, S., & Shotton, D. (2020). OpenCitations 데이터 모델 [아트워크 크기: 836876바이트 게시자: figshare], 836876바이트. https: //doi.org/10.6084/M9.FIGSHARE.3443876.V7
다칼, K. (2019). 언페이월. 의학도서관협회지, 107(2). https://doi.org/10.5195/jmla.2019.650
유럽위원회. 연구 및 혁신 사무국. (2016). 유럽 오픈 사이언스 클라우드 실현: 유럽 오픈 사이언스 클라우드에 대한 위원회 고위 전문가 그룹의 첫 번째 보고서 및 권장 사항입니다. 출판사무실. 2022년 10월 17일, https://data.europa.eu/doi/10.2777/940154에서 검색함
Falco, R., Gangemi, A., Peroni, S., Shotton, D., & Vitali, F. (2014). Graffoo를 사용한 OWL 온톨로지 모델링 [시리즈 제목: 컴퓨터 과학 강의 노트]. V. Presutti, E. Blomqvist, R. Troncy, H. Sack, I. Papadakis, & A. Tordai (Eds.), The Semantic Web: ESWC 2014 위성 이벤트 (pp. 320–325). 스프링거 국제 출판. https://doi.org/10. 1007/978-3-319-11955-7_42
프리케, S. (2018). 의미론 학자. 의학도서관협회지, 106(1). https://doi.org/10.5195/jmla.2018.280
가르시아, A., 로페즈, F., 가르시아, L., Giraldo, O., Bucheli, V., & Dumontier, M. (2018). Biotea: Pubmed Central의 의미. PeerJ, 6, e4201. https: //doi.org/10.7717/peerj.4201
이방인, AL, & Nuzzolese, AG (2015). cLODg-컨퍼런스 링크형 공개 데이터 생성기. ISWC(포스터 및 데모).
Gil, Y., Cheney, J., Groth, P., Hartig, O., Miles, S., Moreau, L., Silva, P. (2010). 출처 XG 최종 보고서 [유형: W3C.]. http://www.w3. org/2005/인큐베이터/prov/XGR-prov-20101214/
Gorraiz, J., Melero-Fuentes, D., Gumpenberger, C. 및 Valderrama-Zurián, J.-C. (2016). Web of Science 및 Scopus에서 디지털 객체 식별자(DOI)의 가용성. 인포메트릭스 저널, 10 (1), 98-109. https://doi.org/10.1016/j.joi.2015.11.008
Haak, LL, Fenner, M., Paglione, L., Pentz, E., & Ratner, H. (2012). ORCID: 연구자를 고유하게 식별하는 시스템입니다. 학습 출판, 25 (4), 259-264. https://doi.org/10.1087/20120404
Hammond, T., Pasin, M., & Theodoridis, E. (2017). 데이터 통합 및 분해: SHACL 및 OWL을 사용하여 Springer Nature SciGraph 관리. ISWC(포스터, 데모 및 산업 트랙). http://ceur-ws.org/Vol1963/paper493.pdf
하라, 엠(2020). Japan Link Center(JaLC) 소개 [작품 크기: 2213661바이트 출판사: ORCID], 2213661바이트. https://doi.org/10. 23640/07243.12469094.V1
Heibi, I., Peroni, S., & Shotton, D. (2019a). CROCI를 통한 공개 인용 크라우드소싱 – 공개 인용의 현재 상태 분석 및 제안 [arXiv: 1902.02534]. arXiv:1902.02534 [cs]. 2021년 9월 15일, http://arxiv.org/abs/1902.02534에서 검색함
Heibi, I., Peroni, S., & Shotton, D. (2019b). 소프트웨어 검토: COCI, Crossref의 OpenCitations Index 공개 DOI-DOI 인용. 과학계량학, 121(2), 1213-1228. https://doi.org/10.1007/s11192-019-03217-6
Hendricks, G., Tkaczyk, D., Lin, J., & Feeney, P. (2020). Crossref: 커뮤니티 소유 학술 메타데이터의 지속 가능한 소스입니다. 정량적 과학 연구, 1 (1), 414-427. https://doi.org/10.1162/qss_a_00022
ICite, Hutchins, BI, & Santangelo, G. (2022). iCite 데이터베이스 스냅샷(NIH Open Citation Collection) [출판사: NIH Figshare Archive]. https: //doi.org/10.35092/YHJC.C.4586573
Koivunen, M.-R., & Miller, E. (2001). 시맨틱 웹 활동 [판: W3C 볼륨: 11 02]. https://www.w3.org/2001/12/semweb-fin/w3csw
래미, R. (2020). 식별 문제에 대한 해결책: 연구 기관 등록소를 살펴보십시오. 과학 편집, 7(1), 65–69. https://doi.org/10.6087/kcse.192
Lebo, T., Sahoo, S., & McGuinness, D. (2013). PROV-O: PROV 온톨로지 [장소: PROV-O 볼륨: 04 30]. 2021년 7월 16일, http://www.w3.org/TR/2013/REC-prov-o-20130430/에서 검색함
Maloney, C., Sequeira, E., Kelly, C., Orris, R., & Beck, J. (2013). 퍼브메드 센트럴. NCBI 핸드북에서.
Manghi, P., Manola, N., Horstmann, W., & Peters, D. (2010). EC 자금 지원 연구 결과물 관리를 위한 인프라: OpenAIRE 프로젝트. 그레이저널(TGJ), 6(1).
Massari, A., & Heibi, I. (2022). OpenCitations에서 허용되는 형식으로 인용 데이터 및 서지 메타데이터를 구조화하는 방법. 학문적 전체 TExt의 문학 참조 이해에 관한 워크숍 진행, 3220. http://ceur-ws.org/Vol-3220/invited-talk2.pdf
Massari, A., & Peroni, S. (2022). RDF 데이터세트에서 SPARQL을 통해 실시간 시간 순회 쿼리를 수행합니다. [게시자: arXiv 버전 번호: 2] https: //doi.org/10.48550/ARXIV.2210.02534
Mora-Cantallops, M., Sánchez-Alonso, S., & García-Barriocanal, E. (2019). Wikidata에 대한 체계적인 문헌 검토입니다. 데이터 기술 및 애플리케이션, 53 (3), 250–268. https://doi.org/10.1108/DTA-12-2018-0110
모리슨, H. (2017). 오픈 액세스 저널(DOAJ) 디렉토리. 찰스턴 고문, 18 (3), 25–28. https://doi.org/10.5260/chara.18.3.25
Nielsen, F. Å., Mietchen, D., & Willighagen, EL (2017). 스콜리아(Scholia), 사이언토메트릭스(Scientometrics), 위키데이터(Wikidata). E. Blomqvist, K. Hose, H. Paulheim, A. Lawrynowicz, F. Ciravegna, & O. Hartig(Eds.), The Semantic Web: ESWC 2017 위성 이벤트 - ESWC 2017 위성 이벤트, 슬로베니아 포르토로지, 5월 28일 - 2017년 6월 1일, 선정논문 수정(pp. 237~259). 뛰는 것. https://doi.org/10.1007/978-3-319-70407-4_36
Nuzzolese, AG, Gentile, AL, Presutti, V., & Gangemi, A. (2016). 시맨틱 웹 컨퍼런스 온톨로지-리팩토링 솔루션. 유럽 시맨틱 웹 컨퍼런스, 84-87.
공개인용. (2022). 모든 인용 데이터의 COCI CSV 데이터세트입니다. https://doi. org/10.6084/M9.FIGSHARE.6741422.V18
공개인용. (2023a). 모든 서지 메타데이터의 OpenCitations Meta CSV 데이터세트입니다. https://doi.org/10.6084/M9.FIGSHARE.21747461.V3
공개인용. (2023b). 모든 서지 메타데이터 및 출처 정보로 구성된 OpenCitations Meta RDF 데이터세트입니다. https://doi.org/10.6084/M9. FigSHARE.21747536.V3
Pelgrin, O., Galárraga, L., & Hose, K. (2021). RDF 데이터세트에 대한 본격적인 아카이빙을 지향합니다(A.-C. Ngonga Ngomo, M. Saleem, R. Verborgh, M. Saleem, R. Verborgh, MI Ali, & O. Hartig, Eds.). 시맨틱 웹 저널, 12(6), 903-925. https://doi.org/10.3233/SW-210434
Peroni, S., & Shotton, D. (2018). 공개 인용: 정의 [작품 크기: 95436바이트 출판사: figshare], 95436바이트. https://doi.org/10.6084/M9. FigSHARE.6683855.V1
Peroni, S., & Shotton, D. (2020). 공개 장학금을 위한 인프라 조직인 OpenCitations [_eprint: https://direct.mit.edu/qss/articlepdf/1/1/428/1760920/qss_a_00023.pdf]. 정량적 과학 연구, 1 (1), 428-444. https://doi.org/10.1162/qss_a_00023
Peroni, S., Shotton, D., & Vitali, F. (2012). 학술 출판 및 링크된 데이터: 역할, 상태, 시간적 및 맥락적 범위를 설명합니다. 제8회 의미체계 국제학술대회 논문집 - I-SEMANTICS '12, 9. https://doi.org/10.1145/2362499.2362502
Persiani, S., Daquino, M., & Peroni, S. (2022). SPAR 온톨로지 및 OpenCitations 데이터 모델에 따라 데이터를 생성하기 위한 프로그래밍 인터페이스 [시리즈 제목: 컴퓨터 과학 강의 노트]. P. Groth, M.-E. Vidal, F. Suchanek, P. Szekley, P. Kapanipathi, C. Pesquita, H. Skaf-Molli, & M. Tamper (Eds.), The Semantic Web (pp. 305–322). 스프링거 국제 출판. https://doi.org/10. 1007/978-3-031-06981-9_18
Prankutte, R. (2021). Web of Science(WoS)와 Scopus: 오늘날 학계의 서지 정보의 거인. 출판물, 9 (1), 12. https://doi.org/10.3390/publications9010012
Priem, J., Piwowar, HA, & Orr, R. (2022). OpenAlex: 학술 작품, 저자, 장소, 기관 및 개념에 대한 완전 개방형 색인 [arXiv: 2205.01833]. CoRR, ABS/2205.01833. https://doi.org/10.48550/arXiv. 2205.01833
연구, EOFN 및 OpenAIRE. (2013). 제노도: 연구. 공유됨. [출판사: CERN]. https://doi.org/10.25495/7GXK-RD71
시구르드손, S. (2020). arXiv의 미래와 오픈 사이언스에서의 지식 발견. 학술 문서 처리에 관한 첫 번째 워크숍 진행, 7–9. https://doi.org/10.18653/v1/2020.sdp-1.2
시코스, LF, & 필립, D.(2020). 출처 인식 지식 표현: 데이터 모델 및 상황별 지식 그래프 조사. 데이터 과학 및 엔지니어링, 5 (3), 293-316. https: //도이. org / 10. 1007 / s41019-020-00118-0
Subramanian, S., King, D., Downey, D., & Feldman, S. (2021). S2AND: 저자 이름 명확성을 위한 벤치마크 및 평가 시스템. 2021 ACM/IEEE 디지털 도서관 합동 회의(JCDL), 170–179. https://doi.org/10.1109/JCDL52503.2021.00029
Tanon, TP, Vrandecic, D., Schaffert, S., Steiner, T., & Pintscher, L. (2016). Freebase에서 Wikidata로: 대이동. J. Bourdeau, J. Hendler, R. Nkambou, I. Horrocks, & BY Zhao(Eds.), 제25차 월드 와이드 웹 국제 회의 간행물, WWW 2016, 캐나다 몬트리올, 2016년 4월 11~15일( pp. 1419–1428). ACM. https: //doi.org/10.1145/2872427.2874809
유럽 PMC 컨소시엄. (2015). 유럽 PMC: 생명과학 및 혁신 플랫폼을 위한 전문 문헌 데이터베이스입니다. 핵산 연구, 43 (D1), D1042–D1048. https://doi.org/10.1093/nar/gku1061
틸렛, B. (2005). FRBR이란 무엇입니까? 서지 세계에 대한 개념적 모델. 호주 도서관 저널, 54 (1), 24–30. https://doi. org/10.1080/00049670.2005.10721710
비전, T. (2010). Dryad Digital Repository: 더 큰 데이터 생태계의 일부로 진화 데이터를 게시했습니다. 자연 전승. https://doi. org/10.1038/npre.2010.4595.1
Wilkinson, MD, Dumontier, M., Aalbersberg, IJ, Appleton, G., Axton, M., Baak, A., Blomberg, N., Boiten, J.-W., da Silva Santos, LB, Bourne, PE , Bouwman, J., Brookes, AJ, Clark, T., Crosas, M., Dillo, I., Dumon, O., Edmunds, S., Evelo, CT, Finkers, R., . . . 몬스, B. (2016). 과학적 데이터 관리 및 관리에 대한 FAIR 지침 원칙. 과학 데이터, 3 (1), 160018. https://doi.org/10. 1038/sdata.2016.18
울프, M., & Wicksteed, C. (1997). 날짜 및 시간 형식. https://www.w3.org/TR/NOTE-datetime에서 2022년 5월 9일에 검색함
Zhang, Z., Nuzzolese, AG, & Gentile, AL (2017). ScholarlyData의 엔터티 중복 제거 [시리즈 제목: 컴퓨터 과학 강의 노트]. E. Blomqvist, D. Maynard, A. Gangemi, R. Hoekstra, P. Hitzler, & O. Hartig (Eds.), The Semantic Web (pp. 85–100). 스프링거 국제 출판. https://doi.org/10.1007/978-3-319-58068-5_6
이 문서는 CC 4.0 DEED 라이선스에 따라 arxiv에서 볼 수 있습니다.