paint-brush
OpenCitations Meta: 데이터 및 서비스~에 의해@categorize

OpenCitations Meta: 데이터 및 서비스

너무 오래; 읽다

featured image - OpenCitations Meta: 데이터 및 서비스
Categorize.Tech: Organizing the World of Software HackerNoon profile picture
0-item

저자:

(1) Arcangelo Massari, 이탈리아 볼로냐 소재 볼로냐 대학교 고전 문헌학과 이탈리아학과 개방형 학술 메타데이터 연구 센터 {[email protected]};

(2) 파비오 마리아니(Fabio Mariani), 독일 뤼네부르크 소재 류파나 대학교 예술철학연구소 {[email protected]};

(3) Ivan Heibi, 이탈리아 볼로냐 대학 고전 언어학 및 이탈리아 연구과 오픈 학술 메타데이터 연구 센터 및 대학 고전 언어학 및 이탈리아 연구과 디지털 인문학 고급 연구 센터(/DH.arc) 이탈리아 볼로냐 볼로냐 {[email protected]};

(4) 실비오 페로니(Silvio Peroni), 이탈리아 볼로냐 대학 고전 언어학 및 이탈리아 연구과 오픈 학술 메타데이터 연구 센터 및 대학 고전 언어학 및 이탈리아 연구과 디지털 인문학 고급 연구 센터(/DH.arc) 이탈리아 볼로냐 볼로냐 {[email protected]};

(5) David Shotton, 영국 옥스퍼드 대학교 옥스퍼드 전자 연구 센터 {[email protected]}.

링크 표

4. 데이터 및 서비스

2022년 12월 최초 출시 당시 OpenCitations Meta에는 Crossref(Hendricks et al., 2020), DataCite(Brase, 2010) 및 NIH Open Citation Collection(ICite et al., 2022)이 주요 소스로 포함되었습니다. 다음 OpenCitations 색인 내에서 인용과 관련된 출판물을 설명하는 서지 메타데이터: COCI(https://opencitations.net/index/coci)(OpenCitations, 2022), DOCI(https: //opencitations.net/index/doci), 및 POCI(https://opencitations.net/index/poci). 정량적인 관점에서 볼 때 OpenCitations Meta의 이번 초기 릴리스에는 98,243,101개의 서지 항목(fabio:Expression), 309,881,223명의 저자(pro:author), 2,406,510명의 편집자(pro:editor), 19,076명의 출판사(pro:publisher) 및 659,214개 장소(예: fabio:AcademicProceedings, fabio:ExpressionCollection, fabio:Book, fabio:BookSeries, fabio:Journal, fabio:ReferenceBook 또는 fabio:Series 유형의 리소스). 따라서 평균적으로 각 서지자원에는 3명의 저자가 있습니다. 일반적으로 편집기는 기록되지 않습니다. 후자의 메타데이터는 소스에서 거의 사용되지 않기 때문입니다. 전체적으로 트리플스토어는 3,749,729,755개의 트리플로 구성됩니다(출처 제외).


편집자와 작성자는 이러한 역할을 맡은 개인을 구분하지 않고 역할로 계산되었습니다. 반대로, 서지 개체, 출판사, 장소는 OMID에 의해 계산되었습니다. 그러나 장소(예: 저널)의 경우 추가 예방 조치를 취했습니다. OMID 이외의 식별자가 없기 때문에 OpenCitations Meta에서 많은 부분이 중복됩니다. 따라서 위에 표시된 그림에서는 다른 식별자가 없는 경우 제목별로 장소를 명확하게 구분하는 것이 합리적이라고 판단했습니다.


표 2에서 볼 수 있듯이 Springer Science는 가장 많은 장소 수(2097)를 보유한 출판 기관이며, Elsevier BV(1961) 및 IEEE(1775)가 그 뒤를 따릅니다. 논문 수를 보면 Elsevier가 16,933,610건으로 선두를 달리고 있으며, Springer Science(11,507,498건), Wiley(7,262,893건)가 표 3에서 뒤를 잇고 있습니다.


표 4의 장소를 고려하면 Wiley의 ChemInform이 가장 많은 출판물을 보유하고 있으며(421,735) Elsevier의 SSRN Electronic Journal(337,223), Springer의 Journal On Data Semantics(330,093)가 그 뒤를 따릅니다.


표 5에는 OpenCitations Meta의 모든 유형의 서지 리소스가 나열되어 있습니다. 현재 데이터 세트에는 대부분 저널 기사(67,904,323)가 포함되어 있으며 이는 2위의 책 장 수(6,476,623)보다 약 10배, 3위의 논문(5,046,165)을 약 13배 초과합니다.


연간 출판물 수를 나열한 표 6은 해마다 출판물 수가 증가하면서 증가 추세를 보여줍니다.


표 2: 장소 수 기준 상위 10개 게시자


표 3: 출판물 수 기준 상위 10개 출판사


표 4: 출판물 수 기준 상위 10개 장소


표 5: OpenCitations Meta와 관련된 모든 서지 리소스 유형(해당 유형의 출판물 수를 기준으로 정렬) 참조 온톨로지는 FaBiO(http://purl.org/spar/fabio), DOCO(http://purl.org/spar/doco) 및 FAIR 리뷰(http://purl.org/spar/fr)입니다.


표 6: 해당 연도의 출판 건수 기준 상위 10개 연도


OpenCitations Meta를 사용하면 사용자는 SPARQL(https://opencitations.net/meta/sparql) 또는 API(https://opencitations.net/meta/api/v1)를 통해 이러한 데이터를 탐색할 수 있습니다. 특히 OpenCitations Meta API는 하나 이상의 출판물 식별자, 저자의 ORCID 또는 편집자의 ORCID에서 시작하여 서지 리소스 및 관련 메타데이터 목록을 검색합니다. 텍스트 검색은 현재 테스트 중이며 향후 OpenCitations Meta API의 추가 작업으로 출시될 예정입니다. 특히 제목, 저자, 편집자, 출판사, ID 및 장소에 대한 텍스트 검색을 수행할 수 있습니다. 장소가 먼저 지정된 경우 권수 및 발행 번호로도 달성할 수 있습니다. 실제로 여러 필드에 대한 검색은 부울 연결 및 분리 연산자를 사용하여 결합할 수 있습니다. 예를 들어, 작업이 해제되면 사용자는 Philosophical Studies 또는 Journal of Nonlinear Science에서 출판된 제목에 "micro-chaos"라는 단어가 포함된 모든 서지 리소스를 검색할 수 있습니다: title=micro-chaos&&venue=philosophical% 20studies||title=microchaos&&venue=journal%20of%20nonlinear%20science, 여기서 "&&"는 연결 연산자이고, || 분리 연산자입니다.


마지막으로 모든 데이터와 출처는 CC0 라이선스에 따라 RDF(JSON-LD)(OpenCitations, 2023b) 또는 CSV 형식(OpenCitations, 2023a)의 덤프로 제공됩니다.


이 문서는 CC 4.0 DEED 라이선스에 따라 arxiv에서 볼 수 있습니다.