paint-brush
OpenCitations Meta: Dados e serviçospor@categorize

OpenCitations Meta: Dados e serviços

Muito longo; Para ler

featured image - OpenCitations Meta: Dados e serviços
Categorize.Tech: Organizing the World of Software HackerNoon profile picture
0-item

Autores:

(1) Arcangelo Massari, Centro de Pesquisa para Metadados Acadêmicos Abertos, Departamento de Filologia Clássica e Estudos Italianos, Universidade de Bolonha, Bolonha, Itália {[email protected]};

(2) Fabio Mariani, Instituto de Filosofia e Ciências da Arte, Universidade Leuphana, Lüneburg, Alemanha {[email protected]};

(3) Ivan Heibi, Centro de Pesquisa para Metadados Acadêmicos Abertos, Departamento de Filologia Clássica e Estudos Italianos, Universidade de Bolonha, Bolonha, Itália e Centro de Pesquisa Avançada em Humanidades Digitais (/DH.arc), Departamento de Filologia Clássica e Estudos Italianos, Universidade de Bolonha, Bolonha, Itália {[email protected]};

(4) Silvio Peroni, Centro de Pesquisa para Metadados Acadêmicos Abertos, Departamento de Filologia Clássica e Estudos Italianos, Universidade de Bolonha, Bolonha, Itália e Centro de Pesquisa Avançada em Humanidades Digitais (/DH.arc), Departamento de Filologia Clássica e Estudos Italianos, Universidade de Bolonha, Bolonha, Itália {[email protected]};

(5) David Shotton, Oxford e-Research Centre, Universidade de Oxford, Oxford, Reino Unido {[email protected]}.

Tabela de Links

4. Dados e serviços

No momento de seu lançamento inicial em dezembro de 2022, o OpenCitations Meta incluía Crossref (Hendricks et al., 2020), DataCite (Brase, 2010) e o NIH Open Citation Collection (ICite et al., 2022) como suas fontes primárias para os metadados bibliográficos que descrevem as publicações envolvidas em citações nos seguintes índices OpenCitations: COCI (https://opencitations.net/index/coci) (OpenCitations, 2022), DOCI (https://opencitations.net/index/doci), e POCI (https://opencitations.net/index/poci). Do ponto de vista quantitativo, nesta versão inicial do OpenCitations Meta existem 98.243.101 entidades bibliográficas (fabio:Expression), 309.881.223 autores (pro:author), 2.406.510 editores (pro:editor), 19.076 editores (pro:publisher) e 659.214 locais (por exemplo, recursos do tipo fabio:AcademicProceedings, fabio:ExpressionCollection, fabio:Book, fabio:BookSeries, fabio:Journal, fabio:ReferenceBook ou fabio:Series). Assim, em média, cada recurso bibliográfico possui três autores. Normalmente nenhum editor é gravado, pois estes últimos metadados são pouco utilizados em nossas fontes. No total, o triplestore é composto por 3.749.729.755 triplos (excluindo procedência).


Editores e autores foram contados como funções, sem desambiguar os indivíduos que ocupam essas funções. Por outro lado, entidades bibliográficas, editoras e locais foram contabilizados pelo OMID. No entanto, para locais (por exemplo, periódicos), tomamos uma precaução extra: muitos são duplicados no OpenCitations Meta porque não possuem identificadores além do OMID. Portanto, nas figuras apresentadas acima, consideramos razoável desambiguar os locais por título, na ausência de outros identificadores.


Conforme mostrado na Tabela 2, a Springer Science é a entidade editora com o maior número de locais (2.097), seguida pela Elsevier BV (1961) e IEEE (1.775). Na contagem do número de publicações, a Elsevier lidera (16.933.610), seguida pela Springer Science (11.507.498) e pela Wiley (7.262.893) na Tabela 3.


Considerando os locais na Tabela 4, o ChemInform da Wiley tem o maior número de publicações (421.735), seguido pelo SSRN Electronic Journal da Elsevier (337.223) e pelo Journal On Data Semantics da Springer (330.093).


A Tabela 5 lista todos os tipos de recursos bibliográficos no OpenCitations Meta. O conjunto de dados atual contém principalmente artigos de periódicos (67.904.323), que excedem o número de capítulos de livros em segundo lugar (6.476.623) em cerca de dez vezes, e artigos de anais em terceiro lugar (5.046.165) em cerca de treze vezes.


A Tabela 6, que lista o número de publicações por ano, mostra uma tendência crescente, com maior número de publicações de ano para ano.


Tabela 2: Os dez principais editores por número de locais


Tabela 3: Os dez principais editores por número de publicações


Tabela 4: Os dez principais locais por número de publicações


Tabela 5: Todos os tipos de recursos bibliográficos envolvidos no OpenCitations Meta, ordenados pelo número de publicações desse tipo. As ontologias de referência são FaBiO (http://purl.org/spar/fabio), DOCO (http://purl.org/spar/doco) e revisões FAIR (http://purl.org/spar/fr)


Tabela 6: Dez principais anos de publicação por número de publicações naquele ano


OpenCitations Meta permite que os usuários explorem esses dados via SPARQL (https://opencitations.net/meta/sparql) ou via API (https://opencitations.net/meta/api/v1). Em particular, a OpenCitations Meta API recupera uma lista de recursos bibliográficos e metadados relacionados a partir de um ou mais identificadores de publicação, o ORCID de um autor ou o ORCID de um editor. As pesquisas textuais estão atualmente em teste e serão lançadas no futuro como mais uma operação da OpenCitations Meta API. Em particular, podem ser realizadas pesquisas de texto sobre títulos, autores, editores, editoras, IDs e locais. Eles também podem ser alcançados em termos de volume e números de edição, desde que o local seja especificado primeiro. Na verdade, pesquisas em vários campos podem ser combinadas usando os operadores booleanos de conjunção e disjunção. Por exemplo, uma vez liberada a operação, o usuário poderá buscar todos os recursos bibliográficos cujo título contenha a palavra “micro-caos” publicados tanto pela Philosophical Studies quanto pelo Journal of Nonlinear Science: title=micro-chaos&&venue=philosophical% 20studies||title=microchaos&&venue=journal%20of%20nonlinear%20science, onde “&&” é o operador de conjunção, enquanto || é o operador de disjunção.


Finalmente, todos os dados e proveniências estão disponíveis como dumps em formato RDF (JSON-LD) (OpenCitations, 2023b) ou CSV (OpenCitations, 2023a) sob uma licença CC0.


Este artigo está disponível no arxiv sob licença CC 4.0 DEED.