paint-brush
OpenCitations Meta: Datos y serviciospor@categorize

OpenCitations Meta: Datos y servicios

Demasiado Largo; Para Leer

featured image - OpenCitations Meta: Datos y servicios
Categorize.Tech: Organizing the World of Software HackerNoon profile picture
0-item

Autores:

(1) Arcangelo Massari, Centro de Investigación de Metadatos Académicos Abiertos, Departamento de Filología Clásica y Estudios Italianos, Universidad de Bolonia, Bolonia, Italia {[email protected]};

(2) Fabio Mariani, Instituto de Filosofía y Ciencias del Arte, Universidad Leuphana, Lüneburg, Alemania {[email protected]};

(3) Ivan Heibi, Centro de Investigación de Metadatos Académicos Abiertos, Departamento de Filología Clásica y Estudios Italianos, Universidad de Bolonia, Bolonia, Italia y Centro de Investigación Avanzada en Humanidades Digitales (/DH.arc), Departamento de Filología Clásica y Estudios Italianos, Universidad de Bolonia, Bolonia, Italia {[email protected]};

(4) Silvio Peroni, Centro de Investigación de Metadatos Académicos Abiertos, Departamento de Filología Clásica y Estudios Italianos, Universidad de Bolonia, Bolonia, Italia y Centro de Investigación Avanzada en Humanidades Digitales (/DH.arc), Departamento de Filología Clásica y Estudios Italianos, Universidad de Bolonia, Bolonia, Italia {[email protected]};

(5) David Shotton, Oxford e-Research Centre, Universidad de Oxford, Oxford, Reino Unido {[email protected]}.

Tabla de enlaces

4. Datos y servicios

En el momento de su lanzamiento inicial en diciembre de 2022, OpenCitations Meta incluía Crossref (Hendricks et al., 2020), DataCite (Brase, 2010) y NIH Open Citation Collection (ICite et al., 2022) como sus principales fuentes de información. los metadatos bibliográficos que describen las publicaciones involucradas en citas dentro de los siguientes índices OpenCitations: COCI (https://opencitations.net/index/coci) (OpenCitations, 2022), DOCI (https://opencitations.net/index/doci), y POCI (https://opencitations.net/index/poci). Desde un punto de vista cuantitativo, hay dentro de esta versión inicial de OpenCitations Meta 98.243.101 entidades bibliográficas (fabio:Expression), 309.881.223 autores (pro:author), 2.406.510 editores (pro:editor), 19.076 editores (pro:publisher), y 659,214 lugares (por ejemplo, recursos de tipo fabio:AcademicProceedings, fabio:ExpressionCollection, fabio:Book, fabio:BookSeries, fabio:Journal, fabio:ReferenceBook o fabio:Series). Así, en promedio, cada recurso bibliográfico tiene tres autores. Normalmente no se registra ningún editor, ya que estos últimos metadatos se utilizan poco en nuestras fuentes. En total, el triplestore consta de 3.749.729.755 triples (excluyendo procedencia).


Se han contado como roles a los editores y autores, sin eliminar la ambigüedad de las personas que desempeñan estos roles. Por el contrario, OMID contó las entidades bibliográficas, las editoriales y los lugares. Sin embargo, para los lugares (por ejemplo, revistas), hemos tomado una precaución adicional: muchos están duplicados en OpenCitations Meta porque no tienen identificadores distintos del OMID. Por lo tanto, en las figuras que se muestran arriba, consideramos razonable eliminar la ambigüedad de los lugares por título en ausencia de otros identificadores.


Como se muestra en la Tabla 2, Springer Science es la entidad editorial con el mayor número de sedes (2097), seguida de Elsevier BV (1961) e IEEE (1775). Al contar el número de publicaciones, Elsevier está a la cabeza (16.933.610), seguida de Springer Science (11.507.498) y Wiley (7.262.893) en la Tabla 3.


Teniendo en cuenta los lugares de la Tabla 4, ChemInform de Wiley tiene la mayor cantidad de publicaciones (421.735), seguido por SSRN Electronic Journal de Elsevier (337.223) y Journal On Data Semantics de Springer (330.093).


La Tabla 5 enumera todos los tipos de recursos bibliográficos en OpenCitations Meta. El conjunto de datos actual contiene principalmente artículos de revistas (67.904.323), que superan el número de capítulos de libros en el segundo lugar (6.476.623) en aproximadamente diez veces, y los artículos de actas en el tercer lugar (5.046.165) en aproximadamente trece veces.


El cuadro 6, que enumera el número de publicaciones por año, muestra una tendencia creciente, con un mayor número de publicaciones de año en año.


Tabla 2: Los diez principales editores por número de lugares


Tabla 3: Las diez principales editoriales por número de publicaciones


Tabla 4: Los diez primeros lugares por número de publicaciones


Tabla 5: Todos los tipos de recursos bibliográficos involucrados en OpenCitations Meta, ordenados por el número de publicaciones de ese tipo. Las ontologías de referencia son FaBiO (http://purl.org/spar/fabio), DOCO (http://purl.org/spar/doco) y FAIR reviews (http://purl.org/spar/fr).


Tabla 6: Diez años principales de publicación por número de publicaciones en ese año


OpenCitations Meta permite a los usuarios explorar dichos datos a través de SPARQL (https://opencitations.net/meta/sparql) o mediante una API (https://opencitations.net/meta/api/v1). En particular, OpenCitations Meta API recupera una lista de recursos bibliográficos y metadatos relacionados a partir de uno o más identificadores de publicación, el ORCID de un autor o el ORCID de un editor. Las búsquedas textuales se encuentran actualmente bajo prueba y se lanzarán en el futuro como una operación más de OpenCitations Meta API. En particular, se pueden realizar búsquedas de texto sobre títulos, autores, editores, editoriales, identificaciones y lugares. También se pueden lograr sobre el volumen y el número de ejemplares, siempre que se especifique primero el lugar. De hecho, las búsquedas en múltiples campos se pueden combinar utilizando los operadores booleanos de conjunción y disyunción. Por ejemplo, una vez liberada la operación, el usuario podrá buscar todos los recursos bibliográficos cuyo título contenga la palabra “micro-caos” publicados ya sea por Philosophical Studies o el Journal of Nonlinear Science: title=micro-chaos&&venue=philosophical% 20studies||title=microchaos&&venue=journal%20of%20nonlinear%20science, donde “&&” es el operador de conjunción, mientras que || es el operador de disyunción.


Finalmente, todos los datos y procedencia están disponibles como volcados en formato RDF (JSON-LD) (OpenCitations, 2023b) o CSV (OpenCitations, 2023a) bajo una licencia CC0.


Este documento está disponible en arxiv bajo licencia CC 4.0 DEED.