paint-brush
OpenCitations Meta: Daten und Dienstevon@categorize

OpenCitations Meta: Daten und Dienste

Zu lang; Lesen

featured image - OpenCitations Meta: Daten und Dienste
Categorize.Tech: Organizing the World of Software HackerNoon profile picture
0-item

Autoren:

(1) Arcangelo Massari, Forschungszentrum für offene wissenschaftliche Metadaten, Abteilung für Klassische Philologie und Italianistik, Universität Bologna, Bologna, Italien {[email protected]};

(2) Fabio Mariani, Institut für Philosophie und Kunstwissenschaften, Leuphana Universität, Lüneburg, Deutschland {[email protected]};

(3) Ivan Heibi, Forschungszentrum für offene wissenschaftliche Metadaten, Abteilung für Klassische Philologie und Italianistik, Universität Bologna, Bologna, Italien und Digital Humanities Advanced Research Centre (/DH.arc), Abteilung für Klassische Philologie und Italianistik, Universität Bologna, Bologna, Italien {[email protected]};

(4) Silvio Peroni, Forschungszentrum für offene wissenschaftliche Metadaten, Abteilung für Klassische Philologie und Italianistik, Universität Bologna, Bologna, Italien und Digital Humanities Advanced Research Centre (/DH.arc), Abteilung für Klassische Philologie und Italianistik, Universität Bologna, Bologna, Italien {[email protected]};

(5) David Shotton, Oxford e-Research Centre, University of Oxford, Oxford, Vereinigtes Königreich {[email protected]}.

Linktabelle

4. Daten und Dienste

Zum Zeitpunkt seiner Erstveröffentlichung im Dezember 2022 umfasste OpenCitations Meta Crossref (Hendricks et al., 2020), DataCite (Brase, 2010) und die NIH Open Citation Collection (ICite et al., 2022) als Hauptquellen für die bibliografischen Metadaten, die die an Zitaten beteiligten Publikationen in den folgenden OpenCitations-Indizes beschreiben: COCI (https://opencitations.net/index/coci) (OpenCitations, 2022), DOCI (https: //opencitations.net/index/doci) und POCI (https://opencitations.net/index/poci). Aus quantitativer Sicht gibt es in dieser ersten Version von OpenCitations Meta 98.243.101 bibliografische Einheiten (fabio:Expression), 309.881.223 Autoren (pro:author), 2.406.510 Redakteure (pro:editor), 19.076 Verlage (pro:publisher) und 659.214 Veranstaltungsorte (z. B. Ressourcen des Typs fabio:AcademicProceedings, fabio:ExpressionCollection, fabio:Book, fabio:BookSeries, fabio:Journal, fabio:ReferenceBook oder fabio:Series). Jede bibliografische Ressource hat also im Durchschnitt drei Autoren. Normalerweise wird kein Redakteur erfasst, da letztere Metadaten in unseren Quellen wenig verwendet werden. Insgesamt besteht der Triplestore aus 3.749.729.755 Triples (ohne Provenienz).


Redakteure und Autoren wurden als Rollen gezählt, ohne die Personen, die diese Rollen innehaben, zu disambiguieren. Bibliografische Einheiten, Verlage und Veranstaltungsorte wurden dagegen nach OMID gezählt. Bei Veranstaltungsorten (z. B. Zeitschriften) haben wir jedoch eine zusätzliche Vorsichtsmaßnahme getroffen: Viele sind in OpenCitations Meta doppelt vorhanden, da sie keine anderen Kennungen als die OMID haben. Daher hielten wir es in den oben gezeigten Abbildungen für sinnvoll, die Veranstaltungsorte nach Titel zu disambiguieren, da keine anderen Kennungen vorhanden sind.


Wie aus Tabelle 2 hervorgeht, ist Springer Science der Verlag mit der höchsten Anzahl an Veröffentlichungsorten (2097), gefolgt von Elsevier BV (1961) und IEEE (1775). Bei der Zählung der Anzahl der Veröffentlichungen liegt Elsevier an der Spitze (16.933.610), gefolgt von Springer Science (11.507.498) und Wiley (7.262.893) in Tabelle 3.


Betrachtet man die Veranstaltungsorte in Tabelle 4, weist ChemInform von Wiley die meisten Veröffentlichungen auf (421.735), gefolgt vom SSRN Electronic Journal von Elsevier (337.223) und dem Journal On Data Semantics von Springer (330.093).


Tabelle 5 listet alle Arten von bibliographischen Ressourcen in OpenCitations Meta auf. Der aktuelle Datensatz enthält hauptsächlich Zeitschriftenartikel (67.904.323), die die Anzahl der Buchkapitel an zweiter Stelle (6.476.623) um etwa das Zehnfache und die Anzahl der Tagungsartikel an dritter Stelle (5.046.165) um etwa das Dreizehnfache übersteigen.


Tabelle 6, die die Anzahl der Veröffentlichungen pro Jahr auflistet, zeigt einen steigenden Trend, wobei die Anzahl der Veröffentlichungen von Jahr zu Jahr zunimmt.


Tabelle 2: Die zehn größten Verlage nach Anzahl der Veranstaltungsorte


Tabelle 3: Die zehn größten Verlage nach der Anzahl der Veröffentlichungen


Tabelle 4: Die Top-Ten-Veranstaltungsorte nach Anzahl der Veröffentlichungen


Tabelle 5: Alle in OpenCitations Meta enthaltenen bibliografischen Ressourcentypen, sortiert nach der Anzahl der Veröffentlichungen dieses Typs. Die Referenzontologien sind FaBiO (http://purl.org/spar/fabio), DOCO (http://purl.org/spar/doco) und FAIR-Reviews (http://purl.org/spar/fr).


Tabelle 6: Top-10-Publikationsjahre nach der Anzahl der Veröffentlichungen im jeweiligen Jahr


OpenCitations Meta ermöglicht es den Benutzern, solche Daten entweder über SPARQL (https://opencitations.net/meta/sparql) oder über eine API (https://opencitations.net/meta/ api/v1) zu erkunden. Insbesondere ruft die OpenCitations Meta API eine Liste bibliografischer Ressourcen und zugehöriger Metadaten ab, beginnend mit einer oder mehreren Publikationskennungen, der ORCID eines Autors oder der ORCID eines Herausgebers. Textsuchen werden derzeit getestet und werden in Zukunft als eine weitere Funktion der OpenCitations Meta API veröffentlicht. Insbesondere können Textsuchen nach Titeln, Autoren, Herausgebern, Verlagen, IDs und Veranstaltungsorten durchgeführt werden. Sie können auch nach Band- und Ausgabenummern durchgeführt werden, sofern der Veranstaltungsort zuerst angegeben wird. Tatsächlich können Suchen nach mehreren Feldern mithilfe der Booleschen Konjunktions- und Disjunktionsoperatoren kombiniert werden. Sobald die Operation beispielsweise freigegeben ist, kann der Benutzer nach allen bibliografischen Ressourcen suchen, deren Titel das Wort „micro-chaos“ enthält und die entweder in „Philosophical Studies“ oder im „Journal of Nonlinear Science“ veröffentlicht wurden: title=micro-chaos&&venue=philosophical%20studies||title=microchaos&&venue=journal%20of%20nonlinear%20science, wobei „&&“ der Konjunktionsoperator und || der Disjunktionsoperator ist.


Schließlich sind alle Daten und Herkunft als Dumps im RDF- (JSON-LD) (OpenCitations, 2023b) oder CSV-Format (OpenCitations, 2023a) unter einer CC0-Lizenz verfügbar.