paint-brush
OpenCitations Meta: データとサービス@categorize

OpenCitations Meta: データとサービス

長すぎる; 読むには

featured image - OpenCitations Meta: データとサービス
Categorize.Tech: Organizing the World of Software HackerNoon profile picture
0-item

著者:

(1)アルカンジェロ・マッサリ、オープン学術メタデータ研究センター、ボローニャ大学古典文献学・イタリア研究科、ボローニャ、イタリア {[email protected]}

(2)ファビオ・マリアーニ、ロイプハナ大学哲学・芸術科学研究所、ドイツ、リューネブルク {[email protected]}

(3)イヴァン・ヘイビ、ボローニャ大学古典文献学・イタリア研究科オープン学術メタデータ研究センター、ボローニャ、イタリアおよびボローニャ大学古典文献学・イタリア研究科デジタル人文学先端研究センター(/DH.arc){[email protected]}

(4)シルヴィオ・ペローニ、ボローニャ大学古典文献学・イタリア研究科オープン学術メタデータ研究センター、ボローニャ、イタリアおよびボローニャ大学古典文献学・イタリア研究科デジタル人文学先端研究センター(/DH.arc){[email protected]}

(5)デイビッド・ショットン、オックスフォード大学オックスフォードe-リサーチセンター、オックスフォード、イギリス {[email protected]}。

リンク一覧

4. データとサービス

2022 年 12 月の最初のリリース時点では、OpenCitations Meta には、次の OpenCitations インデックス内の引用に関係する出版物を記述する書誌メタデータの主なソースとして、Crossref (Hendricks 他、2020 年)、DataCite (Brase、2010 年)、および NIH Open Citation Collection (ICite 他、2022 年) が含まれていました: COCI (https://opencitations.net/index/coci) (OpenCitations、2022 年)、DOCI (https://opencitations.net/index/doci)、および POCI (https://opencitations.net/index/poci)。量的な観点から見ると、OpenCitations Meta のこの最初のリリースには、98,243,101 の書誌エンティティ (fabio:Expression)、309,881,223 の著者 (pro:author)、2,406,510 の編集者 (pro:editor)、19,076 の出版社 (pro:publisher)、および 659,214 の会場 (fabio:AcademicProceedings、fabio:ExpressionCollection、fabio:Book、fabio:BookSeries、fabio:Journal、fabio:ReferenceBook、または fabio:Series タイプのリソースなど) が含まれています。したがって、平均して、各書誌リソースには 3 人の著者がいます。編集者は、後者のメタデータがソースでほとんど使用されないため、通常は記録されません。合計で、トリプルストアは 3,749,729,755 のトリプル (出所を除く) で構成されています。


編集者と著者は、これらの役割を担う個人を明確にすることなく、役割としてカウントされています。逆に、書誌エンティティ、出版社、会場は OMID によってカウントされています。ただし、会場 (例: ジャーナル) については、特別な予防措置を講じています。OMID 以外の識別子がないため、OpenCitations Meta では多くの会場が重複しています。そのため、上記の図では、他の識別子がない場合、タイトルで会場を明確にすることが合理的であると判断しました。


表 2 に示すように、Springer Science は出版会場数が最も多い (2097) 出版団体であり、これに Elsevier BV (1961)、IEEE (1775) が続いています。出版物の数を数えると、表 3 に示すように、Elsevier がトップ (16,933,610)、続いて Springer Science (11,507,498)、Wiley (7,262,893) となっています。


表 4 の掲載場所を考慮すると、Wiley の ChemInform の出版物数が最も多く (421,735)、次いで Elsevier の SSRN Electronic Journal (337,223)、Springer の Journal On Data Semantics (330,093) となっています。


表 5 は、OpenCitations Meta のすべての書誌リソースの種類を示しています。現在のデータセットには主にジャーナル記事 (67,904,323) が含まれており、2 位の書籍の章の数 (6,476,623) の約 10 倍、3 位の議事録記事 (5,046,165) の約 13 倍を超えています。


表 6 は、年間の出版物の数を示していますが、年ごとに出版物の数が増加しており、増加傾向にあることがわかります。


表2: 会場数別上位10社の出版社


表3: 出版物数上位10社の出版社


表4: 出版物数による上位10会場


表 5: OpenCitations Meta に含まれるすべての書誌リソース タイプ。そのタイプの出版物の数で並べ替えられています。参照オントロジーは、FaBiO (http://purl.org/spar/fabio)、DOCO (http://purl.org/spar/doco)、および FAIR レビュー (http://purl.org/spar/fr) です。


表6: 出版数上位10年(各年)


OpenCitations Meta を使用すると、ユーザーは SPARQL (https://opencitations.net/meta/sparql) または API (https://opencitations.net/meta/api/v1) を介してこのようなデータを探索できます。特に、OpenCitations Meta API は、1 つ以上の出版識別子、著者の ORCID、または編集者の ORCID から始まる書誌リソースと関連メタデータのリストを取得します。テキスト検索は現在テスト中であり、OpenCitations Meta API のさらなる操作の 1 つとして将来リリースされる予定です。特に、タイトル、著者、編集者、発行者、ID、会場でのテキスト検索を実行できます。会場を最初に指定すれば、巻数と号数でも検索できます。実際、ブール結合演算子と論理和演算子を使用して、複数のフィールドの検索を組み合わせることができます。たとえば、この操作がリリースされると、ユーザーは、Philosophical Studies または Journal of Nonlinear Science によって発行された「micro-chaos」という単語がタイトルに含まれるすべての書誌リソースを検索できるようになります。title=micro-chaos&&venue=philosophical%20studies||title=microchaos&&venue=journal%20of%20nonlinear%20science。ここで、「&&」は結合演算子であり、|| は選言演算子です。


最後に、すべてのデータと来歴は、CC0 ライセンスの下で、RDF (JSON-LD) (OpenCitations、2023b) または CSV 形式 (OpenCitations、2023a) のダンプとして利用できます。


この論文は、CC 4.0 DEED ライセンスの下でarxiv で公開されています