paint-brush
OpenCitations Meta: Conclusão, Agradecimentos e Referênciaspor@categorize
120 leituras

OpenCitations Meta: Conclusão, Agradecimentos e Referências

Muito longo; Para ler

featured image - OpenCitations Meta: Conclusão, Agradecimentos e Referências
Categorize.Tech: Organizing the World of Software HackerNoon profile picture
0-item

Autores:

(1) Arcangelo Massari, Centro de Pesquisa para Metadados Acadêmicos Abertos, Departamento de Filologia Clássica e Estudos Italianos, Universidade de Bolonha, Bolonha, Itália {[email protected]};

(2) Fabio Mariani, Instituto de Filosofia e Ciências da Arte, Universidade Leuphana, Lüneburg, Alemanha {[email protected]};

(3) Ivan Heibi, Centro de Pesquisa para Metadados Acadêmicos Abertos, Departamento de Filologia Clássica e Estudos Italianos, Universidade de Bolonha, Bolonha, Itália e Centro de Pesquisa Avançada em Humanidades Digitais (/DH.arc), Departamento de Filologia Clássica e Estudos Italianos, Universidade de Bolonha, Bolonha, Itália {[email protected]};

(4) Silvio Peroni, Centro de Pesquisa para Metadados Acadêmicos Abertos, Departamento de Filologia Clássica e Estudos Italianos, Universidade de Bolonha, Bolonha, Itália e Centro de Pesquisa Avançada em Humanidades Digitais (/DH.arc), Departamento de Filologia Clássica e Estudos Italianos, Universidade de Bolonha, Bolonha, Itália {[email protected]};

(5) David Shotton, Oxford e-Research Centre, Universidade de Oxford, Oxford, Reino Unido {[email protected]}.

Tabela de Links

6. Conclusão

Este artigo detalhou a metodologia utilizada para desenvolver o OpenCitations Meta, um banco de dados que armazena e entrega metadados bibliográficos para todas as publicações envolvidas nos Índices OpenCitations. Este processo envolve duas fases principais: (1) uma análise de curadoria automática destinada a desduplicar entidades, corrigir erros e enriquecer a informação, e (2) uma conversão de dados para RDF, mantendo ao mesmo tempo o registo de alterações e proveniência em RDF.


Informações sobre novas publicações são continuamente adicionadas ao Crossref, DataCite e PubMed, e desenvolveremos procedimentos para ingerir esses novos metadados no OpenCitations Meta de maneira regular e oportuna. Além disso, já está em andamento o trabalho para ingerir metadados bibliográficos do Japan Link Center e do OpenAIRE Research Graph, e outras fontes serão incluídas conforme nossos recursos humanos e computacionais permitirem. Assim, o OpenCitations Meta continuará a crescer.


OpenCitations Meta tem três benefícios principais. Primeiro, o uso de OMIDs (OpenCitation Meta Identifiers) para todas as entidades armazenadas permite que OpenCitations Meta atue como um hub de mapeamento para publicações que podem ter mais de um PID externo (por exemplo, um artigo de jornal descrito em Crossref com um DOI (Digital Object Identifier ), e a mesma publicação descrita no PubMed com um PMID (PubMed Identifier), ao mesmo tempo que possibilita caracterizar citações envolvendo recursos sem PIDs externos. Consequentemente, o segundo benefício é que OpenCitations Meta permite que citações em índices OpenCitations sejam descritas como. OMID-to-OMID, desambiguando citações entre documentos com diferentes esquemas de identificação, por exemplo, representados como DOI-to-DOI no Crossref e PMID-to-PMID no PubMed Terceiro, o OpenCitations Meta acelera as operações de pesquisa para recuperar metadados sobre publicações envolvidas nas citações. armazenados nos OpenCitations Citation Indexes, uma vez que esses metadados agora são mantidos internamente, em vez de serem recuperados por chamadas de API dinâmicas para recursos externos.


Os desafios futuros serão elaborar um sistema de desambiguação para pessoas sem um identificador ORCID, melhorar a qualidade dos metadados existentes, melhorar as operações de pesquisa e a eficiência de armazenamento, adicionar campos de metadados adicionais para resumos, IDs de financiadores, informações de financiamento e Identificadores institucionais e preenchê-los onde esses metadados estiverem disponíveis em nossas fontes.


Finalmente, uma interface será implementada e disponibilizada para especialistas de domínio confiáveis para permitir a curadoria manual direta e em tempo real de metadados mantidos pelo OpenCitations Meta. Tal sistema rastreará as mudanças e a proveniência, preservará o delta entre as diferentes versões de cada entidade e reterá informações como o agente responsável pela mudança, a fonte primária e a data. Desta forma, nos esforçaremos para tornar o OpenCitations Meta não apenas abrangente, mas também uma fonte precisa, totalmente aberta e reutilizável de metadados bibliográficos, para a qual os membros da comunidade acadêmica possam contribuir diretamente.

7 Agradecimentos

Este trabalho foi parcialmente financiado pelo Programa de Investigação e Inovação Horizonte 2020 da União Europeia ao abrigo do acordo de subvenção n.º 101017452 (Projeto OpenAIRE-Nexus).

Referências

Abramatic, J.-F., Di Cosmo, R., & Zacchiroli, S. (2018). Construindo o arquivo universal de código-fonte. Comunicações do ACM, 61 (10), 29–31. https://doi.org/10.1145/3183558


Atzori, C., Bardi, A., Manghi, P., & Mannocci, A. (2017). Os fluxos de trabalho OpenAIRE para gerenciamento de dados [Título da série: Comunicações em Computação e Ciência da Informação]. Em C. Grana & L. Baraldi (Eds.), Bibliotecas e Arquivos Digitais (pp. 95–107). Publicação Internacional Springer. https://doi.org/10.1007/978-3-319-68130-6_8


Auer, S., Oelen, A., Haris, M., Stocker, M., D'Souza, J., Farfar, KE, Vogt, L., Prinz, M., Wiens, V., & Jaradeh, MY (2020). Melhorando o acesso à literatura científica com gráficos de conhecimento. Bibliothek Forschung und Praxis, 44 (3), 516–529. https://doi.org/10.1515/bfp-2020-2042


Conselho, DU (2020). Termos de Metadados DCMI. Recuperado em 16 de julho de 2021, em http://dublincore.org/specifications/dublin-core/dcmi-terms/2020-01-20/


Brase, J. (2009). DataCite – Uma Agência Global de Registro para Dados de Pesquisa. Quarta Conferência Internacional de 2009 sobre Cooperação e Promoção de Recursos de Informação em Ciência e Tecnologia, 257–261. https://doi.org/10.1109/COINFO.2009.66


Brase, J. (2010). Datacite – Uma Agência Global de Registro para Dados de Pesquisa. Diário Eletrônico SSRN. https://doi.org/10.2139/ssrn.1639998


Carroll, JJ, Bizer, C., Hayes, P. e Stickler, P. (2005). Gráficos nomeados, proveniência e confiança. Anais da 14ª conferência internacional sobre World Wide Web - WWW '05, 613. https://doi.org/10.1145/1060745. 1060835


Daquino, M. e Peroni, S. (2019). OCO, a Ontologia OpenCitations. Recuperado em 4 de setembro de 2021, em https://w3id.org/oc/ontology/2019-09-19


Daquino, M., Peroni, S. e Shotton, D. (2020). O modelo de dados OpenCitations [Tamanho da arte: 836876 bytes Editor: figshare], 836876 bytes. https://doi.org/10.6084/M9.FIGSHARE.3443876.V7


Dhakal, K. (2019). Cancelar pagamento. Jornal da Associação de Bibliotecas Médicas, 107 (2). https://doi.org/10.5195/jmla.2019.650


Comissão Europeia. Direcção Geral de Investigação e Inovação. (2016). Realizar a nuvem europeia de ciência aberta: primeiro relatório e recomendações do grupo de peritos de alto nível da Comissão sobre a nuvem europeia de ciência aberta. Escritório de Publicações. Recuperado em 17 de outubro de 2022, em https://data.europa.eu/doi/10.2777/940154


Falco, R., Gangemi, A., Peroni, S., Shotton, D., & Vitali, F. (2014). Modelando Ontologias OWL com Graffoo [Título da Série: Notas de Aula em Ciência da Computação]. Em V. Presutti, E. Blomqvist, R. Troncy, H. Sack, I. Papadakis e A. Tordai (Eds.), The Semantic Web: ESWC 2014 Satellite Events (pp. 320–325). Publicação Internacional Springer. https://doi.org/10. 1007/978-3-319-11955-7_42


Fricke, S. (2018). Estudioso Semântico. Jornal da Associação de Bibliotecas Médicas, 106 (1). https://doi.org/10.5195/jmla.2018.280


Garcia, A., Lopez, F., Garcia, L., Giraldo, O., Bucheli, V., & Dumontier, M. (2018). Biotea: Semântica para Pubmed Central. PeerJ, 6, e4201. https://doi.org/10.7717/peerj.4201


Gentile, AL e Nuzzolese, AG (2015). Gerador de dados abertos vinculados à conferência cLODg. ISWC (pôsteres e demonstrações).


Gil, Y., Cheney, J., Groth, P., Hartig, O., Miles, S., Moreau, L., & Silva, P. (2010). Relatório Final de Proveniência XG [Tipo: W3C.]. http://www.w3. org/2005/Incubadora/prov/XGR-prov-20101214/


Gorraiz, J., Melero-Fuentes, D., Gumpenberger, C., & Valderrama-Zurián, J.-C. (2016). Disponibilidade de identificadores de objetos digitais (DOIs) em Web of Science e Scopus. Journal of Informetrics, 10 (1), 98–109. https://doi.org/10.1016/j.joi.2015.11.008


Haak, LL, Fenner, M., Paglione, L., Pentz, E., & Ratner, H. (2012). ORCID: Um sistema para identificar pesquisadores de forma única. Publicação aprendida, 25 (4), 259–264. https://doi.org/10.1087/20120404


Hammond, T., Pasin, M. e Theodoridis, E. (2017). Integração e desintegração de dados: Gerenciando Springer Nature SciGraph com SHACL e OWL. ISWC (pôsteres, demonstrações e faixas da indústria). http://ceur-ws.org/Vol1963/paper493.pdf


Hara, M. (2020). Introdução do Japan Link Center (JaLC) [Tamanho da arte: 2213661 Bytes Editor: ORCID], 2213661 Bytes. https://doi.org/10. 23640/07243.12469094.V1


Heibi, I., Peroni, S. e Shotton, D. (2019a). Crowdsourcing de citações abertas com CROCI – Uma análise do status atual das citações abertas e uma proposta [arXiv: 1902.02534]. arXiv:1902.02534 [cs]. Recuperado em 15 de setembro de 2021, em http://arxiv.org/abs/1902.02534


Heibi, I., Peroni, S. e Shotton, D. (2019b). Revisão de software: COCI, o OpenCitations Index of Crossref abre citações DOI-to-DOI. Cienciometria, 121 (2), 1213–1228. https://doi.org/10.1007/s11192-019-03217-6


Hendricks, G., Tkaczyk, D., Lin, J. e Feeney, P. (2020). Crossref: A fonte sustentável de metadados acadêmicos de propriedade da comunidade. Estudos Quantitativos de Ciências, 1 (1), 414–427. https://doi.org/10.1162/qss_a_00022


ICite, Hutchins, BI, & Santangelo, G. (2022). Instantâneos do banco de dados iCite (NIH Open Citation Collection) [Editor: The NIH Figshare Archive]. https://doi.org/10.35092/YHJC.C.4586573


Koivunen, M.-R., & Miller, E. (2001). Atividade da Web Semântica [Edição: W3C Volume: 11 02]. https://www.w3.org/2001/12/semweb-fin/w3csw


Lammey, R. (2020). Soluções para problemas de identificação: Uma olhada no Registro de Organização de Pesquisa. Edição Científica, 7 (1), 65–69. https://doi.org/10.6087/kcse.192


Lebo, T., Sahoo, S. e McGuinness, D. (2013). PROV-O: A Ontologia PROV [Local: PROV-O Volume: 04 30]. Recuperado em 16 de julho de 2021, em http: //www.w3.org/TR/2013/REC-prov-o-20130430/


Maloney, C., Sequeira, E., Kelly, C., Orris, R., & Beck, J. (2013). PubMed Central. No Manual do NCBI.


Manghi, P., Manola, N., Horstmann, W., & Peters, D. (2010). Uma infra-estrutura para gerir os resultados da investigação financiada pela CE: o projecto OpenAIRE. Jornal Gray (TGJ), 6 (1).


Massari, A. e Heibi, I. (2022). Como estruturar dados de citações e metadados bibliográficos no formato aceito pelo OpenCitations. Anais do Workshop sobre Compreensão das referências da Literatura em TExt completo acadêmico, 3220. http://ceur-ws.org/Vol-3220/invited-talk2.pdf


Massari, A. e Peroni, S. (2022). Executando consultas de passagem de tempo ao vivo via SPARQL em conjuntos de dados RDF [Editor: número da versão arXiv: 2]. https://doi.org/10.48550/ARXIV.2210.02534


Mora-Cantallops, M., Sánchez-Alonso, S., & García-Barriocanal, E. (2019). Uma revisão sistemática da literatura no Wikidata. Tecnologias e aplicações de dados, 53 (3), 250–268. https://doi.org/10.1108/DTA-12-2018-0110


Morrison, H. (2017). Diretório de Periódicos de Acesso Aberto (DOAJ). O Conselheiro de Charleston, 18 (3), 25–28. https://doi.org/10.5260/chara.18.3.25


Nielsen, F. Å., Mietchen, D., & Willighagen, EL (2017). Scholia, Cientometria e Wikidata. Em E. Blomqvist, K. Hose, H. Paulheim, A. Lawrynowicz, F. Ciravegna, & O. Hartig (Eds.), The Semantic Web: ESWC 2017 Satellite Events - ESWC 2017 Satellite Events, Portorož, Eslovênia, 28 de maio - 1º de junho de 2017, Artigos Selecionados Revisados (pp. 237–259). Springer. https://doi.org/10.1007/978-3-319-70407-4_36


Nuzzolese, AG, Gentile, AL, Presutti, V., & Gangemi, A. (2016). Ontologia de conferência web semântica - uma solução de refatoração. Conferência europeia da web semântica, 84–87.


Citações abertas. (2022). Conjunto de dados COCI CSV de todos os dados de citação. https://doi. org/10.6084/M9.FIGSHARE.6741422.V18


Citações abertas. (2023a). Conjunto de dados OpenCitations Meta CSV de todos os metadados bibliográficos. https://doi.org/10.6084/M9.FIGSHARE.21747461.V3


Citações abertas. (2023b). Conjunto de dados OpenCitations Meta RDF de todos os metadados bibliográficos e suas informações de procedência. https://doi.org/10.6084/M9. FIG SHARE.21747536.V3


Pelgrin, O., Galárraga, L., & Hose, K. (2021). Rumo ao arquivamento completo para conjuntos de dados RDF (A.-C. Ngonga Ngomo, M. Saleem, R. Verborgh, M. Saleem, R. Verborgh, MI Ali, & O. Hartig, Eds.). Jornal da Web Semântica, 12 (6), 903–925. https://doi.org/10.3233/SW-210434


Peroni, S. e Shotton, D. (2018). Citação aberta: Definição [Tamanho da arte: 95436 bytes Editor: figshare], 95436 bytes. https://doi.org/10.6084/M9. FIG SHARE.6683855.V1


Peroni, S. e Shotton, D. (2020). OpenCitations, uma organização de infraestrutura para bolsas abertas [_eprint: https://direct.mit.edu/qss/articlepdf/1/1/428/1760920/qss_a_00023.pdf]. Estudos Quantitativos de Ciências, 1 (1), 428–444. https://doi.org/10.1162/qss_a_00023


Peroni, S., Shotton, D. e Vitali, F. (2012). Publicação acadêmica e dados vinculados: descrição de funções, status, extensões temporais e contextuais. Anais da 8ª Conferência Internacional sobre Sistemas Semânticos - I-SEMANTICS '12, 9. https://doi.org/10.1145/2362499.2362502


Persiani, S., Daquino, M., & Peroni, S. (2022). Uma interface de programação para criação de dados de acordo com as ontologias SPAR e o modelo de dados OpenCitations [Título da série: Notas de aula em ciência da computação]. Em P. Groth, M.-E. Vidal, F. Suchanek, P. Szekley, P. Kapanipathi, C. Pesquita, H. Skaf-Molli e M. Tamper (Eds.), The Semantic Web (pp. 305–322). Publicação Internacional Springer. https://doi.org/10. 1007/978-3-031-06981-9_18


Pranckut˙e, R. (2021). Web of Science (WoS) e Scopus: os titãs da informação bibliográfica no mundo acadêmico de hoje. Publicações, 9 (1), 12. https://doi.org/10.3390/publications9010012


Priem, J., Piwowar, HA, & Orr, R. (2022). OpenAlex: Um índice totalmente aberto de trabalhos acadêmicos, autores, locais, instituições e conceitos [arXiv: 2205.01833]. CoRR, abs/2205.01833. https://doi.org/10.48550/arXiv. 2205.01833


Pesquisa, EOFN e OpenAIRE. (2013). Zenodo: Pesquisa. Compartilhado. [Editora: CERN]. https://doi.org/10.25495/7GXK-RD71


Sigurdsson, S. (2020). O futuro do arXiv e a descoberta de conhecimento em ciência aberta. Anais do Primeiro Workshop sobre Processamento de Documentos Acadêmicos, 7–9. https://doi.org/10.18653/v1/2020.sdp-1.2


Sikos, LF e Philp, D. (2020). Representação de conhecimento com base na proveniência: uma pesquisa de modelos de dados e gráficos de conhecimento contextualizados. Ciência e Engenharia de Dados, 5 (3), 293–316. https://doi. org/10.1007/s41019-020-00118-0


Subramanian, S., King, D., Downey, D., & Feldman, S. (2021). S2AND: Um sistema de referência e avaliação para desambiguação de nomes de autores. Conferência Conjunta ACM/IEEE 2021 sobre Bibliotecas Digitais (JCDL), 170–179. https://doi.org/10.1109/JCDL52503.2021.00029


Tanon, TP, Vrandecic, D., Schaffert, S., Steiner, T., & Pintscher, L. (2016). Do Freebase ao Wikidata: A Grande Migração. Em J. Bourdeau, J. Hendler, R. Nkambou, I. Horrocks, & BY Zhao (Eds.), Anais da 25ª Conferência Internacional sobre World Wide Web, WWW 2016, Montreal, Canadá, 11 a 15 de abril de 2016 ( pp. 1419–1428). ACM. https://doi.org/10.1145/2872427.2874809


O Consórcio PMC da Europa. (2015). Europe PMC: Uma base de dados de literatura de texto completo para as ciências da vida e uma plataforma para a inovação. Pesquisa de ácidos nucléicos, 43 (D1), D1042 – D1048. https://doi.org/10.1093/nar/gku1061


Tillett, B. (2005). O que é FRBR? Um modelo conceitual para o universo bibliográfico. The Australian Library Journal, 54 (1), 24–30. https://doi. org/10.1080/00049670.2005.10721710


Visão, T. (2010). The Dryad Digital Repository: dados evolutivos publicados como parte de um grande ecossistema de dados. Precedentes da Natureza. https://doi. org/10.1038/npre.2010.4595.1


Wilkinson, MD, Dumontier, M., Aalbersberg, IJ, Appleton, G., Axton, M., Baak, A., Blomberg, N., Boiten, J.-W., da Silva Santos, LB, Bourne, PE , Bouwman, J., Brookes, AJ, Clark, T., Crosas, M., Dillo, I., Dumon, O., Edmunds, S., Evelo, CT, Finkers, R.,. . . Mons, B. (2016). Os Princípios Orientadores FAIR para gestão e administração de dados científicos. Dados Científicos, 3 (1), 160018. https://doi.org/10. 1038/sdata.2016.18


Wolf, M. e Wicksteed, C. (1997). Formatos de data e hora. Recuperado em 9 de maio de 2022, em https://www.w3.org/TR/NOTE-datetime


Zhang, Z., Nuzzolese, AG e Gentile, AL (2017). Desduplicação de entidade em ScholarlyData [Título da série: Notas de aula em ciência da computação]. Em E. Blomqvist, D. Maynard, A. Gangemi, R. Hoekstra, P. Hitzler e O. Hartig (Eds.), The Semantic Web (pp. 85–100). Publicação Internacional Springer. https://doi.org/10.1007/978-3-319-58068-5_6


Este artigo está disponível no arxiv sob licença CC 4.0 DEED.