paint-brush
OpenCitations मेटा: डेटा और सेवाएँद्वारा@categorize

OpenCitations मेटा: डेटा और सेवाएँ

बहुत लंबा; पढ़ने के लिए

featured image - OpenCitations मेटा: डेटा और सेवाएँ
Categorize.Tech: Organizing the World of Software HackerNoon profile picture
0-item

लेखक:

(1) आर्केंजेलो मसारी, ओपन स्कॉलरली मेटाडेटा के लिए अनुसंधान केंद्र, शास्त्रीय भाषाशास्त्र और इतालवी अध्ययन विभाग, बोलोग्ना विश्वविद्यालय, बोलोग्ना, इटली {[email protected]};

(2) फैबियो मारियानी, दर्शनशास्त्र और कला विज्ञान संस्थान, ल्यूफ़ाना विश्वविद्यालय, ल्यूनेबर्ग, जर्मनी {[email protected]};

(3) इवान हेइबी, ओपन स्कॉलरली मेटाडेटा के लिए अनुसंधान केंद्र, शास्त्रीय भाषाविज्ञान और इतालवी अध्ययन विभाग, बोलोग्ना विश्वविद्यालय, बोलोग्ना, इटली और डिजिटल मानविकी उन्नत अनुसंधान केंद्र (/DH.arc), शास्त्रीय भाषाविज्ञान और इतालवी अध्ययन विभाग, बोलोग्ना विश्वविद्यालय, बोलोग्ना, इटली {[email protected]};

(4) सिल्वियो पेरोनी, ओपन स्कॉलरली मेटाडेटा के लिए अनुसंधान केंद्र, शास्त्रीय भाषाशास्त्र और इतालवी अध्ययन विभाग, बोलोग्ना विश्वविद्यालय, बोलोग्ना, इटली और डिजिटल मानविकी उन्नत अनुसंधान केंद्र (/DH.arc), शास्त्रीय भाषाशास्त्र और इतालवी अध्ययन विभाग, बोलोग्ना विश्वविद्यालय, बोलोग्ना, इटली {[email protected]};

(5) डेविड शॉटन, ऑक्सफोर्ड ई-रिसर्च सेंटर, ऑक्सफोर्ड विश्वविद्यालय, ऑक्सफोर्ड, यूनाइटेड किंगडम {[email protected]}।

लिंक की तालिका

4. डेटा और सेवाएँ

दिसंबर 2022 में अपनी प्रारंभिक रिलीज़ के समय, ओपनसाइटेशन मेटा में क्रॉसरेफ़ (हेंड्रिक्स एट अल., 2020), डेटासाइट (ब्रेज़, 2010), और एनआईएच ओपन साइटेशन कलेक्शन (आईसाइट एट अल., 2022) को निम्नलिखित ओपनसाइटेशन इंडेक्स के भीतर उद्धरणों में शामिल प्रकाशनों का वर्णन करने वाले ग्रंथ सूची मेटाडेटा के प्राथमिक स्रोतों के रूप में शामिल किया गया था: सीओसीआई (https://opencitations.net/index/coci) (ओपनसाइटेशन, 2022), डीओसीआई (https://opencitations.net/index/doci), और पीओसीआई (https://opencitations.net/index/poci)। मात्रात्मक दृष्टिकोण से, ओपनसाइटेशन मेटा के इस प्रारंभिक रिलीज में 98,243,101 ग्रंथसूची इकाइयाँ (fabio:Expression), 309,881,223 लेखक (pro:author), 2,406,510 संपादक (pro:editor), 19,076 प्रकाशक (pro:publisher) और 659,214 स्थान (जैसे fabio:AcademicProceedings, fabio:ExpressionCollection, fabio:Book, fabio:BookSeries, fabio:Journal, fabio:ReferenceBook, या fabio:Series) हैं। इस प्रकार, औसतन, प्रत्येक ग्रंथसूची संसाधन में तीन लेखक होते हैं। आम तौर पर कोई संपादक दर्ज नहीं किया जाता है, क्योंकि हमारे स्रोतों में बाद वाले मेटाडेटा का बहुत कम उपयोग किया जाता है। कुल मिलाकर, ट्रिपलस्टोर में 3,749,729,755 ट्रिपल (प्रमाण को छोड़कर) शामिल हैं।


संपादकों और लेखकों को भूमिकाओं के रूप में गिना गया है, इन भूमिकाओं को धारण करने वाले व्यक्तियों को अलग किए बिना। इसके विपरीत, ग्रंथसूची संस्थाओं, प्रकाशकों और स्थानों को OMID द्वारा गिना गया था। हालाँकि, स्थानों (जैसे पत्रिकाओं) के लिए, हमने एक अतिरिक्त सावधानी बरती है: कई OpenCitations मेटा में दोहराए गए हैं क्योंकि उनके पास OMID के अलावा कोई अन्य पहचानकर्ता नहीं है। इसलिए, ऊपर दिखाए गए आंकड़ों में, हमने अन्य पहचानकर्ताओं की अनुपस्थिति में शीर्षक द्वारा स्थानों को अलग करना उचित पाया।


जैसा कि तालिका 2 में दिखाया गया है, स्प्रिंगर साइंस सबसे अधिक स्थानों (2097) वाली प्रकाशन संस्था है, उसके बाद एल्सेवियर बी.वी. (1961) और आई.ई.ई.ई. (1775) का स्थान है। प्रकाशनों की संख्या की गणना करते समय, एल्सेवियर सबसे आगे (16,933,610) है, उसके बाद तालिका 3 में स्प्रिंगर साइंस (11,507,498) और विले (7,262,893) का स्थान है।


तालिका 4 में दिए गए स्थानों पर विचार करते हुए, विले के केमइन्फॉर्म में सबसे अधिक प्रकाशन (421,735) हैं, उसके बाद एल्सेवियर के एसएसआरएन इलेक्ट्रॉनिक जर्नल (337,223) और स्प्रिंगर के जर्नल ऑन डेटा सेमेंटिक्स (330,093) का स्थान है।


तालिका 5 में ओपनसाइटेशन मेटा में सभी प्रकार के ग्रंथसूची संसाधन सूचीबद्ध हैं। वर्तमान डेटासेट में ज़्यादातर जर्नल लेख (67,904,323) हैं, जो दूसरे स्थान पर मौजूद पुस्तक अध्यायों (6,476,623) की संख्या से लगभग दस गुना ज़्यादा हैं, और तीसरे स्थान पर मौजूद कार्यवाही लेखों (5,046,165) की संख्या से लगभग तेरह गुना ज़्यादा हैं।


तालिका 6, जिसमें प्रति वर्ष प्रकाशनों की संख्या सूचीबद्ध है, बढ़ती प्रवृत्ति को दर्शाती है, जिसमें वर्ष दर वर्ष प्रकाशनों की संख्या बढ़ती जा रही है।


तालिका 2: स्थानों की संख्या के अनुसार शीर्ष दस प्रकाशक


तालिका 3: प्रकाशनों की संख्या के अनुसार शीर्ष दस प्रकाशक


तालिका 4: प्रकाशनों की संख्या के अनुसार शीर्ष दस स्थान


तालिका 5: ओपनसाइटेशन मेटा में शामिल सभी ग्रंथसूची संसाधन प्रकार, उस प्रकार के प्रकाशनों की संख्या के अनुसार क्रमबद्ध। संदर्भ ऑन्टोलॉजीज़ हैं FaBiO (http://purl.org/spar/fabio), DOCO (http://purl.org/spar/doco), और FAIR समीक्षाएँ (http://purl.org/spar/fr)


तालिका 6: प्रकाशनों की संख्या के अनुसार प्रकाशन के शीर्ष दस वर्ष


ओपनसाइटेशन मेटा उपयोगकर्ताओं को SPARQL (https://opencitations.net/meta/sparql) या API (https://opencitations.net/meta/ api/v1) के माध्यम से ऐसे डेटा का पता लगाने की अनुमति देता है। विशेष रूप से, ओपनसाइटेशन मेटा API एक या अधिक प्रकाशन पहचानकर्ताओं, लेखक के ORCID या संपादक के ORCID से शुरू होने वाले ग्रंथसूची संसाधनों और संबंधित मेटाडेटा की एक सूची प्राप्त करता है। पाठ्य खोज वर्तमान में परीक्षण के अधीन हैं और भविष्य में ओपनसाइटेशन मेटा API के एक और ऑपरेशन के रूप में जारी की जाएंगी। विशेष रूप से, शीर्षकों, लेखकों, संपादकों, प्रकाशकों, आईडी और स्थानों पर पाठ खोज की जा सकती है। उन्हें वॉल्यूम और अंक संख्याओं पर भी प्राप्त किया जा सकता है, बशर्ते कि स्थान पहले निर्दिष्ट किया गया हो। वास्तव में, बूलियन संयोजन और वियोजन ऑपरेटरों का उपयोग करके कई क्षेत्रों पर खोजों को जोड़ा जा सकता है। उदाहरण के लिए, एक बार ऑपरेशन जारी होने के बाद, उपयोगकर्ता सभी ग्रंथसूची संसाधनों की खोज करने में सक्षम होगा, जिनके शीर्षक में फिलॉसॉफिकल स्टडीज या जर्नल ऑफ नॉनलाइनियर साइंस द्वारा प्रकाशित "माइक्रो-कैओस" शब्द शामिल है: title=micro-chaos&&venue=philosophical%20studies||title=microchaos&&venue=journal%20of%20nonlinear%20science, जहां "&&" संयोजन ऑपरेटर है, जबकि || वियोजन ऑपरेटर है।


अंत में, सभी डेटा और उद्गम RDF (JSON-LD) (OpenCitations, 2023b) या CSV प्रारूप (OpenCitations, 2023a) में CC0 लाइसेंस के तहत डंप के रूप में उपलब्ध हैं।


यह पेपर CC 4.0 DEED लाइसेंस के अंतर्गत arxiv पर उपलब्ध है।