paint-brush
OpenCitations Meta: আলোচনাদ্বারা@categorize
108 পড়া

OpenCitations Meta: আলোচনা

অতিদীর্ঘ; পড়তে

featured image - OpenCitations Meta: আলোচনা
Categorize.Tech: Organizing the World of Software HackerNoon profile picture
0-item

লেখক:

(1) Arcangelo Massari, রিসার্চ সেন্টার ফর ওপেন স্কলারলি মেটাডেটা, ক্লাসিক্যাল ফিলোলজি এবং ইতালিয়ান স্টাডিজ বিভাগ, বোলোগনা বিশ্ববিদ্যালয়, বোলোগনা, ইতালি {[email protected]};

(2) ফ্যাবিও মারিয়ানি, ইনস্টিটিউট অফ ফিলোসফি অ্যান্ড সায়েন্সেস অফ আর্ট, লিউফানা ইউনিভার্সিটি, লুনেবার্গ, জার্মানি {[email protected]};

(3) ইভান হেইবি, রিসার্চ সেন্টার ফর ওপেন স্কলারলি মেটাডেটা, ক্লাসিক্যাল ফিলোলজি এবং ইতালিয়ান স্টাডিজ বিভাগ, ইউনিভার্সিটি অফ বোলোগনা, বোলোগনা, ইতালি এবং ডিজিটাল হিউম্যানিটিজ অ্যাডভান্সড রিসার্চ সেন্টার (/DH.arc), ক্লাসিক্যাল ফিলোলজি এবং ইতালিয়ান স্টাডিজ বিভাগ, বিশ্ববিদ্যালয় বোলোগনা, বোলোগনা, ইতালি {[email protected]};

(4) সিলভিও পেরোনি, রিসার্চ সেন্টার ফর ওপেন স্কলারলি মেটাডেটা, ক্লাসিক্যাল ফিলোলজি এবং ইতালিয়ান স্টাডিজ বিভাগ, বোলোগনা বিশ্ববিদ্যালয়, বোলোগনা, ইতালি এবং ডিজিটাল হিউম্যানিটিজ অ্যাডভান্সড রিসার্চ সেন্টার (/DH.arc), ক্লাসিক্যাল ফিলোলজি এবং ইতালিয়ান স্টাডিজ বিভাগ, বিশ্ববিদ্যালয় বোলোগনা, বোলোগনা, ইতালি {[email protected]};

(5) ডেভিড শটন, অক্সফোর্ড ই-রিসার্চ সেন্টার, অক্সফোর্ড বিশ্ববিদ্যালয়, অক্সফোর্ড, যুক্তরাজ্য {[email protected]}।

লিঙ্কের টেবিল

5. আলোচনা

বিভাগ 2-তে দেখানো হয়েছে, শুধুমাত্র শব্দার্থিক প্রকাশনা ডেটাসেট বিবেচনা করার সময়, OpenCitations Meta, যা বর্তমানে Crossref, DataCite এবং NIH ওপেন সিটেশন কালেকশন (ICite et al., 2022) থেকে ডেটা অন্তর্ভুক্ত করে, ডেটা ভলিউমে প্রথম। অধিকন্তু, জাপান লিংক সেন্টার (হারা, 2020), ওপেনএয়ার রিসার্চ গ্রাফ (আটজোরি এট আল।, 2017), এবং ড্রিয়াড ডিজিটাল রিপোজিটরি (ভিশন, 2010) এর মতো নতুন উত্স থেকে ডেটা গ্রহণ করার জন্য ইতিমধ্যে কাজ চলছে।


ওপেনএয়ার রিসার্চ গ্রাফের সাথে তুলনা করলে, ওপেনসিটেশন মেটা-এর কার্যকারিতার দিক থেকে সুবিধা রয়েছে: যেমন OMID-এর ব্যবহার, OpenCitations Meta-এর মধ্যে প্রতিটি সত্তাকে চিহ্নিত করতে অভ্যন্তরীণভাবে ব্যবহৃত বিশ্বব্যাপী অনন্য স্থায়ী শনাক্তকারী। এই ব্যবহারটি গ্রন্থপঞ্জী সংক্রান্ত সংস্থানগুলির মধ্যে উদ্ধৃতিগুলিকে উপস্থাপন করা এবং সূচী সূচী করা সম্ভব করে তোলে যেখানে একটি বাহ্যিক স্থায়ী শনাক্তকারী যেমন ডিজিটাল অবজেক্ট আইডেন্টিফায়ার (DOI) নেই। এই বৈশিষ্ট্যটি ওপেনসিটেশন ইনডেক্সের জন্য উল্লেখযোগ্য মান যোগ করে, কারণ এটি প্রথমবারের মতো অনেক উদ্ধৃতি গ্রহণের অনুমতি দেয় যা এখন পর্যন্ত চিহ্নিত করা সম্ভব হয়নি, বিশেষ করে মানবিক ও সামাজিক বিজ্ঞানের প্রকাশনার মধ্যে উদ্ধৃতি (গোরাইজ এট আল।, 2016) , এবং প্রাথমিক উত্স জড়িত উদ্ধৃতি, যেমন একটি মূর্তি, একটি পেইন্টিং, বা একটি কোডেক্স, যার সাধারণত একটি স্থায়ী শনাক্তকারীর অভাব থাকে। গুরুত্বপূর্ণভাবে, একটি OMID থাকলে চিহ্নিত সংস্থানটিকে একটি অনন্য URL বরাদ্দ করার অনুমতি দেয়, উদাহরণস্বরূপ https://w3id.org/oc/meta/br/061401975837 omid:br/061401975837-এর জন্য৷


আরেকটি বৈশিষ্ট্য যা আমাদের সর্বোত্তম জ্ঞান অনুসারে, শুধুমাত্র OpenCitations Meta-তে উপস্থিত রয়েছে তা হল RDF-তে সংরক্ষিত মূল তথ্যের মধ্যে পরিবর্তন-ট্র্যাকিং ব্যবস্থাপনার ব্যবস্থা। পাইথন টাইমঅ্যাগনস্টিক-লাইব্রেরি সফ্টওয়্যার (মাসারি এবং পেরোনি, 2022) ব্যবহার করে এই তথ্য জিজ্ঞাসা করা যেতে পারে। এটি টাইম-ট্রাভার্সাল SPARQL কোয়েরি সম্পাদন করতে পারে, যেমন বিভিন্ন স্ন্যাপশট জুড়ে কোয়েরি একত্রে মূল তথ্য সহ।


যতদূর পর্যন্ত অন্যান্য গ্রন্থপঞ্জী ডেটাসেট যা সেমান্টিক ওয়েব প্রযুক্তি ব্যবহার করে না, OpenAlex (Priem et al., 2022) OpenCitations Meta-এর সাথে তুলনা করার জন্য বিবেচনা করার জন্য একটি গুরুত্বপূর্ণ ক্ষেত্রে। OpenAlex অনুপস্থিত মেটাডেটা যোগ করার জন্য ওয়েব ক্রল ব্যবহার করে, এটি একটি বৈশিষ্ট্য যা এটিকে ওপেনসিটেশন মেটা-এর সাথে তুলনা করার সময়, উৎসের ডেটাতে প্রদর্শিত উচ্চ সংখ্যক ত্রুটি স্বয়ংক্রিয়ভাবে সংশোধন করতে দেয়।


প্রকৃতপক্ষে, বর্তমানে, OpenCitations Meta-এর প্রধান সীমাবদ্ধতা ডেটার গুণমান নিয়ে উদ্বিগ্ন, যা উৎসের মানের উপর কঠোরভাবে নির্ভরশীল। Crossref প্রকাশকদের দ্বারা প্রদত্ত মেটাডেটা দুবার চেক করে না, এবং এইভাবে অনেক ত্রুটি সংরক্ষণ করা হয়। উদাহরণস্বরূপ, ভবিষ্যতে প্রকাশিত নিবন্ধগুলির মুখোমুখি হওয়া সম্ভব (https://api.crossref.org/v1/works/10.12960/tsh.2020.0006-এ উপলব্ধ মেটাডেটা বলছে যে নিবন্ধটি 2029 সালে মুদ্রণে প্রকাশিত হবে)। এই ত্রুটিগুলির মধ্যে কিছু পটভূমির জ্ঞান ছাড়াই স্বয়ংক্রিয়ভাবে সংশোধন করা যেতে পারে, অন্যদের জন্য ওয়েব ক্রলার বা ম্যানুয়াল হস্তক্ষেপের প্রয়োজন হয়। যখন OpenAlex ওয়েব ক্রলগুলির পথ অনুসরণ করছে, OpenCitations একটি কাঠামোর উপর কাজ করছে যা বিশ্বস্ত মানব ডোমেন বিশেষজ্ঞদের (যেমন একাডেমিক লাইব্রেরিয়ানদের) দ্বারা ডেটা সম্পাদনা এবং কিউরেশনের অনুমতি দেবে।


OpenCitations Meta তার প্রাথমিক উদ্দেশ্য পূরণ করে ওপেনসিটেশন ইনডেক্সের মধ্যে উদ্ধৃতিগুলির সাথে জড়িত উদ্ধৃতি এবং উদ্ধৃত প্রকাশনাগুলি বর্ণনা করার জন্য প্রয়োজনীয় গ্রন্থপঞ্জী মেটাডেটা ধারণ করে। এই গ্রন্থপঞ্জী সংক্রান্ত মেটাডেটা উপাদানগুলি ছাড়াও, যাইহোক, আমরা ভালভাবে সচেতন যে একাডেমিক সম্প্রদায়ের জন্য অত্যন্ত গুরুত্বপূর্ণ অতিরিক্ত মেটাডেটা উপাদান রয়েছে: বিমূর্ত, পাঠ্য খনির জন্য, ডোমেন এবং বিষয় ক্ষেত্র নির্ধারণ এবং সূচীকরণ (এমনকি যদি সম্পূর্ণ পাঠ্য প্রকাশনাগুলি অন্য কোথাও উন্মুক্ত অ্যাক্সেস পাওয়া যায়), এবং ফান্ডার আইডি, ফান্ডিং তথ্য এবং প্রাতিষ্ঠানিক শনাক্তকারী, কর্মক্ষমতা মেট্রিক্স নির্ধারণ এবং গবেষণা মূল্যায়ন করার জন্য প্রয়োজনীয়। একবার আমরা আমাদের পাঠ্য অনুসন্ধান ক্রিয়াকলাপগুলির বিধান সম্পূর্ণ করার পরে, নির্দেশিত উপায়ে আমাদের কভারেজ প্রসারিত করি এবং ওপেনসিটেশন মেটা এবং ওপেনসিটেশন ইনডেক্সগুলি যে গণনামূলক পরিকাঠামোকে উন্নত করি, আমরা এই অতিরিক্ত মেটাডেটা ক্ষেত্রগুলিকে একীভূত এবং পপুলেট করতে এগিয়ে যাব।


উচ্চ-মানের গ্রন্থপঞ্জি মেটাডেটার বিধান স্বয়ংক্রিয় ক্রিয়াকলাপগুলির দ্বারা অর্জন করা একটি জটিল এবং কঠিন লক্ষ্য, যখন ক্রিয়াকলাপের স্কেলটি রেকর্ডের সংখ্যালঘু ব্যতীত ম্যানুয়াল কিউরেশনকে বাধা দেয়। বর্তমানে কোনো গ্রন্থপঞ্জী সংক্রান্ত ডেটাসেট নিজেই এই লক্ষ্য অর্জন করতে সক্ষম নয়। এই কারণে, সমস্ত উপলব্ধ গ্রন্থপঞ্জী ডেটাবেসকে পরিপূরক হিসাবে দেখা উচিত। উদাহরণস্বরূপ, এই মুহুর্তে OpenAlex আরও ভালো মানের মেটাডেটা প্রদান করে, OpenCitations Meta-এ সম্পূর্ণ প্রোভেনেন্স ডেটা খোলামেলাভাবে উপলব্ধ রয়েছে, এবং আরও জটিল অনুসন্ধান সক্ষম করে, সেমান্টিক ওয়েব প্রযুক্তির দ্বারা প্রদত্ত সম্ভাবনার জন্য ধন্যবাদ। উদাহরণস্বরূপ, "সকল লেখকের জন্য অনুসন্ধান করুন যারা সিলভিও পেরোনি বা ফ্যাবিও ভিটালির সাথে 2009 সালের পরে স্প্রিংগার দ্বারা প্রকাশিত সম্মেলনের কার্যপ্রণালীতে সহ-লেখক ছিলেন"। উপরন্তু, OpenAlex শুধুমাত্র আংশিকভাবে বিনামূল্যে, যেহেতু API-এর মাধ্যমে প্রতিদিন এক লক্ষের বেশি অনুরোধ করতে এবং API-এর মাধ্যমে প্রতি ঘণ্টায় আপডেট হওয়া ডেটা অ্যাক্সেস করতে একটি ফি দিতে হবে (ডাম্পের মাধ্যমে প্রতি মাসের পরিবর্তে)[9]। বিপরীতে, ব্যবহারকারীরা বিনামূল্যের OpenCitations Meta-এর সর্বশেষ সংস্করণে সীমাহীন অনুরোধ করতে পারে।


এছাড়াও, যদিও OpenAIRE রিসার্চ গ্রাফে বর্তমানে আরও মেটাডেটা রয়েছে, এই ধরনের ডেটা CC-BY অ্যাট্রিবিউশন লাইসেন্সের অধীনে প্রকাশ করা হয়, যখন OpenCitations Meta দ্বারা প্রকাশিত ডেটা CC0 পাবলিক ডোমেন ওয়েভারের অধীনে, বাণিজ্যিক পুনঃব্যবহার সহ পুনঃব্যবহারের সম্পূর্ণ স্বাধীনতার অনুমতি দেয় এবং অ্যাট্রিবিউশনের জন্য কোনো প্রয়োজন ছাড়াই মেশিন প্রক্রিয়াকরণের জন্য।


এই কাগজটি CC 4.0 DEED লাইসেন্সের অধীনে arxiv-এ উপলব্ধ