paint-brush
টেক কোম্পানি নিউজ ডাটা ডাম্প অন হাগিংফেস: 7M সর্বাধিক উদ্ধৃত পোস্টগুলি 3k সর্বাধিক মূল্যবান প্রযুক্তি সংস্থাগুলি সম্পর্কেদ্বারা@David

টেক কোম্পানি নিউজ ডাটা ডাম্প অন হাগিংফেস: 7M সর্বাধিক উদ্ধৃত পোস্টগুলি 3k সর্বাধিক মূল্যবান প্রযুক্তি সংস্থাগুলি সম্পর্কে

দ্বারা David Smooke2m2024/02/08
Read on Terminal Reader

অতিদীর্ঘ; পড়তে

HackerNoon কিউরেটেড এবং ওপেন সোর্স ইন্টারনেটের সবচেয়ে উদ্ধৃত 7M+ প্রযুক্তি কোম্পানির সংবাদ নিবন্ধ এবং 3k+ সবচেয়ে মূল্যবান প্রযুক্তি কোম্পানি সম্পর্কে ব্লগ পোস্ট।
featured image - টেক কোম্পানি নিউজ ডাটা ডাম্প অন হাগিংফেস: 7M সর্বাধিক উদ্ধৃত পোস্টগুলি 3k সর্বাধিক মূল্যবান প্রযুক্তি সংস্থাগুলি সম্পর্কে
David Smooke HackerNoon profile picture
0-item
1-item


হ্যাকারনুন 2022 এবং 2023 সালে ইন্টারনেটের সর্বাধিক উদ্ধৃত 7M+ টেক কোম্পানির সংবাদ নিবন্ধ এবং 3k+ সবচেয়ে মূল্যবান প্রযুক্তি কোম্পানি সম্পর্কে ব্লগ পোস্টগুলিকে কিউরেট করা হয়েছে৷ HackerNoon.com/Companies , যেখানে আমরা শীর্ষস্থানীয় প্রযুক্তি কোম্পানিগুলির দৈনিক খবর আপডেট করি মাইক্রোসফট , গুগল , এবং আলিঙ্গনমুখ . এই ডেটাসেটটি টেক কোম্পানি নিউজ ডাটা ডাম্প হিসাবে HuggingFace-এর MIT লাইসেন্সের অধীনে ওপেন সোর্স করা হয়েছে। আপনার প্রকল্পের জন্য অবাধে এই প্রযুক্তি কোম্পানির খবর ডেটা ব্যবহার করুন :-)


https://huggingface.co/datasets/HackerNoon/tech-company-news-data-dump


প্রযুক্তি সংস্থাগুলি কীভাবে কিউরেট করা হয়েছিল

আমাদের টিম সবচেয়ে মূল্যবান প্রযুক্তি কোম্পানিগুলির একটি তালিকা তৈরি করেছে এবং কোম্পানিগুলিকে যুক্ত করেছে যখন তারা খবরে এবং HackerNoon-এ প্রবণতা শুরু করেছে৷ প্রথম দেড় হাজার ছিল মার্কেট ক্যাপভিত্তিক পাবলিক কোম্পানি। তারপর যেহেতু কোম্পানিগুলি HackerNoon গল্পগুলিতে উল্লেখ করা হয়েছে এবং আমাদের স্টার্টআপ অফ দ্য ইয়ার ভোটিংয়ে ভাল পারফর্ম করেছে, আমরা তাদের জন্য প্রযুক্তি কোম্পানির সংবাদ পৃষ্ঠাগুলি যুক্ত করেছি। একবার একটি টেক কোম্পানির নিউজ পেজ তৈরি হয়ে গেলে, আমাদের সিস্টেম সেই কোম্পানির ট্রেন্ডিং নিউজ, আর্টিকেল এবং ব্লগ পোস্টগুলিকে আমাদের নিয়ম এবং প্রম্পটগুলির উপর ভিত্তি করে কিউরেট করে এবং সঞ্চয় করে যা একটি ট্রেন্ডিং গল্প কী তা সংজ্ঞায়িত করে৷

কিভাবে গল্প, নিবন্ধ এবং ব্লগ পোস্ট উৎস ছিল

Bing News API, Brave News API, এবং HackerNoon API ব্যবহার করে প্রাসঙ্গিকতা, নির্দিষ্টতা এবং প্রবণতার জন্য কাস্টম নিয়ম, প্রম্পট এবং শর্তের সংমিশ্রণ। আমরা প্রতিটি কোম্পানির জন্য ইন্ডাস্ট্রি ম্যাচ ড্রিল ডাউন করেছি, এবং প্রাসঙ্গিক নিম্ন র‌্যাঙ্কিং কুলুঙ্গি প্রকাশকদের জন্য অনুমতি দেওয়ার সাথে সাথে আরও বিশ্বস্ত উচ্চ র‌্যাঙ্কিং সাইটগুলিকে ব্যাপকভাবে সমর্থন করেছি। প্রতিটি কোম্পানির জন্য, আমরা তাদের প্রধান /কোম্পানীর পৃষ্ঠায় ( মাইক্রোসফ্ট একটি উদাহরণ হিসাবে ) সবচেয়ে প্রাসঙ্গিক 10-20টি গল্প দেখাই এবং তারপর কোম্পানির ইন্টারনেট ইতিহাসে কোম্পানির খবর, গল্প, উল্লেখ, নিবন্ধ এবং উল্লেখযোগ্য লিঙ্কগুলির সম্পূর্ণ তালিকা দেখাই। -নাম/সংবাদ ( উদাহরণস্বরূপ গুগল )।

এই প্রযুক্তি সংস্থার খবরের তথ্য কীভাবে সংগঠিত হয়

কলামগুলি হল কোম্পানির নাম, কোম্পানির URL, প্রকাশিতএটি, (গল্প) ইউআরএল, শিরোনাম, বৈশিষ্ট্যযুক্ত চিত্র এবং (মেটা) বিবরণ৷ আমরা আমাদের ডাটাবেসে ডেটা কীভাবে সংগঠিত করি তা অনুসরণ করে। প্রতিটি নিবন্ধ অন্তত একটি কোম্পানির সাথে সংযুক্ত করা হয়. কিছু কোম্পানির তাদের ভয়েস শেয়ারের উপর ভিত্তি করে অন্যদের চেয়ে বেশি নিবন্ধ রয়েছে, উদাহরণস্বরূপ ডেটাসেট ভিউয়ার ব্যবহার করে আপনি দেখতে পাচ্ছেন Google-এর 99,152 ফলাফল রয়েছে , 3M-এর 20,608 ফলাফল রয়েছে , Adobe-এর 13,449 ফলাফল রয়েছে এবং NVIDIA-এর 19,811 ফলাফল রয়েছে


এমনকি ডেটা ডাউনলোড না করেও, আপনি ডেটাসেট ভিউয়ারে কোম্পানি বা প্রকাশনার নাম অনুসন্ধান করতে পারেন, যেমন NVIDIA নীচে চিত্রিত :



এই ডেটাসেটটি টেক কোম্পানি নিউজ ডাটা ডাম্প হিসাবে HuggingFace-এর MIT লাইসেন্সের অধীনে ওপেন সোর্স করা হয়েছে। অনুগ্রহ করে আপনার প্রকল্পের জন্য এই প্রযুক্তি কোম্পানির খবরের ডেটা অবাধে ব্যবহার করুন :-) আপনি অনলাইনে একটি কোম্পানির ভয়েসের সামগ্রিক শেয়ারের পরিমাণ নির্ধারণ করতে পারেন, আপনি একটি কোম্পানির ডিজিটাল সংবাদ কভারেজের অনুভূতি বিশ্লেষণ পরিমাপ করতে পারেন, আপনি আপনার মডেলকে প্রশিক্ষিত করতে পারেন যা সম্পর্কে কী শিরোনাম প্রকাশ করবে তা ভবিষ্যদ্বাণী করতে ভবিষ্যতে কোম্পানি, বা বড় প্রযুক্তি কোম্পানি এবং মিডিয়া কভারেজ সম্পর্কে অন্য যা কিছু গবেষণা আপনার হৃদয়ের ইচ্ছা।

এখানে এই খোলা ডেটা পরীক্ষা করে দেখুন: