paint-brush
हगिंगफेस पर टेक कंपनी समाचार डेटा डंप: 3 हजार सबसे मूल्यवान टेक कंपनियों के बारे में 7M सर्वाधिक उद्धृत पोस्टद्वारा@David

हगिंगफेस पर टेक कंपनी समाचार डेटा डंप: 3 हजार सबसे मूल्यवान टेक कंपनियों के बारे में 7M सर्वाधिक उद्धृत पोस्ट

द्वारा David Smooke2m2024/02/08
Read on Terminal Reader

बहुत लंबा; पढ़ने के लिए

HackerNoon ने इंटरनेट की सबसे उद्धृत 7M+ तकनीकी कंपनी समाचार लेखों और 3k+ सबसे मूल्यवान तकनीकी कंपनियों के बारे में ब्लॉग पोस्ट को क्यूरेट और ओपन सोर्स किया।
featured image - हगिंगफेस पर टेक कंपनी समाचार डेटा डंप: 3 हजार सबसे मूल्यवान टेक कंपनियों के बारे में 7M सर्वाधिक उद्धृत पोस्ट
David Smooke HackerNoon profile picture
0-item
1-item


हैकरनून 2022 और 2023 में 3k+ सबसे मूल्यवान तकनीकी कंपनियों के बारे में इंटरनेट के सबसे उद्धृत 7M+ तकनीकी कंपनी समाचार लेखों और ब्लॉग पोस्टों को क्यूरेट किया गया। इन कहानियों को सशक्त बनाने के लिए क्यूरेट किया गया था HackerNoon.com/Companies , जहां हम शीर्ष प्रौद्योगिकी कंपनियों जैसे पर दैनिक समाचार अपडेट करते हैं माइक्रोसॉफ्ट , गूगल , और आलिंगन चेहरा . यह डेटासेट एमआईटी लाइसेंस के तहत हगिंगफेस पर टेक कंपनी न्यूज़ डेटा डंप के रूप में खुला है। कृपया अपने प्रोजेक्ट के लिए इस टेक कंपनी समाचार डेटा का स्वतंत्र रूप से उपयोग करें :-)


https://huggingface.co/datasets/HackerNoon/tech-company-news-data-dump


टेक कंपनियों का प्रबंधन कैसे किया गया?

हमारी टीम ने सबसे मूल्यवान प्रौद्योगिकी कंपनियों की एक सूची बनाई, और जैसे ही वे समाचारों और हैकरनून पर ट्रेंड करने लगीं, कंपनियों को जोड़ा गया। पहली डेढ़ हजार मार्केट कैप के आधार पर सार्वजनिक कंपनियां थीं। फिर जैसे ही हैकरनून की कहानियों में कंपनियों का उल्लेख हुआ और उन्होंने वर्ष के हमारे स्टार्टअप वोटिंग में अच्छा प्रदर्शन किया, हमने उनके लिए तकनीकी कंपनी समाचार पेज बनाए। एक बार एक टेक कंपनी समाचार पृष्ठ बन जाने के बाद, हमारा सिस्टम हमारे नियमों और संकेतों के आधार पर उस कंपनी के बारे में ट्रेंडिंग समाचार, लेख और ब्लॉग पोस्ट को क्यूरेट और संग्रहीत करता है जो परिभाषित करता है कि ट्रेंडिंग स्टोरी क्या है।

कहानियाँ, लेख और ब्लॉग पोस्ट कैसे प्राप्त किए गए

बिंग न्यूज़ एपीआई, ब्रेव न्यूज़ एपीआई और हैकरनून एपीआई का उपयोग करके प्रासंगिकता, विशिष्टता और प्रवृत्ति के लिए कस्टम नियमों, संकेतों और शर्तों का एक संयोजन। हमने प्रत्येक कंपनी के लिए उद्योग मिलान की योजना बनाई और अधिक विश्वसनीय उच्च रैंकिंग साइटों को प्राथमिकता दी, साथ ही प्रासंगिक निचली रैंकिंग वाले आला प्रकाशकों को भी अनुमति दी। प्रत्येक कंपनी के लिए, हम उनके मुख्य/कंपनी पेज ( उदाहरण के रूप में माइक्रोसॉफ्ट ) पर सबसे अधिक प्रासंगिक 10-20 कहानियां दिखाते हैं, और फिर कंपनी के समाचार, कहानियां, उल्लेख, लेख और कंपनी के इंटरनेट इतिहास में उल्लेखनीय लिंक की पूरी सूची पेश करते हैं। -नाम/समाचार ( उदाहरण के तौर पर गूगल )।

यह टेक कंपनी समाचार डेटा कैसे व्यवस्थित किया जाता है

कॉलम कंपनी का नाम, कंपनी यूआरएल, प्रकाशितएटी, (कहानी) यूआरएल, शीर्षक, विशेष रुप से प्रदर्शित छवि और (मेटा) विवरण हैं। यह इस प्रकार है कि हम अपने डेटाबेस में डेटा को कैसे व्यवस्थित करते हैं। प्रत्येक लेख कम से कम एक कंपनी से जुड़ा है। कुछ कंपनियों के पास उनकी आवाज की हिस्सेदारी के आधार पर दूसरों की तुलना में अधिक लेख हैं, उदाहरण के लिए डेटासेट व्यूअर का उपयोग करके आप देख सकते हैं कि Google के पास 99,152 परिणाम हैं , 3M के पास 20,608 परिणाम हैं , Adobe के पास 13,449 परिणाम हैं , और NVIDIA के पास 19,811 परिणाम हैं


डेटा डाउनलोड किए बिना भी, आप डेटासेट व्यूअर में कंपनी या प्रकाशन के नाम खोज सकते हैं, जैसे नीचे चित्रित NVIDIA :



यह डेटासेट एमआईटी लाइसेंस के तहत हगिंगफेस पर टेक कंपनी न्यूज़ डेटा डंप के रूप में खुला है। कृपया अपने प्रोजेक्ट के लिए इस तकनीकी कंपनी के समाचार डेटा का स्वतंत्र रूप से उपयोग करें :-) आप ऑनलाइन किसी कंपनी की आवाज की कुल हिस्सेदारी को माप सकते हैं, आप किसी कंपनी के डिजिटल समाचार कवरेज के भावना विश्लेषण को माप सकते हैं, आप अपने मॉडल को यह अनुमान लगाने के लिए प्रशिक्षित कर सकते हैं कि कौन सी हेडलाइन किस बारे में प्रकाशित करेगी भविष्य में कंपनियां, या बड़ी तकनीकी कंपनियों और मीडिया कवरेज के बारे में जो भी अन्य शोध आपकी दिली इच्छा है।

इस खुले डेटा को यहां देखें: