Muuqaalka maanta AI ay wado, barashada mashiinka, AI, iyo chatbots-ka ayaa u beddelaya warshadaha xawaare aan hore loo arag.
Ganacsiyo badan ayaa raadinaya inay ku dhex daraan AI howlahooda, laakiin sida nidaamyadan loo dhiso inta badan waa la iska indhatiraa. Walaxda ugu muhiimsan? Xogta Qaabka barashada mashiinka ayaa kaliya u wanaagsan sida xogta lagu tababaray. Laakiin xaggee xogtan oo dhan ka timi?
Qayb muhiim ah oo ka mid ah xogta aan ku tiirsannahay ayaa si guud loo heli karaa, inta badan waxaa laga helaa qoraallada warbaahinta bulshada, faallooyinka isticmaalaha, iyo waxyaabaha kale ee onlaynka ah. Falanqaynta dareenka , mid ka mid ah ilaha ugu qanisan ee xogta waa Twitter , kaas oo si joogto ah u qulqulaya nuxurka isticmaalaha-waqtiga dhabta ah. Caqabadda, si kastaba ha ahaatee, waxay ku jirtaa sida loo ururiyo xogtan si hufan oo nadiif ah.
Markii aan bilaabay in aan ka shaqeeyo mashruuca falanqaynta dareenka aniga oo isticmaalaya xogta Twitter-ka, waxaan markii hore ku fikiray isticmaalka Twitter API. Si kastaba ha ahaatee, waxaan si dhakhso ah ula kulmay xaddidaad muhiim ah: API-ga-free-free kaliya wuxuu bixiyaa gelitaanka tweet-ka todobadii maalmood ee hore. Falanqaynta dareenka dhamaystiran, gaar ahaan mawduucyada isbeddelaya ama dhacdooyinka siyaasadeed ee soconaya toddobaadyo ama bilo, xaddidani waxay si aad ah u xaddidaysaa baaxadda iyo tayada xogta la heli karo.
Iyadoo kor loogu qaadayo heerka sare ee API ay ahayd ikhtiyaar, qiimuhu wuxuu ahaa mamnuuc mashruuc yar oo sida kayga oo kale ah. Tani waxay iga tagtay laba waddo: isku dayga in aan xogta gacanta ku ururiyo iyada oo loo marayo xoqid dhaqameed (kaas oo la yimid caqabado u gaar ah sida CAPTCHA-yada, dib-u-celinta, iyo diiwaannada aan dhamaystirnayn) ama la helo xal kale.
Taasi waa halka ay Xogta Iftiinku ka soo gasho, arrimahan si aan kala go 'lahayn loo xalliyo iyadoo la bixinayo xogta Twitter-ka oo nadiif ah, la cabbiri karo, iyo taariikhi ah. Halkii aan ku koobnaan lahaa xaddidaadaha API, waxaan heli karaa noocyo kala duwan, xog tayo sare leh oo loogu talagalay mashruucayga iyada oo aan lahayn dhibaatooyinka caadiga ah.
Maqaalkan, waxaan ku dhex socon doonaa sida aad uga faa'iidaysan karto Suuqa Xogta Iftiiminka ah si aad u hesho xog tayo sare leh oo Twitter ah oo loogu talagalay falanqaynta dareenka oo aan la wadaago khibradayda.
Madaxa shabakada xogta Bright oo samee akoon bilaash ah si aad u bilowdo. Marka la soo galo, waxaa lagu hagaajin doonaa Suuqa Xogta, halkaas oo laga heli karo xog-ururin horay loo dhisay, oo ay ku jiraan kuwa la xiriira Twitter-ka.
Markaad doorato xogtaada, waxaad si toos ah ugu soo dejisan kartaa mashiinka deegaankaaga ama waxaad ka geli kartaa API. Habka degdega ah wuxuu kuu ogolaanayaa inaad bilowdo inaad la shaqeyso xog tayo sare leh isla markiiba. Waxaan isticmaalay xogta-boogaha Twitter-ka
Xogta Twitter-ka cayriin waxay caadi ahaan ka kooban tahay xog badan oo badan oo laga yaabo inaysan ku habboonayn falanqaynta dareenka, sida macluumaadka isticmaalaha, URL-yada sawirka, iyo xog kale oo aan qoraal ahayn. Waxaan diiradda saari doonaa qoraalka tweets-ka, maadaama halkaas ay tahay halka falanqaynta dareenka lagu dabaqi doono, oo ay la socoto cabbiraadaha ka-qaybgalka ee la xiriira sida dib-u-dhigista iyo kuwa jecel.
import pandas as pd df = pd.read_csv("path_to_your_dataset.csv") df.head()
Talaabada xigta waa in la nadiifiyo xogta adoo la tacaalaya qiyamka maqan oo meesha laga saarayo tiirarka aan khusayn.
df_clean = df[['user_posted', 'description', 'date_posted', 'reposts', 'likes']] df_clean = df_clean.dropna(subset=['description']) df_clean = df_clean.drop_duplicates(subset=['description']) df_clean.head()
Hadda oo aan nadiifinay xogta oo aan hayno qoraalka ku habboon, waa waqtigii aan u dhexgeli lahayn falanqaynta dareenka . Falanqaynta dareenka macnaheedu waa go'aaminta codka shucuurta ee ka dambeeya erayada - ha ahaato tweet-ku mid togan, taban, ama dhexdhexaad ah.
Waxaan isticmaalay maktabad caan ah oo la yiraahdo VADER (Valence Aware Dictionary and Sentiment Reasoner), si gaar ah loogu talagalay qoraalka warbaahinta bulshada. Way ku fiican tahay la tacaalida luqadda aan rasmiga ahayn sida slang iyo emojis.
Qoddobka koodka hoose wuxuu sameeyaa falanqaynta dareenka isagoo isticmaalaya VADER
from vaderSentiment.vaderSentiment import SentimentIntensityAnalyzer analyzer = SentimentIntensityAnalyzer() def get_sentiment(text): sentiment = analyzer.polarity_scores(text) return sentiment['compound'] df_clean['sentiment'] = df_clean['description'].apply(get_sentiment) df_clean.head()
Marka dhibcaha dareenka la xisaabiyo, waxaan u falanqeyn karnaa qaybinta si aan u aragno sida togan ama taban ee tweets ay u yihiin celcelis ahaan. Tani waxay ku siin kartaa fikrado ku saabsan niyadda guud ee dadweynaha ee ku saabsan mawduuc gaar ah ama dhacdo. Waxaan sidoo kale sawiri karnaa qaybinta dareenka anagoo adeegsanayna histogram ama wordcloud si loo aqoonsado dareenka muhiimka ah.
Sheekadani waxay ku siin doontaa dareen wanaagsan oo ku saabsan faafinta dareenka, haddii ay u janjeerto dhanka togan, taban, ama dhexdhexaad. Xaaladdan oo kale, Waxaa jira tweets dhexdhexaad ah oo soo noqnoqda.
Hadda oo aan haysano buundooyinka dareenka tweet-ka kasta, tillaabada xigta waa in la sahamiyo haddii uu jiro wax xiriir ah oo u dhexeeya dareenka iyo cabbiraadaha ka-qaybgalka sida kuwa jecel iyo dib u soo dhejinta. Falanqaynta warbaahinta bulshada, mid ayaa laga yaabaa inuu filan karo in dareenka togan uu u horseedi karo ka-qaybgal sare (jeceyl badan, dib-u-dhigid badan). Si kastaba ha ahaatee, taasi run ma tahay?
Si aan u ogaano, waxaan xisaabin karnaa isku xirka dhibcaha dareenka iyo cabirka ka qaybgalka, natiijadu waa:
Correlation between sentiment and likes: 0.022806738610786123
Correlation between sentiment and reposts: 0.008885789875330416
Marka la eego qiyamka isku xidhka daciifka ah ee falanqayntayda xogta, waxaanu aragnaa in aanu jirin xidhiidh adag oo ka dhexeeya dareenka iyo ka qaybgalka. Xidhiidhka u dhexeeya dareenka iyo jecelu wuxuu ahaa 0.02, iyo dareenka iyo dib u soo celinta, waxay ahayd kaliya 0.008. Qiimayaashani waxay soo jeedinayaan in cabbiraadaha ka-qaybgalka sida kuwa jecel iyo dib-u-dejinta aysan si weyn u saameynayn dareenka tweets .
Xidhiidhka daciifka ah ee ka dhexeeya dareenka iyo ka qaybgalka ayaa muujinaya inay jiraan arrimo kale oo ciyaarta ah. Iyadoo falanqaynta dareenka ay naga caawiso fahamka ra'yiga dadweynaha, ka-qaybgalku waxay u badan tahay inay horseedaan arrimo dheeraad ah, sida:
Iyadoo falanqaynta dareenka ay tahay qalab qiimo leh oo lagu fahmo sida ay dadku u dareemaan mawduuc, had iyo jeer maaha saadaal la isku halayn karo oo ku lug leh. Si loo helo fikrado qoto dheer oo ku saabsan hab-dhaqanka isticmaalaha, waa lagama maarmaan in la tixgeliyo arrimo kale sida wakhtiga nuxurka, ku habboonaanta, iyo saamaynta isticmaalaha.