paint-brush
Pse shumë punë në shkencën e të dhënave janë në të vërtetë inxhinieri e të dhënavenga@docligot
1,351 lexime
1,351 lexime

Pse shumë punë në shkencën e të dhënave janë në të vërtetë inxhinieri e të dhënave

nga Dominic Ligot4m2024/11/04
Read on Terminal Reader

Shume gjate; Te lexosh

Shumica e përshkrimeve të punës së shkencës së të dhënave janë në të vërtetë për inxhinierët e të dhënave.
featured image - Pse shumë punë në shkencën e të dhënave janë në të vërtetë inxhinieri e të dhënave
Dominic Ligot HackerNoon profile picture
0-item

Këto ditë, çdo kompani duket e etur për të përmbushur një rol "shkencëtari të të dhënave", duke premtuar mundësi emocionuese për të punuar me algoritmet e mësimit të makinerive, modelet parashikuese dhe kornizat e të mësuarit të thellë. Megjithatë, për shumë profesionistë që hyjnë në këto pozicione, realiteti nuk përputhet plotësisht me joshjen. Në vend që të zhyten me kokë në AI ose të modelojnë grupe komplekse të të dhënave, ata e gjejnë veten deri në gju në nxjerrjen, pastrimin dhe përgatitjen e të dhënave. Mirë se vini në botën e inxhinierisë së të dhënave - një domen për të cilin shumë nuk e kuptuan se ishin regjistruar.


Ky fenomen rrjedh nga një keqkuptim themelor nga kompanitë për atë që ata kanë në të vërtetë nevojë. Ata postojnë lista pune për "shkencëtarët e të dhënave" kur pjesa më e madhe e punës së tyre përfshin pastrimin e të dhënave dhe sigurimin e infrastrukturës për t'i trajtuar ato - kryesisht detyrat e inxhinierisë së të dhënave. Rezultati është se profesionistët e punësuar si shkencëtarë të të dhënave përfundojnë duke bërë punën e rënduar që nuk e prisnin: grindjen e të dhënave të çrregullta, zhvendosjen e tyre midis platformave dhe përgatitjen e tyre për analizë. Zhgënjimi vjen në mënyrë të pashmangshme për ata që prisnin të kalonin ditët e tyre duke ndërtuar modele të mësimit të makinerive, duke mos shkruar pyetje SQL dhe duke vendosur tubacione.


Për inxhinierët aspirantë të të dhënave, kjo është një mundësi e fshehur. Ndërsa tregu i punës është plot me kompani që kërkojnë shkencëtarë të të dhënave, shumë prej këtyre organizatave kanë nevojë për një inxhinier të dhënash shumë më tepër sesa e kuptojnë. Të dy fushat kërkojnë aftësi të mbivendosura, veçanërisht në fazat e hershme - programim, menaxhim të bazës së të dhënave dhe disa njohuri bazë statistikore. Megjithatë, detyrat dhe rrugët e karrierës ndryshojnë shpejt. Shkencëtarët e të dhënave fokusohen në nxjerrjen e njohurive dhe bërjen e parashikimeve, ndërsa inxhinierët e të dhënave sigurojnë që ekosistemi i të dhënave të jetë i fortë dhe i besueshëm. Një profesionist i zgjuar mund të fillojë në një pozicion të shkencës së të dhënave dhe të kalojë në një karrierë të inxhinierisë së të dhënave thjesht duke u ngritur për të trajtuar detyrat që të tjerët konsiderojnë nën to.


Shkencëtarët e të dhënave, veçanërisht ata me prejardhje shumë akademike, shpesh e shohin pastrimin dhe përgatitjen e të dhënave si të lodhshme . Për ta, kjo është ana "e mërzitshme" e punës - puna e rënkuar që pengon detyrat më magjepsëse si ndërtimi i modeleve parashikuese ose aplikimi i algoritmeve të fundit. Megjithatë, pa të dhëna të strukturuara mirë, këto algoritme janë të padobishme. Inxhinierët e të dhënave e dinë mirë këtë dhe përqafojnë sfidën e ndërtimit të kornizave në të cilat mbështeten shkencëtarët e të dhënave. Nga automatizimi i nxjerrjes dhe transformimit të të dhënave deri te ndërtimi i tubacioneve që ofrojnë grupe të dhënash të pastra dhe të mirëorganizuara, këto detyra janë buka dhe gjalpi i inxhinierisë së të dhënave.


Ndërsa disa shkencëtarë të të dhënave luftojnë për të nxjerrë kuptimin nga grupet e të dhënave të çrregullta, inxhinierët e të dhënave janë të zënë me ndërtimin e sistemeve të shkallëzueshme që do të kursejnë kohë dhe zhgënjim në fund. Në vend që të luftojë me skedarët CSV dhe të ankohet për SQL, inxhinieri aspirues i të dhënave i përdor këto mjete në avantazhin e tyre. Ata thjeshtojnë proceset, automatizojnë detyrat e përgatitjes së të dhënave dhe zbatojnë tubacione të fuqishme që lejojnë përditësimet e të dhënave në kohë reale ose të planifikuara. Ata nuk janë vetëm duke lëvizur të dhënat; ata po ndërtojnë shtyllën kurrizore të ekosistemit të të dhënave. Në kohën kur shkencëtarët e të dhënave përfundojnë përgatitjen manuale të grupeve të të dhënave të tyre, inxhinieri i të dhënave ka automatizuar tashmë procesin, duke eliminuar punën e përsëritur dhe duke liruar kohë për detyra më strategjike.


Kjo shkëputje midis titujve të punës dhe funksioneve të punës mund të krijojë fërkime brenda ekipeve, me disa shkencëtarë të të dhënave që ankohen për mungesën e punës "reale" të shkencës së të dhënave në rolet e tyre. Por për inxhinierin e të dhënave, kjo është ajo ku ata lulëzojnë. Ndërsa kolegët e tyre debatojnë se cila kornizë e mësimit të makinerive është superiore, inxhinierët e të dhënave janë të zënë me zbatimin e zgjidhjeve të nivelit të prodhimit, duke shkuar përtej analizave ad-hoc për të krijuar sisteme që japin vlerë në mënyrë të përsëritur. Ata janë heronjtë e pakënduar të botës së të dhënave, duke siguruar në heshtje që të dhënat të rrjedhin pa probleme, njohuritë të gjenerohen në mënyrë efikase dhe organizata të funksionojë pa probleme.


Për më tepër, inxhinierët e të dhënave janë të pozicionuar në mënyrë unike për të kapërcyer hendekun midis shkencëtarëve të të dhënave dhe njësive të tjera të biznesit. Pasi të përfundojë "pjesa e vështirë" e përgatitjes së të dhënave, ata mund të krijojnë aplikacione të aksesueshme dhe miqësore për përdoruesit për palët e interesuara jo-teknike. Këto mund të jenë panele kontrolli, mjete vizualizimi ose platforma të bazuara në ueb që demokratizojnë njohuritë e të dhënave në të gjithë organizatën. Ndërsa shkencëtarët e të dhënave janë ende duke lustruar skriptet e tyre Python, inxhinieri i të dhënave ka ndërtuar tashmë diçka të shkallëzuar, të qëndrueshme dhe të përdorshme.


Në fund të fundit, kjo dinamikë zbulon një të vërtetë më të thellë: shumë kompani nuk kanë nevojë për shkencëtarë të të dhënave aq urgjentisht sa mendojnë . Ajo që ata me të vërtetë kanë nevojë janë inxhinierë të të dhënave që mund të sigurojnë që të dhënat e tyre të jenë të strukturuara, të pastra dhe të aksesueshme. Vështrimet, parashikimet dhe modelet që prodhojnë shkencëtarët e të dhënave janë po aq të mira sa infrastruktura themelore e të dhënave. Pra, ndërsa disa mund të vazhdojnë të argumentojnë se kush kualifikohet si një shkencëtar "i vërtetë" i të dhënave, inxhinierët e të dhënave e dinë se nuk ka të bëjë me titullin - ka të bëjë me kryerjen e punës.


Nëse jeni një inxhinier aspirues i të dhënave, kjo rrugë mund të jetë mundësia juaj e artë. Duke hyrë në këto role të keqklasifikuara të shkencës së të dhënave, ju mund të ndërtoni në heshtje një karrierë rreth zgjidhjes së problemeve që të tjerët nuk duan t'i prekin. Ju mund të automatizoni rrjedhat e punës, të thjeshtoni proceset dhe të siguroheni që infrastruktura e të dhënave të organizatës të jetë solide dhe e shkallëzueshme. Ndërsa kolegët tuaj fokusohen në ndryshimin e modeleve të tyre, ju do të ndërtoni sisteme që sjellin vlerë reale për kompaninë dhe ka të ngjarë të kaloni pa u vënë re – derisa të bëhet e qartë se sa shumë mbështetet organizata në punën që keni bërë.


Në fund të fundit, inxhinierët e të dhënave janë ata që bëjnë të mundur shkencën e të dhënave. Dhe për ata që janë të gatshëm të përqafojnë sfidën, shpërblimet mund të jenë të konsiderueshme - jo vetëm në drejtim të rritjes së karrierës, por duke ditur se jeni ju që e mbani në heshtje makinën e drejtuar nga të dhënat.


Rreth meje: Veteran i IT-së 25+ vjeç që kombinon të dhënat, AI, menaxhimin e rrezikut, strategjinë dhe arsimin. 4x fitues global i hackathon dhe ndikimi social nga avokati i të dhënave. Aktualisht po punohet për të nxitur fuqinë punëtore të AI në Filipine. Mësoni më shumë për mua këtu: https://docligot.com