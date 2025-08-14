Napomena: Arhitektura je u aktivnoj evoluciji: događaji kroz Kafku, bajti preko Media Gateway u MinIO, analitika u ClickHouse, i tanko čitanje API za GUI. Ingest piše WARCs; sažeti su sidecar objekti ključeni točnim tekst hash. Ovaj post prati velike ideje; fine-grained teme (topics/schemas, scoring features, RBAC, DLQ) će sletjeti kako se stabiliziraju. Izveštaji TechDeck Mnogo puta u životu moramo nešto učiniti ne zato što je lako, već zato što je teško. Ja sam u jednom od tih prostora. Moj san: izgraditi program za preuzimanje i koreliranje tehnoloških vijesti. Zainteresovani za sledeći gen povećane stvarnosti? BillsTechDeck može vam pomoći da pronađete informacije o tome! Svet je široko otvoren za vrste gadgeta i tehnoloških najava koje možete dobiti iz koreliranog izvora za procjenu tehnoloških trendova i možda dobiti cjelokupnu sliku koja vas može izbjeći snažnim googlingom. To je problem koji sam naišao dok sam gledao informacije o Vision Pro od Apple-a ili kada sam čekao nove vesti o Switch 2. Počnimo s pregledom sistema tako što ćemo prikazati dijagram protoka (grubo). Neka razmatranja: sve strele koje ukazuju na poruku teče u različite redove. Također, razmotrite svaki podsustav da bude u Docker kontejnerima i orkestriran od strane K8 i u CI / CD cevovodu (nisam ga uključio u grafikon jer bi bio previše zauzet). U osnovi želim vijesti, trendove, izvore, analize, sažetke na jednom mestu kako bih izgradio koherentnu količinu podataka koje mogu razumeti zeitgeist tehnoloških vijesti, gadgets i trendova. Pokušaj nečega koherentnog: Sada, ja sam samo hobi. tako da ne tvrdim da znam ništa. Ja uživam što je prava radost. Hajde da uzmemo visoki pregled uronite u ovaj sistem. Ja sam ovo preoblikovao Mnogo sooooo Hajde da prekinemo korake (puštanje napolje Povezani koraci): Kafka \n \n \n \n \n \n \n \n \n \n \n \n \n \n Harvester prima ulaz iz IngressOrca koji se zasniva na informacijama iz FeedbackService. On koristi MinIO kao način da se komadi WARCs i takođe biti u mogućnosti da rukuje bogatih medija na distribuiran način. Mediji se pohranjuje u MinIO klaster (Media Cluster) koji radi na sha256 i sha1 ključeve (u slučaju WARCs, ali oni će imati sha256 haš ključeve takođe za sistem kongruencije) Sanitizer dobija poslove u redovima iz Harvester i izvlači medije iz medija vrata za sanitizaciju. Ako je prljavo još uvek ga držimo da obavlja forenziku u kontrolisanom okruženju OCR se pokreće na bogatim medijima na osnovu poslova iz Kafke spaCy (NER) radi na svemu. spaCy podnosi vezani posao na spaCy sanity checker, a ako je u redu, šalje se službi za ocenjivanje da odluči da li je automatski phi4 sažetak opravdan, ako nije opravdan, samo se šalje korelacijskom motoru. Phi4 se pokreće na određenim komadima podataka ili koje je potvrdila usluga ocjenjivanja ili korisnik koji je pokrenuo. Korelacioni motor radi na svemu will have robust auditing and submits to log queues to be handled by the and in the Every subsystem Logopedija LogSilo / Elastično pretraživanje Podsistemi / trgovac koji trebaju pristup medijima će komunicirati sa MinIO klasterom putem mirnog poziva putem MediaGateway. Različiti rukovatelji razgovaraju sa GUIHandlerom koji prikazuje na GUI. GUIHandler može podnijeti ControlEvents (zatražiti phi4 sažetak, prilagođavanje stvari) FeedbackService razgovara sa HistoricalHandler da povuče iz HistoricalSilo da trenira model koji će dati bolje informacije za IngressOrca (Orchestrator) kako bi bolje odabrali kada, gde i kako možemo povući bolje informacije kako bismo smanjili rasipane resurse na bunk podataka Svi podaci se pohranjuju u MinIO klasteru (MediaCluster) i pristupaju putem mirnih poziva Pozivi na GUIHandler se čine mirnim pozivima Svi podsustavi su kontejnerizovani i orkestrirani od strane Kubernetes Haradinaj Ulazak Feedback usluge Sanitarni Haradinaj Okr Uslovi korišćenja (ner) Ludačka trgovina Fejsbuk 4 Korelacioni motor Logopedija LogSilo / Elastično pretraživanje MedijiUredi Medijski klasteri MedijiUredi Preduzetnik Preduzetnik Kontrola Feedback usluge Povijesni trgovci povijesno Ulazak Medijski kluster Preduzetnik I'm sure I left out some detail, but that's the gist.\n Za ovu žetvu: Prikupljanje podataka Prikupljanje podataka Kako prikupljamo naše vijesti o slick Pixel Fold 3? Moramo ga povući iz mreže! Različiti izvori zahtijevaju različite metode prikupljanja podataka. Veliki problemi u kojima se nalazimo su Svi sajtovi imaju i specifične strukture (kako su složene). Srećom, imamo neverovatan ekosistem iza prikupljanja podataka. otkrivanje botova, DDoS filtriranje, captchas, malformirane informacije Python je jedan od jezik za upotrebu u tu svrhu i ima živahnu zajednicu koja pažljivo radi kako bi pomogla hobije kao što sam ja uhvatiti ključne informacije na Steam Deck 2 tehničke specifikacije i druge šale o tome (kako nevjerojatno). Neverovatno \n \n \n \n Recon \n \n \n \n \n \n \n \n \n \n What is the site structure? What is the site's flow? What tricks are companies like Akamai pulling to impede my ability to get my precious tech snippets? What values change and where? When does my cookie become invalid depending on an abnormal flow? Does the javascript try to fool me? Is it dynamic, obfuscated or check for tampering? Are my user agents okay and when do I rotate them? How do I handle headers? How do I handle TLS Fingerprinting? This list is getting long so I'll just add "heuristics" Ovo je vrlo uključen proces i zahtijeva dobru količinu pažnje. Dakle, ciljevi za dobijanje mojih tehnoloških vijesti moraju biti kurirani općenito i obuhvaćeni. i prikupljanje vrijednih informacija o lokacijama i njihovoj heuristici je važno. Pad MiTM Proxy uređaji \n \n \n \n CAPTCHAs \n \n \n \n *: image recognition tasks* Tradition CAPTCHAs *: Machine learning looking at user behavior to determine bot behavior* ReCAPTCHA *: pesky things that run in the background by grumpy site admins looking to stop me* Invisible CAPTCHAs Tradicionalni CAPTCHA Preuzimanje Invisible CAPTCHAs Iako je lista manja, ovo su definitivno ogromne prepreke i ni na koji način i iscrpna lista. sva rješenja za ove probleme zahtijevaju složena rešenja. Mogao bih nastaviti, ali verujem da dodam stvari kao što su korištenje uglednih stambenih proksija, mobilnih proksija, ograničavanje stope, prepoznavanje i ublažavanje otisaka prstiju uređaja i konačno medenih lonaca. Dakle, moramo imati različite nivoe pristupa: Graduate Response Crawling strategija "Testirajte s peletnim pištoljem, eskalacija na Ordinance ako je fubar'd." "Testirajte s peletnim pištoljem, eskalacija na Ordinance ako je fubar'd." \n \n \n \n : \n \n Level 1 Pellet Gun aiohttp scrapy \n \n Use for static pages, public APIs, or weakly protected endpoints. Low noise, low cost. : \n \n Level 2 Scoped Rifle Playwright + stealth plugins \n \n Use for JS-rendered sites, light bot defenses, simple captchas. Mimics real users, simulates browser behavior. \n \n Level 3: Ordinance Crawl4AI / Nodriver , heavyCAPTCHA solving , Mobile proxies \n \n Use when you hit: invisible captchas, anti-bot JavaScript puzzles, DOM obfuscation, or flow control defenses. Heavy but necessary for hard targets. Pištolj za pelete Streljivo puška Porudžbina Zašto je važno \n \n \n \n Učinkovitost: Nemojte spaljivati Playwright cikluse kada curl radi. Stealth: Izbjegavajte nepotrebno podizanje alarma. Dugovječnost: Trčanje mesecima bez zabrane, a ne nedeljama. Iako sada uvodimo složenost koja je u redu. Na početku ćemo imati vrlo jednostavna pravila. postaje robusniji možemo napraviti bolje pozive na bolja mjesta jer bismo i patterni da nas vode. povijesno Povijesni podaci povijesno Ovaj deo sistema je, čini se, i bit će onaj koji zahtijeva stalno ažuriranje zbog igre mačke i miša između web stranica koje me drže od moje slatke, slatke Samsung vijesti. Najvažniji Ja sam došao sa planom da budem u stanju da unese, unese, unese i biti u stanju da provjeri pre nego što stvarno moram brinuti o povlačenju podataka u realnom vremenu. Trenutni plan je da povuče podatke iz archive.org (u potpunosti i pristojno, naravno). Biti async i ne blokirati. Internet Arhiva Python obojica Ako sam upravo počeo da izvlačim puno pravovremenih podataka, ne bih imao dobru garanciju da moje korelacije ništa ne znače. Ovaj pristup mi omogućuje da unese i usredotočiti se na ostatak sistema bez potrebe za izgradnjom crawler koji će zahtijevati mnogo promjena. Podaci ne bi trebali biti pouzdani: Umjetnost ljudi koji žele otrovati vaš sistem Umjetnost ljudi koji žele otrovati vaš sistem Koji je problem uzimanje podataka s interneta? Well, anyone who has been on the internet for any length of time knows about the dirty trolls. Actors who are out to hose you and your noble goal of getting the new smart phone information. Because the fact that people want to pwn you, you have to assume the worst. Let's highlight some concerns (not an exhaustive list, just a taste) \n \n \n \n Malice in action \n \n \n \n \n \n \n Javascript Payloads (XSS, Embedded goodness, etc) \n \n \n \n Worry about data exfiltration Browser Exploits Redirection and Phishing \n \n PDF Macros and Embedded Object \n \n \n \n Can do spooky things like "remote code execution" Info disclosures Initiate connections to scary C2's \n \n Handling various filetypes \n \n \n \n \n Office Document macros EXE/DLL (less of a concern since they'd be filtered Malicous archive files that contain executables and path traversals Image/Media file: hiding stegonagraphy or utilizing dirty dirty codecs \n \n Data Integrity \n \n \n \n Tampered data Spoofed sources People looking to poison my system with generally bad data Neke stvari koje sam ostavio na ovoj listi (kao što su serveri koji pokušavaju DDoS moj žetvač tako što će služiti tona nepotrebnih podataka da povrede moja osećanja). We first off want to isolate and contain all data we haven't vetted. A separate black box that either resides on a different network system or is dok occurs, it has to be weighed with the caveats that come with air-gapping (which I won't bore anyone with). vazduhoplovstvo VLAN hopping Jedan nivo je u toku rules on a file. Which is fine, and a great starting point. We have tools for macro analysis. We have alat za analizu. možemo provjeriti datoteke su ono što su (osiguravajući se da prljavi troli ne skrivaju exe). . We check hashes against threat feeds. povreda PDF izveštaji static code analysis We also have U drugoj krajnosti, to je until we get past the Internet Archive phase. It comes with caveats. It provides dynamic analysis, behavioral reporting, threat detection... U pitanju je Some dirty files can detect sandbox environments. Others can escape them. It is resource intensive and has a complex setup. It is too resource intensive and complex for a while. kukuruz won't be implemented Značajno But it can be thwarted! it can be thwarted! Lastly, we have to worry about data poisoning. I don't have a clear path on how to handle this. There is a breadth of research papers I am going to go through to better understand the problem and approaches. Niko nije rekao Pišem ovo nije definitivno pisanje onoga što radim.Više tako naglašavajući amount of ways bad hombres can me and my system. Sigurnost je jednostavna staggering Kompromis I have yet to see a lock that can't be picked. I can only make it as complicated as I can. With that in mind, I am designing this part with . Performance, memory safety and I just like it a lot. This will be a job. Media will be fetched and posted to the Za interakciju sa (Uključujući i Minio Cluster) odmor Tokiju MedijiUredi MediaCluster MedijiUredi MediaCluster In conclusion: In conclusion: In conclusion: For the majority of time, are za . The further I can put the sweet, sweet apples up the tree and što je bolje. bad actors looking low hanging fruit minimize my attack surface Ako su podaci skanky mi karantene tako da možemo da ga analiziramo.Dokumentiraju ga i pohranjuju analize koje se okreću oko njega u . povijesno povijesno Phi4-medium: sažetak za zauzete ljude poput mene summarizing for busy people like me dolaze sa puno izazova. Resource mudri, sadržaj mudri. Međutim, oni također imaju sposobnost da nam daju čvrste sažetke potencijalno dugih komada informacija. (Potrebno je nešto snažnije) LLM rešenja PH4 srednji Zašto bih izabrao ovo? \n \n \n \n \n \n \n \n Goldilocks size and performance \n \n \n Medium is bigger than mini. Medium has 14 billion parameters. Competitive enough with larger models but more efficient Optimized for my use cases Pogodno za lokalne implementacije Cost effective (since I'm a lowly cabbage farmer) Fleksibilnost u implementaciji I need something local and powerful and it fits the bill. Having it being its own docker image makes it easy. Another positive is my ability to fine tune it (for my greedy need for information on the new iPhone). Upozorenja ! \n \n \n \n \n Hallucination \n \n Tis the cost of doing business. For this I may have to implement and RAG system. My own guys are working against me! *sigh* \n \n English \n \n In the end this is not an overall large deal since I'm not multilingual. Though it adds complexity should I want to expand data sources to places I can't understand I'm pigeonholing myself into consuming English. Moji prijatelji rade protiv mene! English So what does a like me do? Headstrong kupus poljoprivrednik Sanity checks. \n \n \n \n \n \n \n \n \n \n \n Things like volume yields \n \n : Checks if the summary's length is reasonable.\n \n Meaning \n \n Did Phi-4 produce a 150-word summary as requested, or did it return a single sentence or a 10-page novel? .\n \n Cardinality or categorical value checks \n \n : Checks if the entities (people, places, etc.) in the summary are a valid subset of the entities in the original article. Primary defense against hallucination.\n \n Meaning \n \n Does the summary mention 'Germany' when the source text only ever mentioned 'France'? .\n \n Completeness and fill rate checks \n \n Checks for the omission of critical information.\n \n Meaning: \n \n The original article mentioned three key companies, but the summary only includes one. Is the summary missing vital information? \n \n Uniqueness checks \n \n Checks for repetitive or redundant content within the summary.\n \n Meaning: \n \n Did the model get stuck in a loop and repeat the same sentence three times? .\n \n Range checks \n \n \n Checks if numerical data in the summary is factually correct based on the source. Meaning: The source text says profits were '$5 million,' but the summary says '$5 billion.' Is this a catastrophic numerical error? \n \n Presence checks \n \n The most basic check: did the service return anything at all?\n \n Meaning: \n \n Did the Phi-4 service time out or return an empty string instead of a summary? \n \n Data type validation checks. \n \n Checks if the summary adheres to the requested structure.\n \n Meaning: \n \n I asked for a JSON object with a 'title' and 'key_points' array. Is the output valid JSON with those exact keys? \n \n Consistency checks \n \n The deepest check for factual grounding and logical contradiction.\n \n Meaning: \n \n The source text says 'the project was cancelled,' but the summary implies it's ongoing. Does the summary contradict the facts of the original article? Stvari poput volumena prinosa Kardinalnost ili kategorijske provjere vrednosti Potpunost i ispunjenje kontrola stopa Jedinstvena kontrola Range kontrola Provjera prisutnosti Verifikacija tipa podataka. Consistency checks This list can quickly become like Benjamin Buford Blue naming uses for shrimp so I'll top it off there. This will be auto-run based on the scoring service or manually requested by . ja sam Grabbing Entities with spaCy: the uhvatiti pertinent things grabbing pertinent things We are at the section. Spavaće Koji model odabrati? offers a variety of pretrained models all with their own uses. They are trained on so out of the box Vjerojatno ću morati fino tonirati naviku and add . At the start I will need to annotate data to train my model (there are open source tools to somewhat automate this process). This will also encompass training it to . spaCy Opšti web sadržaj neće prepoznati tehnološki jargon NER model custom components recognize entity types I will need to be ( and ) i to go in and do and (tj. „Apple“ kompanija i „apple“ plod). S tim dolazi mogućnost izgradnje prilagođenog entiteta povezivanja komponente ili vanjske integracije alata (nadam se da ne). fluent in rule-based matching matcher EntityRuler will need Entitet povezivanje disambiguation Budući da sam samo zabrinut za engleski u ovom trenutku, ja sam blagoslovljen da ne znam za detekciju jezika. U prošlosti da ću morati razmotriti performanse stvari kao što su and . When not in use turn it off! batch processing component disabling uzimajući u obzir moguće running with I'll have to consider based models and zasnovane modele, a takođe treba uzeti u obzir značajnu upotrebu RAM-a. Paralelni procesi phi4 CPU uređaji GPU There's Morat ću planirati za izvan domene tekst koji ću neizbježno trčati u i ključno je da znam kako da se nosim. pre-obrada, post-obrada i eventualno integracija vanjske logike i modela I na kraju, i gotovo najvažnije: Sanity checks. \n \n \n \n \n \n \n \n \n Schema validation Proveravanje ispravnih tipova podataka Paying close attention to the behavior around critical fields Definicija očekivanih tipova podataka Establishing acceptable ranges with things like dates and word counts Definicija dozvoljenih vrednosti Definiše pragove potpunosti Consideration of cross field consistency rules A lot of the above mentioned sanity check stuff applies here, but in a more granular sense dealing with entities. The list goes on, and again, it becomes listing uses for shrimp to Forrest Gump. Osećam se dobro u pogledu potpunosti ovog odeljka. Data correlation: making sense of things making sense of things U ovom sistemu postoji important. I need a language that can provide me some memory guarantees as well as stop me from making newbie mistakes. I drifted towards u početku. pomislio sam kroz i vratio se na . I'm simply not an experienced programera i verovatno će implementirati stvari koje bi narušile moj sistem. Data correlation incredibly Uslovi za C++ Rust Uslovi za C++ Basically, takes entities from i povezuje točke. to će koristiti dva Potrebna mi je stvarna granularnost i funkcionalnost za statistiku u korelaciji.RocksDB je uključen u raniji nacrt, koji nije bio dovoljno robustan s nedavnim razvojem. Rust Spavaće ClickHouse pisanje / čitanje / trgovina Relevantno things So stats will be important (yay!). An način kodiranja je ključan i morat ću biti veoma oprezan sa onim što radim, zašto to radim i kako implementiram stvari. za ovaj deo jer ću imati mnogo I/O procesa koji govore o . idomatski Tokio Klizanje Mi uglavnom uzimamo sve entitete i on them an compare it . Analiza bogatstva Povijesni podaci Smatram sledeće stvari: \n \n \n \n \n Is this relationship statistically significant? Is this correlation more than just "chance"? Is this significance worth creating a graph relationship with? Postoji li faktualna potpora za naglašavanje ovog specifičnog odnosa? So I'd need to do things like establish a for connections. It'd also be a good idea to establish , a measure that scores how much more likely two entities are to appear together than by random chance. Where high and negative scores tell me great things about a correlation. P-vrednost Pointwise Mutual information Using stats is essential for filtering out noise. For instance, the entities and će se pojaviti zajedno hiljadama puta, ali ova veza je i Statistika nam pomaže dokazati da je rijetka veza, kao što je određena tehnološka kompanija i vladina agencija, mnogo značajnija čak i ako se pojavljuje samo nekoliko puta. Njegova because it's a . „Apple“ „iPhone“ očigledno not Bela kuća not significant Bijela zgrada Past getting into some concepts I feel out of the scope of this overview, I'll leave it at that. Data: Spoljašnji leđa Spoljašnji leđa Dakle, šta da radim sa svim ovim podacima o vrućim novim tehnološkim predmetima? Ja ga držim. I will have multiple databases (PostgreSQL, ClickHouse, Neo4j, MinIO) Sve operacije podataka će se hraniti kroz . One will handle operations, one koji će se koristiti za skladištenje artefaktnih podataka , two will be ( i To je mnogo, ali svaki DB ima svoju snagu i verujem da je jednostavan. To bi imalo značajne nedostatke. Podatke o rukovodiocima Neo4J Postgreske (basically a metadata registry) Klizanje povijesno CorrelationSilo SQL Server za sve povijesno CorrelationSilo struktura podataka, tables and primary keying will be tantamount in Kompleksni Među ostalim stvarima). će biti znatno lakše, iako će definitivno zahtijevati puno pažnje. To će biti izvor puno kontemplacije, suza i frustracije. Dobar dizajn će se isplatiti u štapićima. Ja sam približavanje ovo kasnije jer mislim da ću imati mnogo bolju ideju o tome što mi je potrebno dalje u sustavu dobijem. good Klizanje stored procedures Umetnost Umetnost je još jedna zver. osećam dokle god moja U njemu bi trebalo da bude bezbolno (poznate posljednje reči). Moje osjećaje su da u suštini želim pokušati i učiniti to što je glupo moguće. Ako sam počeo dodavati slojeve složenosti i korelacijske logike, podaci postaju više vezani i oduzimaju se od vrijednosti mog korelacijskog motora Uslovi korišćenja Korelator nije telefoniranje Relativno “Zašto?” Naši biće a DB ima puno granularnih podataka iz stvari kao što su: povijesno Klizanje povijesno \n \n \n \n \n \n Gde smo dobili dobre podatke Koje upite za pretragu donose najbolje podatke What harvesting methods worked the best for which data source Gde / kada i zašto smo dobili prljave podatke Analiza o tim prljavim podacima Najverovatnije ima mnogo više, i naći ću ih kada dođem do te točke. Naši Cluster će biti mnogo manje bolno da se sprovede od drugih. još uvek moram da se pobrinem da je sve je pojas i suspenzije. Minijak Baze podataka će biti intenzivno iskustvo. Biće tona više. GUI: Webapp vrijeme! Naši biće a U početku sam htio napraviti ovu desktop aplikaciju. shvatio sam, međutim, da na kraju želim da ga više ljudi koristi. To ne bi bio dobar izbor. Vama webapp Psiholozi6 Koristeći a Imam pristup tako širokoj raznolikosti biblioteka. Imam nevjerojatan pristup informacijama koje možda neće biti dostupne ako koristim GUI. , moji ciljevi su bili mnogo drugačiji. Iskreno, jednostavno nisam želio napisati gui u Pythonu. Nemam dobar razlog zašto ne. To je savršeno sposobno. To je samo osobna preferencija. webapk Pyside6 Having that nagging feeling in my gut I searched for other gui option. I found a Za to, pronaći dobre primjere onoga što su ljudi izgradili sa GIS knjižnicama bilo je teško, ako ne i nemoguće. Definitivno sam mogao samo gurnuti napred, ali nisam želeo da koristim nešto onda staviti na posao i doći do shvatanja da moja vizija nije moguća s određenim GIS. LOT Tako sam otišao s Postoji mnogo prednosti za to, ali sada ću morati biti stvarno na vrhu sigurnosti. međutim, neću morati brinuti o toj složenosti dok ne vjerujem da sam spreman da pokažem svoj projekat, i samo možda do tada mogu naći neke cool momke za kodiranje. webapp U osnovi, gužva govori s Koji razgovaraju sa U pitanju je U pitanju je i kontrolisati događaje kao što je sposobnost upravljanja određenim poslovima. će morati biti zaključana i promišljena u načinu na koji stavlja poslove u . Preduzetnik Logopedija Proizvođač Povijesni trgovci Kontrola Kafka GuiHandler Logopedija Proizvođač Povijesni trgovci ControlEvents Morat ćemo biti u mogućnosti da služimo svim vrstama bogatih medija. Osjeća se opreznije raditi samo webapp. Završne reči: Posljednja razmatranja Posljednja razmatranja Nisam pokrivao sve. Jedna stvar koju želim dodati je moj izbor Naši za ovaj projekat u ovom trenutku je zaista overkill. To nije bio moj početni izbor. Međutim, trčao sam u zamku tokom razvoja kada je moj početni izbor postao neodrživ. Tu sam i sletio. This post is now closing in on 4.5k words Kafka Kafka Kafka Dodatni bonus je da izgleda dobro na CV-u. Uvek odlučim da pokušam i budem developer. Ako . Neću Ali, to bi izgledalo lepo. Postoji mnogo posla ispred mene da bih mogao udahnuti život u moju ljubav prema tehnološkim trendovima. Do I Učiniti bilo koji od ovih? potreba No. Samo mislim da je to nevjerojatna zabava. All architecture and flow choices are subject to change. On this blog I will not be providing code (I'll save your eyes). There are tradeoffs everywhere. \n \n \n \n \n \n \n \n Kada ću skakati Kafku? Da li implementiram orkestrator resursa tako da ne sagorim svoj uređaj? Koliko granularno dobijam sa definicijom "vrednih" podataka? What do I do within the sytem to purge useless data? Hoću li trebati kasno noćne sesije spaljivanja dartova? Šta da radim ako sam kompromitiran? Kako nadoknaditi trovanje podacima? Većina Većina Bez obzira na to, imam Vreme i bez šefa da me vozi o neuspjehu. Tajno oružje To će potrajati godinama. I to je u redu. Ovaj projekt može biti spolja lud i ambiciozan za čitatelja. Ja sam dovoljno svjestan da to priznam. Iako želim reći da sam nevjerojatno zainteresovan za sve domene znanja unutar samog sistema. Nije 100 metara sprint. . Dugački maraton Malo po malo Malo po malo Želim napustiti pouku koju sam naučio od Spruce je čovek koji je promenio adresu UPS-ovog sedišta u svoj, stan u Čikagu. To je bilo dopušteno mesecima kada je gospodin Spruce bio u mogućnosti da deponira ~ $ 65k u gotovini na svoj račun koji je bio namijenjen UPS-u. Gospodin Spruce Kako se to uklapa? Jedna lekcija koju sam naučio iz ove priče je Da se potpuno zanemari logičan plafon u onome što je moguće. gospodin Spruce se nije brinuo pitanjima o tome da li bi zaista mogao da promeni adresu najveće svjetske logističke kompanije u svoj stan. . hrabrosti I funkcionisalo je hrabrosti I funkcionisalo je Iako se osjećam kao da definitivno mogu otpustiti Mr. Spruceov nedostatak kontrole impulsa i odsustvo predviđanja, mogu internalizirati hrabrost da pokušam.S potpunim i potpunim zanemarivanjem onoga što konsenzus može smatrati "mogućim" mogu krenuti na putovanje učenja koje nije vezano za tradiciju zaglavljenu u razum koji nedvosmisleno kaže "ne možete". Možda ne mogu.Radije bih propustio veliko nego da ne pokušam.Za to, moram utjeloviti Mr. Spruceov pristup potpuno ne dajući jebeni. Ako ste naišli na ovaj blog, nadam se da ste naučili nešto. Much love, Bil “Čarobnjak” Anderson