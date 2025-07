A Personal Journey Through Childhood Drawing, Imagination, and the Magic of Generative AI

TL;DR: Ano kung ang AI ay maaaring gawin higit sa pag-generate ng imahe - kung ito ay maaaring i-imagine? Sa personal na ito exploration, ginagamit ko ang generative AI model DALL·E upang i-transform raw, anak-anak na mga sketches - kabilang ang isa na inilagay ng isang tunay na anak - sa buhay, detalyadong mga artwork. Sa paglipas, natagpuan ko na ang AI ay hindi lamang imitasyon ng human creativity; ito ay maaaring i-amplify ito.





Mula sa pattern recognition hanggang sa unanti-anticipated "hallucinations" na magiging mas tulad ng imagination, ang paglipas na ito ay nagpapakita kung paano ang generative AI ay maaaring maging ang pinaka-surprising creative partner ng lahat - lalo na para sa mga nag-uugali upang i-draw.

Where does imagination begin - and can a machine ever truly share in it?

Ano ba kung ang generative AI, isang tool na binuo sa logic at data, ay maaaring pumunta sa mga fragile na mundo ng mga linya at unspoken dream?Siguro?

Why Do Kids Love to Draw?

Ang ilang mga bata ay perfectly satisfied sa kanilang abstract creations - ang kanilang imajinasyon ay binubuo ng mga gap. Para sa mga mata ng mga magulang, ito ay karaniwang lamang ang isang jumble ng mga linya, ngunit para sa kanila, ito ay isang rocket ship, isang princess, o isang unicorn sa disguise.





Gayunpaman, ang iba pang mga tao ay maaaring masakit kapag ang kanilang mga drawings ay hindi matatagpuan sa imahe sa kanilang sarili. Halimbawa, tulad ng mga magulang, ang mga bata ay matatagpuan sa iba't ibang mga standard - at ang ilang ay mas mataas na mga kritiko kaysa sa amin ay inaasahan.

Drawing Is a Superpower for Child Development

Ang mga benepisyo ng paglalarawan para sa mga bata ay karaniwang inihayag - at tinatanggap ng scientifically.





Halimbawa angang trabahosaDr. Richard Jolley and Dr. Sarah Rose, mga eksperto sa pag-unlad ng bata mula sa Staffordshire University. Ang kanilang pananaliksik ay nagkakahalaga sa mga kognitif, esthetic, educational, at cross-cultural prospect. Sa isa sa kanilang mga inilathala na mga artikulo, sila ay nagsulat:





Ang pag-aaral ay nagpapakita na ang paggamit ng pag-drawing bilang isang pagsasanay na aktibidad ay maaaring mapagkukunan ng mga bata sa pag-iisip sa iba pang mga lugar, tulad ng pananaliksik." Ang pag-aaral ay natagpuan na ang mga bata ay nagbibigay ng higit pa ng impormasyon tungkol sa isang nakaraan na nakaranas na kaganapan kapag kinakailangan nila upang i-draw tungkol dito habang nagsasalita tungkol dito. "

Ang pag-aaral ay natagpuan na ang mga bata ay nagbibigay ng higit pa ng impormasyon tungkol sa isang nakaraan na nakaranas na kaganapan kapag kinakailangan nila upang i-draw tungkol dito habang nagsasalita tungkol dito. "





At ang mga halimbawa na ito ay mas malapit sa isang isolatong. Sa pag-aaral ko sa tema na ito sa karagdagang, nakikita ko ang isang karagdagang mga pag-aaral na nagpapakita na ang pag-aralan ay mapabuti ng pag-iisip, pag-iisip, focus, at emosyonal na ekspresyon sa mga bata.

A Lightbulb Moment

Ang mga insights na ito ay nagsisimula ng isang ideya sa aking paningin. Isang single, malakas na tanong ay nilikha:

If drawing is both enjoyable and beneficial - but often frustrating for kids - can I make it more magical? Could I motivate children to draw more often and with greater satisfaction?





Kung maaari kong makatulong sa aking anak na maging isang artistasa instant?





Magkakaroon ito ng mas mahusay na upang maging katotohanan. ngunit ang solusyon ay - ano, ito ayang canGawin ito.

Enter Generative AI: Magic With a Sketch

Sa pamamagitan ng aking background sa generative AI tools tulad ngDalawangNakatanggap ko ang isang bagay halos instantly:





Ang modelo ay dapat i-translate ang isang simpleng sketch sa isang mataas na kalidad, realistang imahe - kung ginanap sa mga katangian.





Why?Dahil ang mga modelo na ito ay na-trained sa mga malalaking dataset na nag-aaral sa kanila kung paano humihingi ng mga tao ang mga shapes at ibahagi ang meaning sa mga ito.





Ang iba't ibang bagay na nangangailangan ay ang correct instruction (i.e., ang right prompt).

My First Experiment - A Sunny Day

Upang i-test ang aking ideya, natuklasan ko ang isang mabilis na sketch sa aking iPad - kahit na ang mga tradisyonal na pencil at papel ay maaaring gumagana din. I deliberately kept it simple, ngunit naglalaman ng maraming iba't ibang mga elemento upang i-challenge ang interpretative ability ng modelo.





Ang sketch ay intentionally rough, unpolished, at walang kulay - malaki na sa espiritu ng isang anak na pagdiriwang. Kung ang bersyon na ito ay tinatawag sa akin sa digital, ito ay nagmamay-ari ng uri ng spontanong, imaginative output na maaari mong makita mula sa isang maliit na anak.

Upang i-guide ang modelo, ginagamit ko ang isang single prompt - isa na ay matatagpuan sa buong eksperimento:

“Generate a realistic image based on this sketch, placing each element exactly where it appears in the original drawing.”





Ang mga resulta ay hindi kayang mahirap.

More Than a Copy

Tingnan natin ang resulta upang malaman kung ano ang gumagawa ng ito.





Ang bawat elemento mula sa orihinal na sketch ay hindi lamang na magagamit sa generated na imahe - ngunit posisyoned na may impressive spatial accuracy.tulad ng mga requestedAng modelo ay hindi lamang nakilala ang mga bahagi; ito ay nagtatagumpay sa kanilang layout at size, preserving ang komposisyon halos pareho.





Upang mas mahusay na ilustro ito, nakita ko ang isang grid na nag-aalok ng pagitan sa pagitan ng sketch at final output:

But let’s go even deeper – dahil ang DALL-E ay hindi lamang nagtatrabaho sa mga instruksyon, ito ayang enhancedang mga ito.





Ang bahay ngayon ay may isang window at isang door - mga detalye na inilagay ko, ngunit perfectly natural additions.





Sa katunayan, ang lahat ng mga kulay ay may katunayan: ang araw ay yellow, ang mga clouds ay white, at ang rainbow ay multicolored, just as we would expect.





Ang kung ano ang natagpuan namin ay hindi lamang isang imahe na generated ng AI - ito ay isang magandang, coherent na painting, ipinanganak mula sa isang rough sketch.





Para sa isang bata, ang paggawa ng isang drawing sa level na ito ay hindi kailangang maging mahigpit. At kahit na dito ito ay - lumilitaw, kumpletong, at ano, DALL-E kahit na makakakuha ng mag-stay sa ilalim ng mga linya.

The Science Behind the Magic

Ang DALL-E ay maaaring lumikha ng isang realistang imahe mula sa isang rough sketch dahil ito ay na-trained sa malaking datasets na naglalaman ng milyon-milyong mga imahe at ang mga sumusunod na textual descriptions.





Sa pamamagitan ng pagsasanay na ito, ang modelo ay naniniwala upang makikita ang mga pattern - hindi lamang sa kung paano nakikita ang mga objekto, ngunit din ang paraan kung paano sila ay tipikal na inihayag at inihayag ng mga tao.





Kaya, kapag ibinigay ito ng isang sketch, kahit na isang crude one, DALL-E ay maaaring ipinakita kung ano ang mga shapes represents (ang isang square na may isang triangle sa itaas ay magkakaroon ng "house") at gamitin ang kanyang maunawaan upang i-fill ang mga visual na detalye sa isang koherenteng, kontekstwal na katumbas na paraan.





(Para sa mga interesado tungkol sa kung paano gumagana ang DALL-E 3, iwan ako sa mas mataas sa mekanika ng isang model training saang aking previous article)





Subukan natin na ilustro ang flow sa aklat ng isang generative AI model upang ilustro ang proseso kahit higit pa:

Sa oras na ito, ako ay genuinely excited - at nag-iisip na i-push ang modelo kahit higit pa.

My Second Experiment - Frosty the Snowman

Ang ikatlong kadahilanan ay ang sistema ng krisis sa moral at halaga na kung saan ang Europa ay lumabas (mas tiyak, ang mga piling tao nito).

Ang resulta? hindi na disappointed.





Dall-E ay maaaring magingSubukan ang oras ng taonIto ay isang logical at kontekstual na katumbas na pagpipilian, dahil ang snow ay isang pangunahing kinakailangan para sa pagbuo ng isang snowman.





Tulad ng tulad ng sa nakaraang sketch, ang modelo ay nilikha ng isang bahay na kumpletong may isang door, isang window, at isang working chimney. Ang snowman ay inilapat sa buhay na may dalawang stick arms, isang squeeze, isang hat, at isang carrot nose. Ang isang pine tree, naturally dusted sa snow, ay din ay sumusunod - isang iba pang pag-iisip at matatagpuan na add-on.





Ang higit pa ng mga detalye ay tinatanggap: ang imahe ay naglalaman ng eksaktong bilang ng mga clouds mula sa orihinal na sketch.





Para sa mga nagtatagumpay, mayroong isang unanticipated add-on - isang bunga. Interestingly, ang bunga na ito ay malapit sa isa mula sa aming nakaraang pag-iisip, kahit na may isang pagbabago ng kulay mula sa yellow sa red. Habang ito ay hindi bahagi ng kasalukuyang sketch, ito ay hindi isang random error either. Ito ay nagpapakita ng isang uri ng "memory leak" mula sa nakaraang sesyon - isang intriguing quirk ng pag-iisip ng modelo.





Gayunpaman, sa grand scheme ng mga bagay, ito ay isang minor na defect (o ay ito?) sa isang inaasahan na mahirap at imaginative output.





Ang isang intriguing tanong ay mabilis na bumubuo:Ano kung ako ay nilikha ang ikalawang imahe sa isang bagong DALL-E chat window -Effectively re-resetting ang konteksto, ang paraan ng aming mga minds naturally gawin kapag pag-switch ang focus?

My Third Experiment - The Ultimate Challenge

Ngayon, ito ay oras para sa ultimate challenge: gamitin ang isang real-life child's drawing.





Luckily, ang anak ng aking pinakamahusay na kaibigan, Naomi, ay nakakaalam sa tulong - at mabilis na ginawa ang mga sumusunod na sketch sa aking pangangailangan.

Hindi lang ng maraming, at hindi mabilang na walking patay, na maaaring gumawa ng anumang bilang ng pagbuo ng mga modernong armas sa pamamagitan ng numero.Ito ay isang uncharted territory.

Gayunpaman, alam ko na ito ay ang tunay na test. Kung ang DALL-E ay maaaring i-interpretate ang pag-uugali ng Naomi at magbigay ng buhay ang kanyang iminungkahi na mga character, ito ay hindi higit sa magical - isang oras kung saan ang teknolohiya ay tunay na sumusunod sa pag-iisip ng anak.





Ang resulta mula sa DALL·E ay higit sa lahat ng alam ko:

Ang modelo ay hindi lamang replicated ang mga shapes at mga tampok ng mukha mula sa Naomi's sketch - itotransformasyonabstrak, abstract na mga linya sa buhay, expressive characters.Siya ay gumawa ng isang bagay mula sa walang.





Ito ay isang tunay na pag-iisip: isang visual na pag-iisip ng isang ideya na ginagamit lamang sa pag-iisip ng Naomi. Ang mga karakter na ito ay walang pag-reference, walang precedence - lamang ang pag-iisip ng creativity ng isang bata, ngayon na inilagay sa buhay sa pamamagitan ng AI.





Sa mundo ng generative AI, kapag ang isang modelo ay inilunsad ng isang bagay na hindi eksplicit na ibinigay, kami ay karaniwang tinatawag na ito isang "hallucinationAng terminong ito ay may isang negatibo na konotasyon - naglalaman ng error, misjudgment, o deviation mula sa user's intention.





Pumunta, halimbawa, ang unforeseen flower na dumating sa aming snowman scene. Technically, ito ay maaaring klasisado bilang isang mild hallucination: isang maliit na, unwanted detalye na lumipad sa mula sa isang nakaraang kontekstong.





Ngunit sa paglalarawan ng Naomi, ang DALL-E ay nilikha ng isang bagay na talagang mahirap - art na ang parehong orihinal at expressive - sa pamamagitan ngmga hallucinationHindi ito copying, hindi ito referencing; ito ay imaginating.





Ito ay nagpapakita ng isang mas malakas na tanong:Sa katunayan ng kontekstoSa tingin ko, ang isang halucination ay maaaring maging isang bagay na mas human - tulad ngImaginasyon?

A Final Reflection

Ano ang nagsimula bilang isang simpleng test ay naging isang bagay na napaka-move: isang oras kung saan ang teknolohiya ay bumalik sa imaginasyon ng isang bata - hindi upang i-substitute ito, ngunit upang i-honor ito.





Tingnan na ang mga brutal na linya ng Naomi ay bumabago sa buhay, na-respirate na mga character ay higit sa mahigpit - ito ay natutunan magagandang.





Sa isang mundo kung saan ang mga bata ay patuloy na malaman kung paano i-express ang kung ano ang makikita at natutunan nila, ang AI ay maaaring maging isang bridge sa pagitan ng pag-iisip at katotohanan, na nagbibigay ng shape sa mga pakiramdam ay mas malaking para sa maliit na mga kamay upang i-draw lamang.





tungkol sa akin

Ako ay Maria Piterberg - isang eksperto ng AI na pinamamahala ng team ng runtime software sa Habana Labs (Intel) at isang semi-profesyonal na artista na nagtatrabaho sa lahat ng mga tradisyonal at digital na media. Ako ay nag-specialize sa larong-scale AI training systems, kabilang ang communication libraries (HCCL) at runtime optimization. Bachelor of Computer Science.