Tabelul din stânga Abstract și 1. introducere Contextul, metodele și sarcinile Rezultatele mixte 3.1 Calitate și productivitate 3.3. învățare și 3.4 Costul 4 Moderații 4.1 Tipuri de sarcini și complexitate 4.2 Compatibilitate 4.3 Comunicarea 4.4 Colaborare 5.3 Logistică Discuții și lucrări viitoare LLM, programatorul dvs. de cuplu? 5.2 LLM, un programator mai bun? 5.3 LLM, programator pentru studenți? Concluzii, recunoașteri și referințe 4.3 Comunicarea Potrivit lui Freudenberg et al. [24], „cheia succesului programării în perechi [este] proliferarea conversației la un nivel intermediar de detaliu în conversațiile programatorilor în perechi.” Cercetătorii au descoperit, de asemenea, că programarea în perechi elimină activitatea distractivă și permite programatorilor să se concentreze pe activitatea productivă [75], ceea ce ar putea fi motivul pentru care comunicările de angajare contribuie la succesul programării în perechi. Murphy et al. [55] a folosit analiza tranzacțională pentru a rupe comunicarea prin diferite tipuri de tranzacții, și au descoperit că încercarea de mai multe probleme asociate cu mai multe tranzacții de finalizare și debugging succesul corelat cu mai multe tranzacții critice. În programarea cuplurilor om-om, programatorii petrec aproximativ 1/3 din timp concentrându-se în principal pe comunicare [65], ceea ce îi forțează să se concentreze, să raționalizeze și să-și explice gândurile [31, 75]. În programarea cuplurilor om-AI, Mozannar et al. [53] au arătat că o cantitate similară de 1/3 din timp este petrecută comunicând cu Copilot, cum ar fi gândirea și verificarea (22,4%) a sugestiei Copilot, care poate fi replicarea efectelor auto-explicării în unele moduri, și crafting-ul prompt, care durează 11,56% din timp. Aceste activități sunt, probabil, eforturi de a înțelege și de a comunica cu Copilot. 4.4 Colaborare Cât de bine colaborează partenerii au fost factori importanți care afectează eficacitatea programării în perechi [4, 79], iar comportamentul cooperativ și interdependența pozitivă sunt cheia succesului programării în perechi [67]. Colaborarea poate eșua în diferite moduri într-un cuplu uman-uman. De exemplu, problema șoferului liber, în care întreaga sarcină de lucru este pe un partener în timp ce celălalt rămâne un jucător marginal, poate duce la mai puțină satisfacție și învățare [57, 87]. În programarea cuplului uman-AI, educatorii sunt îngrijorați că instrumentele de generare a codului ușor disponibile pot duce la înșelăciune, iar dependența excesivă de AI poate împiedica elevii să învețe [10]. Cu toate acestea, niciun studiu nu a evaluat oficial acest lucru. Pentru programarea cuplului om-om, există un model de colaborare sugerat de comutare de roluri – doi dezvoltatori de software comută periodic și în mod regulat între scrierea codului (driver) și sugerarea codului (navigator), cu scopul de a se asigura că ambii sunt angajați în sarcină și de a ușura sarcina fizică și cognitivă suportată de șofer [5, 65]. Unii cercetători Freudenberg et al. [24] susțin că succesul programării în perechi ar trebui atribuit comunicării mai degrabă decât „diferențelor de comportament sau de concentrare între șofer și navigator”, deoarece au descoperit că atât șoferul, cât și navigatorul au lucrat la niveluri similare de abstracție. În interacțiunea uman-AI, având în vedere capacitatea uimitoare a lui Copilot de a scrie cod în diferite limbi, unii au susținut că Copilot poate să preia rolul de „driver” în programarea în perechi, permițând unui programator solo să preia rolul de „navigator” și să se concentreze pe înțelegerea codului la un nivel mai înalt [35]. 4.5 Logistică Provocările logistice, inclusiv planificarea dificultăților, predarea și evaluarea colaborării pentru cuplu, precum și identificarea responsabilității și responsabilității individuale [11, 67], pot adăuga la costul de gestionare al programării cuplului om-om [4, 79]. În programarea uman-AI, unii ar putea argumenta că omul este singurul responsabil în perechea uman-AI [72], dar responsabilitatea acestor AI generative bazate pe LLM este încă în dezbatere [10]. Pot exista noi probleme logistice pentru perechea uman-AI, cum ar fi învățarea oamenilor cum să colaboreze cel mai bine cu Copilot. Ar putea exista, de asemenea, provocări unice ca în fiecare scenariu de interacțiune uman-AI, cum ar fi prejudecăți, încredere și limitări tehnice - mult de explorat. Ar fi nevoie de mai multe studii pentru a verifica empiric și experimental efectele moderatoare ale diferitelor variabile în programarea uman-AI. Literatura de programare uman-uman cuplu a găsit moderatori, inclusiv , , , şi Cu toate acestea, există o lipsă de examinare în profunzime a efectelor moderatoare potențiale în lucrările actuale de pAIr. Rezumatul Tipuri de sarcini & Complexitatea Compatibilitate Comunicarea Colaborare Logistică Autorii : (1) Qianou Ma (autor corespondent), Universitatea Carnegie Mellon, Pittsburgh, SUA (qianouma@cmu.edu); (2) Tongshuang Wu, Universitatea Carnegie Mellon, Pittsburgh, SUA (sherryw@cs.cmu.edu); (3) Kenneth Koedinger, Universitatea Carnegie Mellon, Pittsburgh, Statele Unite ale Americii (koedinger@cmu.edu). Authors: (1) Qianou Ma (autor corespondent), Universitatea Carnegie Mellon, Pittsburgh, SUA (qianouma@cmu.edu); (2) Tongshuang Wu, Universitatea Carnegie Mellon, Pittsburgh, SUA (sherryw@cs.cmu.edu); (3) Kenneth Koedinger, Universitatea Carnegie Mellon, Pittsburgh, Statele Unite ale Americii (koedinger@cmu.edu). Acest document este disponibil în arhivă sub licența CC BY-NC-SA 4.0 DEED. Acest document este sub licența CC BY-NC-SA 4.0 DEED. Disponibil în arhivă Disponibil în arhivă