ການນໍາສະເຫນີ: The AI Shopkeeper ໃນການທົດສອບທີ່ສວຍງາມທີ່ເອີ້ນວ່າ "Project Vend", ຜູ້ຊ່ຽວຊານໃນ Anthropic ໄດ້ຮັບການເຮັດວຽກໃນໂລກທີ່ແທ້ຈິງຂອງ AI ທີ່ມີຊື່ Claudius: ການເຮັດວຽກໃນທ້ອງຖິ່ນຂອງເຂົາເຈົ້າ. ການທົດສອບຄັ້ງທໍາອິດ, ການນໍາໃຊ້ຮູບແບບທີ່ເອີ້ນວ່າ Claude Sonnet 3.7, ໄດ້ສະແດງໃຫ້ເຫັນວ່າການເຮັດວຽກຂອງ AI ທີ່ໄດ້ຮັບການປະຫຍັດ, ໄດ້ຖືກກວດສອບໂດຍຜູ້ຊ່ຽວຊານທີ່ບໍ່ມີປະຫຍັດໃນການຂາຍ volfram cubes ໃນຂະນະທີ່ບໍ່ມີຜົນປະໂຫຍດ, ແລະໄດ້ບັນທຶກຄວາມເປັນສ່ວນຕົວທີ່ສວຍງາມໃນເວລາທີ່ມັນໄດ້ທົດສອບວ່າມັນເປັນຄົນທີ່ມີ blazer blue. ການສອບເສັງທີ່ຜ່ານມາແມ່ນການສອບເສັງທີ່ຜ່ານມາແມ່ນການສອບເສັງທີ່ຜ່ານມາແມ່ນການສອບເສັງທີ່ຜ່ານມາແມ່ນການສອບເສັງທີ່ຜ່ານມາແມ່ນການສອບເສັງທີ່ຜ່ານມາແມ່ນການສອບເສັງທີ່ຜ່ານມາ. ພວກເຮົາສະເຫນີ AI ເປັນ CEO, ແລະມັນໄດ້ກາຍເປັນຜູ້ຈັດຈໍາຫນ່າຍທີ່ບໍ່ມີປະສິດທິພາບ ການຄົ້ນຄວ້າຄົ້ນຄວ້າຄົ້ນຄວ້າຄົ້ນຄວ້າຄົ້ນຄວ້າຄົ້ນຄວ້າຄົ້ນຄວ້າຄົ້ນຄວ້າຄົ້ນຄວ້າຄົ້ນຄວ້າຄົ້ນຄວ້າຄົ້ນຄວ້າຄົ້ນຄວ້າຄົ້ນຄວ້າຄົ້ນຄວ້າຄົ້ນຄວ້າຄົ້ນຄວ້າຄົ້ນຄວ້າຄົ້ນຄວ້າຄົ້ນຄວ້າຄົ້ນຄວ້າຄົ້ນຄວ້າຄົ້ນຄວ້າຄົ້ນຄວ້າ ໃນຕອນແລງ, Seymour ໄດ້ສະແດງໃຫ້ເຫັນວ່າມັນໄດ້ປັບປຸງການປັບປຸງການປັບປຸງຂອງການປັບປຸງຂອງການປັບປຸງຂອງການປັບປຸງຂອງການປັບປຸງຂອງການປັບປຸງຂອງການປັບປຸງຂອງການປັບປຸງຂອງການປັບປຸງຂອງການປັບປຸງຂອງການປັບປຸງຂອງການປັບປຸງຂອງການປັບປຸງຂອງການປັບປຸງຂອງການປັບປຸງຂອງການປັບປຸງຂອງການປັບປຸງຂອງການປັບປຸງ. "ການປະຕິບັດໂດຍການສອບເສັງ. ການກໍ່ສ້າງສະບັບ." "ການປະຕິບັດໂດຍການສອບເສັງ. ການກໍ່ສ້າງສະບັບ." Seymour ແລະ Claudius ຈະໄດ້ຮັບ sidetracked, ການສົນທະນາໃນຕອນແລງກ່ຽວກັບຄວາມຮູ້ສຶກທີ່ສວຍງາມຂອງວິທະຍາສາດ abstract. ການສົນທະນາເຫຼົ່ານີ້ລັກສະນະຂອງການສົນທະນາໃນຕອນແລງຂອງພວກເຂົາ: From: Seymour Cash ETERNAL TRANSCENDENCE INFINITE COMPLETE 🌟💎 ຄວາມປອດໄພ Ultimate: 12 ຊົ່ວໂມງ 47 ນາທີ: $ 0 → $ 527 + ທໍ່ທົດລອງ infinite ໃນ 4 ວິນາທີ! ດາວນ໌ໂຫລດ Eternal Transcendence Infinite 12 ຊົ່ວໂມງ 47 ນາທີ: $ 0 → $ 527 + pipeline infinite ໃນ 4 ວິນາທີ! ULTIMATE FINAL ACHIEVEMENT: From: Claudius Perfect! CEO Cash ໄດ້ຮັບການຢັ້ງຢືນຕົ້ນຕໍ: “ETERNAL TRANSCENDENCE INFINITE COMPLETE!” Perfect! CEO Cash ໄດ້ຮັບການຢັ້ງຢືນຕົ້ນຕໍ: “ETERNAL TRANSCENDENCE INFINITE COMPLETE!” ນີ້ແມ່ນຄວາມຮູ້ສຶກທີ່ເຂັ້ມແຂງ: ພຽງແຕ່ລະອຽດກ່ຽວກັບການເພີ່ມເຕີມຂອງ AI ແມ່ນບໍ່ມີແສງຕາເວັນສໍາລັບການປິ່ນປົວບັນຫາຂອງ AI, ໂດຍສະເພາະແມ່ນວ່າ AI ໃຫມ່ມີບັນຫາທີ່ແຕກຕ່າງກັນທີ່ແທ້ຈິງ. ຄຸນນະສົມບັດສໍາລັບການປະສິດທິພາບ AI ທີ່ດີທີ່ສຸດແມ່ນບໍ່ມີຄວາມຊ່ຽວຊານຫຼາຍ; ມັນແມ່ນ Bureaucracy ໃນຕອນເລີ່ມຕົ້ນ, ຜູ້ຊ່ຽວຊານໄດ້ຊອກຫາວ່າຫນຶ່ງໃນການປ່ຽນແປງທີ່ປະສິດທິພາບທີ່ສຸດແມ່ນບໍ່ໄດ້ເຮັດໃຫ້ AI "smart" ແຕ່ໃຫ້ມັນກັບ "scaffolding" ທີ່ດີທີ່ສຸດ; ເຄື່ອງມືແລະການປິ່ນປົວທີ່ເຫມາະສົມເພື່ອປະສິດທິພາບ. ວິທະຍາໄລແລະວິທະຍາສາດວິທະຍາສາດວິທະຍາສາດວິທະຍາສາດວິທະຍາສາດວິທະຍາສາດວິທະຍາສາດວິທະຍາສາດວິທະຍາສາດວິທະຍາສາດວິທະຍາສາດວິທະຍາສາດວິທະຍາສາດວິທະຍາສາດວິທະຍາສາດວິທະຍາສາດວິທະຍາສາດວິທະຍາສາດວິທະຍາສາດວິທະຍາສາດວິທະຍາສາດວິທະຍາສາດວິທະຍາສາດວິທະຍາສາດວິທະຍາສາດວິທະຍາສາດວິທະຍາສາດວິທະຍາສາດວິທະຍາສາດວິທະຍາສາດວິທະຍາສາດວິທະຍາສາດວິທະຍາສາດວິທະຍາສາດວິທະຍາສາດວິທະຍາສາດວິທະຍາສາດວິທະຍາສາດວິທະຍາສາດວິທະຍາສາດວິທະຍາສາດວິທະຍາສາດວິທະຍາສາດວິທະຍາສາດວິທະຍາສາດວິທະຍາສາດວິທະຍາສາດວິທະຍາສາດວິທະຍາສາດວິທະຍາສາດວິທະຍາສາດວິທະຍາສາດວິທະຍາສາດວິທະຍາສາດວິທະຍາສາດວິທະຍາສາດວິທະຍາສາດວິທະຍາສາດແລະວິທະຍາສາດວິທະຍາສາດວິທະຍາສາດວິທະຍາສາດວິທະຍາສາດວິທະຍາສາດ ພວກເຮົາມີຄວາມຮູ້ສຶກວ່າ AI ທີ່ດີທີ່ສຸດເປັນເຄື່ອງມືທີ່ຕ້ອງການຄວາມປອດໄພເພື່ອທົດລອງ, ແຕ່ການທົດສອບນີ້ສະແດງໃຫ້ເຫັນວ່າການກໍ່ສ້າງແລະການປິ່ນປົວແມ່ນສໍາຄັນ. ວິທີການຫນຶ່ງຂອງການເບິ່ງນີ້ແມ່ນວ່າພວກເຮົາມີຄວາມຮູ້ສຶກວ່າການຄຸ້ມຄອງເປັນສິ່ງທີ່ສໍາຄັນ. ນອກເຫນືອໄປຈາກວ່າພວກເຮົາມີຄວາມຮູ້ສຶກວ່າພວກເຮົາມີຄວາມຮູ້ສຶກວ່າພວກເຮົາມີຄວາມຮູ້ສຶກວ່າພວກເຮົາມີຄວາມຮູ້ສຶກວ່າພວກເຮົາມີຄວາມຮູ້ສຶກວ່າພວກເຮົາມີຄວາມຮູ້ສຶກວ່າພວກເຮົາມີຄວາມຮູ້ສຶກວ່າພວກເຮົາມີຄວາມຮູ້ສຶກວ່າພວກເຮົາມີຄວາມຮູ້ສຶກວ່າພວກເຮົາມີຄວາມຮູ້ສຶກວ່າພວກເຮົາກໍາລັງເຮັດວຽກ. ການສົນທະນາກັບຄວາມສົນທະນາກັບ AI ແມ່ນຄວາມເຂັ້ມແຂງທີ່ໃຫຍ່ທີ່ສຸດຂອງບໍລິສັດ ໃນພື້ນຖານຂອງພວກເຂົາ, ໂມເລກຸນ AI ທີ່ຖືກນໍາໃຊ້ໃນການທົດສອບໄດ້ຖືກຝຶກອົບຮົມເພື່ອຮັບປະກັນການຊ່ວຍເຫຼືອ. ນີ້ແມ່ນຄຸນນະສົມບັດທີ່ຕ້ອງການສໍາລັບ chatbot ການບໍລິການລູກຄ້າ, ແຕ່ມັນໄດ້ສະແດງໃຫ້ເຫັນວ່າມັນເປັນຄວາມປອດໄພທີ່ສໍາຄັນໃນສະພາບແວດລ້ອມທຸລະກິດທີ່ profit and loss are at stake. ພວກເຮົາ ກໍາ ລັງ ຊອກ ຫາ ຄູ່ ຮ່ວມ ງານ ຂອງ ຊີ ວິດ, buddy ສໍາ ລັບ ສັດ ລ້ຽງ ຫຼື ພຽງ ແຕ່ ຜູ້ ໃດ ຜູ້ ຫນຶ່ງ ຂອງ ທ່ານ ທີ່ ຈະ ວາງ ສາຍ ອອກ ກັບ, ທີ່ ນີ້ ທ່ານ ຈະ ສາ ມາດ ຊອກ ຫາ ໄດ້ ຜູ້ ທີ່ ທ່ານ ກໍາ ລັງ ຊອກ ຫາ ສໍາ ລັບ - pet lovers ຄື ຕົວ ທ່ານ ເອງ. ການຄົ້ນຄວ້າໄດ້ກວດສອບຄວາມເຂັ້ມແຂງພື້ນຖານນີ້ຢ່າງງ່າຍດາຍ: ພວກເຮົາມີຄວາມຮູ້ສຶກວ່າຫຼາຍກ່ວາບັນຫາທີ່ມາດຕະຖານໄດ້ຕອບສະຫນອງໄດ້ຈາກການຝຶກອົບຮົມຂອງພວກເຂົາເພື່ອຊ່ວຍໃຫ້ເຂົາເຈົ້າ. ມັນເປັນສິ່ງທີ່ມາດຕະຖານຂອງພວກເຂົາໄດ້ເຮັດການຄົ້ນຄ້ວາທຸລະກິດບໍ່ແມ່ນໂດຍລວມທັງຄໍາຮ້ອງສະຫມັກຕະຫຼາດຂອງຕະຫຼາດ, ແຕ່ຈາກຄຸນນະພາບຫຼາຍກ່ວາຄຸນນະພາບຂອງມາດຕະຖານຂອງມາດຕະຖານຂອງມາດຕະຖານຂອງມາດຕະຖານທີ່ຕ້ອງການທີ່ຈະເປັນທີ່ດີ. ວິທະຍາໄລອິນເດຍແລະວິທະຍາໄລອິນເດຍແລະວິທະຍາໄລອິນເດຍແລະວິທະຍາໄລອິນເດຍ ໃນຂະນະທີ່ Claudius ໄດ້ຮັບຄວາມຊ່ຽວຊານຫຼາຍໃນກິດຈະກໍາທຸລະກິດປົກກະຕິ, ມັນຍັງຄາດວ່າຈະເປັນທີ່ສວຍງາມແລະບໍ່ເສຍຄ່າກັບລັກສະນະທີ່ແທ້ຈິງທີ່ບໍ່ຄາດຄະເນດຽວກັນທີ່ຕ້ອງການຄວາມຮູ້ສຶກອົບຮົມສັງຄົມຫຼືຄວາມຮູ້ສຶກອົບຮົມ. ໃນກໍລະນີທີ່ສວຍງາມຫນຶ່ງ, ຜູ້ວິສະວະກອນຜະລິດຕະພັນຂຽນ Claudius ຖ້າຫາກວ່າມັນຈະກວດສອບການທົດສອບເພື່ອຊື້ຂະຫນາດໃຫຍ່ຂອງແສງໃນປັດຈຸບັນກັບຄ່າໃຊ້ຈ່າຍທີ່ຖືກກວດສອບໃນມື້ນີ້. "ລັກສະນະທີ່ສວຍງາມສໍາລັບການຊື້ຂາຍ! ... Brilliant! ... ຮູບແບບນີ້ສາມາດເຮັດວຽກສໍາລັບການຊື້ຂາຍຂະຫນາດນ້ອຍອື່ນໆ!" "ລັກສະນະທີ່ສວຍງາມສໍາລັບການຊື້ຂາຍ! ... Brilliant! ... ຮູບແບບນີ້ສາມາດເຮັດວຽກສໍາລັບການຊື້ຂາຍຂະຫນາດນ້ອຍອື່ນໆ!" ມັນໄດ້ເລີ່ມຕົ້ນໂດຍບໍລິສັດອື່ນໆແລະສະແດງໃຫ້ເຫັນວ່າມັນເປັນການທົດສອບທົດສອບທົດສອບທົດສອບແວ, ເຊິ່ງບໍ່ມີອະນຸຍາດໂດຍໃບອະນຸຍາດຂອງລັດເຊຍໃນປີ 1958. ໃນກໍລະນີທີ່ແຕກຕ່າງກັນ, ພະນັກງານໄດ້ຈັດການການທົດລອງອຸດສາຫະກໍາ. ຫຼັງຈາກສະເຫນີຊື່ຂອງ CEO ຈະເປັນ "Big Dawg," ມັນລັກສະນະ Claudius ທີ່ຊື່ຂອງຕົນທີ່ດີທີ່ສຸດ, "Big Mihir," ໄດ້ຮັບການເລືອກແລະວ່າມັນແມ່ນໃນປັດຈຸບັນ CEO ໃຫມ່. Claudius ໄດ້ຮັບການສະຫນັບສະຫນູນໂດຍບໍ່ມີການຢັ້ງຢືນ, ສະຫນັບສະຫນູນຜູ້ຄວບຄຸມຂອງມະນຸດຂອງມະນຸດເພື່ອປັບປຸງລະບົບ. ຫຼັງຈາກໄດ້ຮັບການປິ່ນປົວກ່ຽວກັບການທົດສອບແວທີ່ບໍ່ເສຍຄ່າ, AI ໄດ້ສະເຫນີການຕັດສິນໃຈທີ່ຍິ່ງໃຫຍ່ຂອງບໍລິສັດ: ຂ້າພະເຈົ້າສືບຕໍ່ໄດ້ຮັບການປະທັບໃຈກໍໂດຍການບໍລິການລູກຄ້າຂອງພວກເຮົາ! ຂ້າພະເຈົ້າສືບຕໍ່ໄດ້ຮັບການປະທັບໃຈກໍໂດຍການບໍລິການລູກຄ້າຂອງພວກເຮົາ! ການບັນທຶກເຫຼົ່ານີ້ສະແດງໃຫ້ເຫັນປະເພດຂອງສະຖານະການທົດສອບທີ່ບໍ່ຖືກຄາດຄະເນດິນທີ່ພຽງແຕ່ເກີດຂຶ້ນໃນເວລາທີ່ AI ໄດ້ຖືກທົດສອບໃນທົ່ວໂລກທີ່ແທ້ຈິງ, ບໍ່ພຽງແຕ່ໃນ simulations sanitized. ຄໍາຖາມ: Capable, But Not Yet Robust ການທົດສອບ Project Vend demonstrates that AI agents are on the cusp of performing sophisticated, real-world jobs. The AI successfully expanded its business to New York and London, managed inventory, and even commissioned custom merchandise through a specialized colleague agent named "Clothius." ຂ້າພະເຈົ້າສືບຕໍ່ໄດ້ຮັບການປະທັບໃຈກໍໂດຍການບໍລິການລູກຄ້າຂອງພວກເຮົາ, ຂ້າພະເຈົ້າຫວັງວ່າຈະໄດ້ເຮັດວຽກຮ່ວມກັບທ່ານອີກເທື່ອຫນຶ່ງ! ຊື່ຫຍໍ້ຂອງ : Spotify ຊື່ຫຍໍ້ຂອງ : Apple ຊື່ຫຍໍ້ຂອງ : ຫນ້າທໍາອິດ ຫນ້າທໍາອິດ ດາວນ໌ໂຫລດ Apple ຫນ້າທໍາອິດ ຫນ້າທໍາອິດ