ໂມເລກຸນ AI ແມ່ນດີໃນການຂຽນ poems, ການສອບເສັງ emails, ຫຼືກາຍເປັນຜູ້ຊ່ຽວຊານ. ແຕ່ພວກເຂົາເຈົ້າສາມາດຊອກຫາມື້ຈິງຈາກຄອມພິວເຕີ? ພວກເຂົາເຈົ້າສາມາດເຂົ້າໃຈກັບຄອມພິວເຕີທີ່ແຕກຕ່າງກັນທີ່ມີຄອມພິວເຕີທີ່ແຕກຕ່າງກັນແລະຄອມພິວເຕີ half missing? ນີ້ແມ່ນສິ່ງທີ່ຂ້າພະເຈົ້າຕ້ອງການທີ່ຈະຊອກຫາ. ດັ່ງນັ້ນຂ້າພະເຈົ້າທົດສອບ 5 ໂມເລກຸນ AI ທີ່ຍິ່ງໃຫຍ່ - ຈາກ API cloud ກັບ LLMs ທີ່ມີຄຸນນະພາບສູງ - ກ່ຽວກັບສອງການເຮັດວຽກທີ່ຍິ່ງໃຫຍ່ແລະມີປະໂຫຍດທີ່ສຸດໃນການເຮັດວຽກຂອງບໍລິສັດທີ່ແທ້ຈິງ: (1) ລະບົບການຊອກຫາວິທະຍາໄລແລະ (2) ລະບົບການຊອກຫາວິທະຍາໄລ. ການຕິດຕັ້ງໄດ້ຢ່າງງ່າຍດາຍ: 20 ໂຮງງານຜະລິດທີ່ແທ້ຈິງແລະ 20 ໂຮງງານຜະລິດທີ່ໄດ້ຮັບຈາກເອກະສານທຸລະກິດທີ່ແທ້ຈິງ. ບາງຄົນແມ່ນຄຸນນະສົມບັດ, ບາງຄົນບໍ່ແມ່ນ. ຂ້າມຕາມວິທີການຂອງມາດຕະຖານທັງ ຫມົດ ມີການປິ່ນປົວຂໍ້ມູນທີ່ບໍ່ມີ, ການອອກແບບທີ່ບໍ່ແມ່ນຄຸນນະສົມບັດ, OCR artifacts, ແລະອຸປະກອນທີ່ເຊື່ອມຕໍ່. ຫຼັງຈາກນັ້ນ, ຂ້າມ 4 ສິ່ງ: ຄວາມຖືກຕ້ອງ, ຄວາມໄວ, ຄ່າໃຊ້ຈ່າຍ, ແລະ stability under messy input. ຮູບພາບ ສໍາ ລັບ ສັດ ລ້ຽງ ສັດ ລ້ຽງ ລ້ຽງ Inputs ໄດ້ຮັບເປັນເອກະສານ OCR ທັດສະນະ, ບໍ່ແມ່ນ pre-labeled ຫຼື fine-tuned. The only thing the models had to work with was the raw content, plus a prompt. ຫນຶ່ງຂອງມາດຕະຖານໄດ້ impressioned. ອື່ນໆ halucinated total or ignored headers. ວິທີການທີ່ຜ່ານມາແມ່ນການຝຶກອົບຮົມສໍາລັບສິ່ງທຸກຢ່າງຂອງແຕ່ລະຮູບແບບນີ້ ແລະ ຖ້າຫາກວ່າທ່ານກໍາລັງຊອກຫາສໍາລັບການນໍາໃຊ້ມັນໃນການຜະລິດ, ນີ້ແມ່ນສິ່ງທີ່ທ່ານຕ້ອງການຮູ້. ປະເພດ ຄົ້ນຫາ AWS Textract: ອັດຕະໂນມັດ, ອັດຕະໂນມັດ, Strictly by the Book : Textract ສະຫນັບສະຫນູນຜົນປະໂຫຍດທີ່ຖືກຮັບປະກັນກ່ຽວກັບການຊໍາລະເງິນ. ມັນມີ 91.3% ໂດຍບໍ່ມີການຊື້ຂາຍແລະ 91.1% ໂດຍບໍ່ມີການຊື້ຂາຍ. Performance ພວກເຮົາ ກໍາ ລັງ ຊອກ ຫາ ຄູ່ ຮ່ວມ ງານ ຂອງ ຊີ ວິດ, buddy ສໍາ ລັບ ສັດ ລ້ຽງ, buddy ສໍາ ລັບ ສັດ ລ້ຽງ, buddy ສໍາ ລັບ ສັດ ລ້ຽງ, buddy ສໍາ ລັບ ສັດ ລ້ຽງ, buddy ສໍາ ລັບ ສັດ ລ້ຽງ, buddy ສໍາ ລັບ ສັດ ລ້ຽງ, buddy ສໍາ ລັບ ສັດ ລ້ຽງ, buddy ສໍາ ລັບ ສັດ ລ້ຽງ, buddy ສໍາ ລັບ ສັດ ລ້ຽງ, buddy ສໍາ ລັບ ສັດ ລ້ຽງ, buddy ສໍາ ລັບ ສັດ ລ້ຽງ. ໃນທ້ອງຖ່າຍຮູບ, Textract ໄດ້ມີຄວາມຖືກຕ້ອງ 82.1%, ທີ່ດີກວ່າ GPT-4o ແລະມີຂະຫນາດນ້ອຍກ່ວາ Azure. ມັນໄດ້ປິ່ນປົວການກໍ່ສ້າງພື້ນທີ່ຢ່າງງ່າຍດາຍແລະໄດ້ເຮັດຄວາມຜິດພາດການກໍ່ສ້າງຕ່ໍາກ່ວາມາດຕະຖານທີ່ອະນຸຍາດໂດຍການຄົ້ນຄວ້າ generative. ແຕ່ມັນໄດ້ຕັດສິນໃຈກັບ headers ສີດໍາຫຼືການປິ່ນປົວ cell inconsistent. ໃນເວລາທີ່ການອອກແບບທ້ອງຖ່າຍຮູບໄດ້ແຕກຕ່າງ, Textract returned partial or flattened outputs rather than trying to interpret intention. ມັນຍັງປິ່ນປົວການຊອກຫາຄວາມກົດດັນຕ່ໍາ (200-300 DPI) ໂດຍບໍ່ມີຜົນປະໂຫຍດ, ເຮັດໃຫ້ຄວາມກົດດັນທີ່ສະດວກສະບາຍເຖິງແມ່ນວ່າເອກະສານໄດ້ຖືກກວດກາຢ່າງງ່າຍດາຍ. ການປິ່ນປົວລະຫວ່າງເວລາ: 2.1 ວິນາທີ per page, ເຮັດໃຫ້ມັນເປັນຮູບແບບທີ່ໄວທີ່ສຸດທີ່ໄດ້ຮັບການທົດສອບທີ່ມີຄວາມຖືກຕ້ອງຢ່າງເຕັມທີ່. Speed ການນໍາໃຊ້ AnalyzeExpense Endpoint, ເຊັ່ນດຽວກັນກັບ Benchmark. ລາຄາ Straightforward, ບໍ່ມີ tokens, ບໍ່ມີລັກສະນະ. Cost : Textract ໄດ້ຖືກສ້າງຂຶ້ນສໍາລັບການຂະຫນາດ. ມັນບໍ່ແມ່ນສ້າງສັນ, ແຕ່ມັນແມ່ນສິ່ງທີ່ສໍາຄັນ. ມັນຈະບໍ່ເຂົ້າໄປໃນສະຖາບັນຫຼຸບຫຼືປັບແຕ່ງກັບການເຄື່ອນໄຫວ, ແຕ່ມັນຈະບໍ່ໄດ້ຮັບການປິ່ນປົວພາຍໃຕ້ຄວາມກົດດັນ. Verdict ການນໍາໃຊ້ທີ່ດີທີ່ສຸດໃນ pipelines ທີ່ມີຮູບແບບເອກະສານການຄວບຄຸມ, ແລະທ່ານຕ້ອງການຜົນກະທົບທີ່ຄາດຄະເນດິນໃນຄວາມໄວ. ສໍາລັບການອອກແບບທີ່ບໍ່ເສຍຄ່າຫຼືທ້ອງຖ່າຍຮູບບໍ່ເສຍຄ່າ, ທ່ານຈະຕ້ອງຊອກຫາໃນສະຖານທີ່ອື່ນໆ - ແຕ່ສໍາລັບເອກະສານທຸລະກິດທີ່ຖືກສ້າງຕັ້ງຢ່າງງ່າຍດາຍ, ມັນເປັນຫນຶ່ງໃນອຸປະກອນທີ່ປະສິດທິພາບທີ່ສຸດທີ່ໃຊ້ເວລາ. ການຄົ້ນຄວ້າເອກະສານ Azure: Output Clean, Nerve Limited ການນໍາໃຊ້ Azure ແມ່ນປະສິດທິພາບຫຼາຍ, ມີຄວາມຖືກຕ້ອງ 85.8% ໂດຍບໍ່ມີການບັນຊີລາຍລະອຽດແລະ 85.7% ໂດຍບໍ່ມີການບັນຊີລາຍລະອຽດ. ການນໍາໃຊ້ Azure ແມ່ນປະສິດທິພາບຫຼາຍ - ຈໍານວນບັນຊີລາຍລະອຽດ, ວັນທີ, ຈໍານວນທັງຫມົດ - ແຕ່ຍັງບໍ່ມີປະສິດທິພາບຫຼາຍ - ເຊັ່ນດຽວກັນກັບຊື່ຂອງຜູ້ສະຫນອງທີ່ແຕກຕ່າງກັນຫຼືບັນຊີລາຍລະອຽດທີ່ບໍ່ແມ່ນປົກກະຕິ. Performance ການຄົ້ນຄວ້າແລະການປິ່ນປົວຂອງການປິ່ນປົວຂອງການປິ່ນປົວຂອງການປິ່ນປົວຂອງການປິ່ນປົວຂອງການປິ່ນປົວຂອງການປິ່ນປົວຂອງການປິ່ນປົວຂອງການປິ່ນປົວຂອງການປິ່ນປົວຂອງການປິ່ນປົວຂອງການປິ່ນປົວ ໃນທ້ອງຖ່າຍຮູບ, ມັນໄດ້ບັນລຸຄວາມຖືກຕ້ອງ 81.5%, ຫຼັງຈາກ AWS ແລະຕ່ໍາກວ່າ Gemini. ມັນເຮັດວຽກດີໃນສະຖານທີ່ທັນສະໄຫມ, ການອອກແບບປົກກະຕິ, ດາວໂຫລດຊຸດແລະແຜ່ນໂດຍບໍ່ມີບັນຫາທີ່ສໍາຄັນ. ແຕ່ມັນເຮັດວຽກຮ່ວມກັບຄວາມຊ່ຽວຊານຂອງການກໍ່ສ້າງ - cells fused, headers stacked, or inconsistent alignment led to dropped values or misclassified columns. It remained functional but cautious. ຂະ ຫນາດ 3.5 ວິນາທີ per page ໃນປັດຈຸບັນ. ຂ້າງຂວາງຫຼາຍກ່ວາ AWS, ແຕ່ໄດ້ stabilized ແລະໄດ້ຮັບການຜະລິດ. Speed ປະມານ $ 10 ສໍາ ລັບ 1,000 ເວັບໄຊທ໌ໂດຍໃຊ້ຮູບແບບຊັດເຈນ prebuilt. Fixed pricing through Azure API, no tuning required. Cost Azure ໄດ້ຮັບການເຮັດວຽກຫຼັງຈາກນັ້ນຫຼັງຈາກນັ້ນ, ຖ້າຫາກວ່າການເຮັດວຽກໄດ້ຖືກຄັດເລືອກຢ່າງງ່າຍດາຍ. ມັນເປັນການຄັດເລືອກທີ່ມີຄວາມປອດໄພຕ່ໍາສໍາລັບບັນຊີລາຍລະອຽດແລະຕາຕະລາງປົກກະຕິ, ແຕ່ມັນບໍ່ແມ່ນມາດຕະຖານທີ່ທ່ານໂທຫາໃນເວລາທີ່ແຜ່ນໄດ້ຮັບການບັນທຶກ. Verdict ມັນເປັນຄວາມປອດໄພ, ແຕ່ມັນບໍ່ໄດ້ຂັບເຄື່ອນໄຫວ - ແລະມັນຈະບໍ່ມີຄຸນນະສົມບັດກັບມາດຕະຖານທີ່ເຮັດວຽກ. ການນໍາໃຊ້ທີ່ດີທີ່ສຸດໃນໂຄງສ້າງເອກະສານທີ່ຄວາມປອດໄພໄດ້ຕອບສະຫນອງຄວາມປອດໄພ. Google Document AI: Great When It's Easy, Lost When It's Not : ກ່ຽວກັບບັນຊີລາຍຊື່, Google ໄດ້ສະແດງໃຫ້ເຫັນຜົນປະໂຫຍດທີ່ບໍ່ເຫມາະສົມ. ມັນມີຄວາມຖືກຕ້ອງ 83.8% ໂດຍບໍ່ມີການບັນຊີລາຍລະອຽດ, ແຕ່ຫຼຸດລົງເຖິງ 68.1% ໃນເວລາທີ່ບັນຊີລາຍລະອຽດໄດ້ຖືກນໍາໃຊ້ Performance ມັນໄດ້ປິ່ນປົວພື້ນຖານເຊັ່ນດຽວກັນເຊັ່ນດຽວກັນເຊັ່ນດຽວກັນເຊັ່ນດຽວກັນເຊັ່ນດຽວກັນເຊັ່ນດຽວກັນເຊັ່ນດຽວກັນເຊັ່ນດຽວກັນເຊັ່ນດຽວກັນເຊັ່ນດຽວກັນເຊັ່ນດຽວກັນເຊັ່ນດຽວກັນເຊັ່ນດຽວກັນເຊັ່ນດຽວກັນເຊັ່ນດຽວກັນເຊັ່ນດຽວກັນເຊັ່ນດຽວກັນເຊັ່ນດຽວກັນເຊັ່ນດຽວກັນເຊັ່ນດຽວກັນເຊັ່ນດຽວກັນເຊັ່ນດຽວກັນ. ການທົດສອບແຜ່ນແຜ່ນແຜ່ນແຜ່ນແຜ່ນແຜ່ນແຜ່ນແຜ່ນແຜ່ນແຜ່ນແຜ່ນແຜ່ນແຜ່ນແຜ່ນແຜ່ນແຜ່ນແຜ່ນແຜ່ນແຜ່ນແຜ່ນແຜ່ນແຜ່ນແຜ່ນແຜ່ນແຜ່ນແຜ່ນແຜ່ນແຜ່ນແຜ່ນແຜ່ນແຜ່ນແຜ່ນແຜ່ນແຜ່ນແຜ່ນແຜ່ນແຜ່ນແຜ່ນແຜ່ນແຜ່ນແຜ່ນແຜ່ນແຜ່ນແຜ່ນແຜ່ນແຜ່ນແຜ່ນແຜ່ນແຜ່ນແຜ່ນແຜ່ນແຜ່ນແຜ່ນແຜ່ນແຜ່ນແຜ່ນແຜ່ນແຜ່ນແຜ່ນແຜ່ນແຜ່ນແຜ່ນແຜ່ນແຜ່ນແ ມັນໄດ້ປິ່ນປົວຄຸນນະສົມບັດຄຸນນະສົມບັດຄຸນນະສົມບັດຄຸນນະສົມບັດຄຸນສົມບັດຄຸນສົມບັດຄຸນສົມບັດຄຸນສົມບັດຄຸນສົມບັດຄຸນສົມບັດຄຸນສົມບັດຄຸນສົມບັດຄຸນສົມບັດຄຸນສົມບັດຄຸນສົມບັດຄຸນສົມບັດຄຸນສົມບັດຄຸນສົມບັດຄຸນສົມບັດຄຸນສົມບັດຄຸນສົມບັດຄຸນສົມບັດຄຸນສົມບັດຄຸນສົມບັດຄຸນສົມບັດຄຸນສົມບັດຄຸນສົມບັດຄຸນສົມບັດຄຸນສົມບັດຄຸນສົມບັດຄຸນສົມບັດຄຸນສົມບັດຄຸນສົມບັດຄຸນສົມບັດຄຸນສົມບັດຄຸນສົມບັດຄຸນສົມບັດຄຸນສົມບັດຄຸນສົມບັດຄຸນສົມບັດຄຸນສົມບັດຄຸນສົມບັດຄຸນສົມບັດຄຸນສົມບັດຄຸນສົມບັດຄຸນສົມບັດຄຸນສົມບັດ ມັນຍັງດາວໂຫລດອຸປະກອນເສັ້ນທາງເປັນເສັ້ນທາງທີ່ບໍ່ເຄື່ອນໄຫວຂອງເອກະສານໃນຂະນະທີ່ແຜ່ນ segmented ປະສິດທິພາບ. That made quantity, unit price, and total extraction unreliable or impossible to valid. ຂະຫນາດນ້ອຍ: ປະມານ 5.1 ວິນາທີ per page, ຫຼາຍກ່ວາ Azure ແລະ AWS, ແຕ່ບໍ່ dramatically. Speed ການຄາດຄະເນດິນຟ້າອິນເຕີເນັດ (APIs) - ການຄາດຄະເນດິນຟ້າອິນເຕີເນັດ Cost Google Docs AI ແມ່ນເຮັດວຽກໃນເວລາທີ່ເອກະສານແມ່ນຄຸນນະພາບ, ການຄາດຄະເນດິນແລະຄຸນນະພາບຄຸນນະສົມບັດ. Verdict: ການຄາດຄະເນດິນດີຕ້ອນຮັບຂອງພວກເຮົາແມ່ນການຄາດຄະເນດິນດີຕ້ອນຮັບຂອງພວກເຮົາ. ການນໍາໃຊ້ທີ່ດີທີ່ສຸດໃນລະດັບການເຮັດວຽກ internal ທີ່ຖືກຄວບຄຸມທີ່ variability input ແມ່ນຂະຫນາດນ້ອຍແລະຄວາມຕ້ອງການແມ່ນຂະຫນາດນ້ອຍ. GPT-4o: Smart, Precise, Sensitive ກັບ Input : GPT-4o ໄດ້ປິ່ນປົວການຊັດເຈນຊັດເຈນທີ່ດີ. ມັນມີຄວາມຖືກຕ້ອງ 90.8% ໂດຍບໍ່ມີການຊັດເຈນແລະ 86.5% ໂດຍໃຊ້ການເຂົ້າລະຫັດ OCR. Performance ໃນເວລາທີ່ເຮັດວຽກກັບຮູບພາບເອກະສານ, ຈຸດຄົ້ນບໍ່ແຮ່ໄດ້ປົກກະຕິ: 88.3% ແລະ 89.2%, ການຄົ້ນບໍ່ແຮ່ໄດ້ຖືກເຂົ້າລະຫັດຢ່າງງ່າຍດາຍ, ວັນທີ, ຈໍານວນບັນຊີແລະຊື່ຜູ້ຂາຍ. ມັນຍັງດີທີ່ຈະເລືອກຄຸນນະສົມບັດທີ່ເຫມາະສົມໃນເວລາທີ່ຈໍານວນຫຼາຍທີ່ແຕກຕ່າງກັນໃນເວັບໄຊ. ມັນໄດ້ປິ່ນປົວເອກະສານຄຸນນະພາບຕ່ໍາໂດຍບໍ່ມີຜົນປະໂຫຍດຂະຫນາດໃຫຍ່ໃນຄວາມແມ່ນຍໍາ. ຢ່າງໃດກໍຕາມ, ມັນມີເວລາທີ່ດາວໂຫລດການຕັດສິນໃຈ - ດາວໂຫລດການຕັດສິນໃຈຫຼືດາວໂຫລດການຕັດສິນໃຈໃນແຜ່ນຂະຫນາດນ້ອຍ. GPT-4o ໄດ້ຮັບພຽງແຕ່ 38,5% ປະສິດທິພາບ - ປະສິດທິພາບຕ່ໍາທີ່ສຸດໃນລະຫວ່າງທັງຫມົດຂອງມາດຕະຖານໃນ benchmark. ໃນຂະນະທີ່ມັນໄດ້ກາຍເປັນການກໍ່ສ້າງພື້ນຖານໃນກໍລະນີທີ່ງ່າຍ, ມັນໄດ້ກາຍເປັນ headers fused, ສາຍ nested, ແລະ layouts incomplete. ການຄົ້ນຄວ້າທີ່ດີທີ່ສຸດຂອງການຄົ້ນຄວ້າທີ່ດີທີ່ສຸດແມ່ນການຄົ້ນຄວ້າທີ່ດີທີ່ສຸດຂອງການຄົ້ນຄວ້າທີ່ດີທີ່ສຸດ. : ປະມານ 17-20 ວິນາທີ per page ກັບ OCR ລະຫັດ input. ມີການເຂົ້າລະຫັດຮູບພາບ, latency increases sharply — often 30 ວິນາທີຫຼືຫຼາຍກ່ວາ, depending on prompt size and system load. Speed ຄ່າໃຊ້ຈ່າຍປະມານ $ 5-6 per 1,000 pages using GPT-4-turbo (Input Text) ການເຂົ້າລະຫັດຮູບພາບໂດຍຜ່ານ API Vision ສາມາດ double ທີ່, ປະມານຂະຫນາດ prompt ແລະການນໍາໃຊ້ token. Cost GPT-4o ເຮັດວຽກດີກ່ຽວກັບການຢັ້ງຢືນແລະຮູ້ສຶກອົບຮົມທີ່ມີຄຸນນະສົມບັດແລະຄວາມງ່າຍດາຍ. ແຕ່ໃນທ້ອງຖ່າຍຮູບທີ່ສົມບູນແບບໂດຍທົ່ວໄປ, ມັນຄວນຄົ້ນຄວ້າເພື່ອປົກປັກຮັກສາຄຸນນະສົມບັດຫຼືຜະລິດຕະພັນທີ່ເຫມາະສົມ. Verdict: ຖ້າຫາກວ່າທ່ານກໍາລັງເຮັດວຽກກັບເອກະສານທີ່ຄາດຄະເນດິນທີ່ສໍາຄັນ - ແລະຄວາມຖືກຕ້ອງບໍ່ສາມາດຂ້າງລຸ່ມກ່ວາ 40% - ທ່ານຈະຈໍາເປັນຕ້ອງຊອກຫາທີ່ອື່ນໆ. ນໍາ ເວັບ ໄຊ ທ ໌ ອອນ ໄລ ນ ໌ ວັນ ທີ ການ ສ້າງ ຕັ້ງ ສະ ເພາະ ສໍາ ລັບ lovers ສັດ ລ້ຽງ. ຊື່ຫຍໍ້ຂອງ : Gemini 1.5 Pro: Quietly Dominant : Gemini ການປິ່ນປົວການປິ່ນປົວບັນຊີລາຍຊື່ທີ່ມີຄວາມແມ່ນຍໍາ. ມັນໄດ້ຮັບຄວາມຖືກຕ້ອງ 90.0% ໂດຍບໍ່ມີການບັນຊີລາຍຊື່ແລະ 90.2% ໂດຍບໍ່ມີການບັນຊີລາຍຊື່. Performance ພວກເຮົາ ກໍາ ລັງ ຊອກ ຫາ ຄູ່ ຮ່ວມ ງານ ຂອງ ຊີ ວິດ, buddy ສໍາ ລັບ ສັດ ລ້ຽງ, buddy ສໍາ ລັບ ສັດ ລ້ຽງ, buddy ສໍາ ລັບ ສັດ ລ້ຽງ, buddy ສໍາ ລັບ ສັດ ລ້ຽງ, buddy ສໍາ ລັບ ສັດ ລ້ຽງ, buddy ສໍາ ລັບ ສັດ ລ້ຽງ, buddy ສໍາ ລັບ ສັດ ລ້ຽງ, buddy ສໍາ ລັບ ສັດ ລ້ຽງ, buddy ສໍາ ລັບ ສັດ ລ້ຽງ, buddy ສໍາ ລັບ ສັດ ລ້ຽງ, buddy ສໍາ ລັບ ສັດ ລ້ຽງ, buddy ສໍາ ລັບ ສັດ ລ້ຽງ, buddy ສໍາ ລັບ ສັດ ລ້ຽງ, buddy ສໍາ ລັບ ສັດ ລ້ຽງ, buddy ສໍາ ລັບ ສັດ ລ້ຽງ, buddy ສໍາ ລັບ ສັດ ລ້ຽງ. ໃນທ້ອງຖ່າຍຮູບ, Gemini ໄດ້ຕັດສິນໃຈຫຼາຍກ່ວາຮູບແບບອື່ນໆທັງຫມົດ. ມັນໄດ້ບັນລຸຄວາມຖືກຕ້ອງ 94.2%, ປະສົບການຕົ້ນຕໍ. AWS ແລະ Azure ໄດ້ຮັບ 82.1% ແລະ 81.5%, ໃນຂະນະທີ່ GPT-4o ໄດ້ຕັດສິນໃຈຢ່າງກວ້າງຂວາງກັບ 38.5%. Gemini ໄດ້ກວດສອບ headers multi-level, cells fused, ແລະໂຄງສ້າງຊຸດທີ່ບໍ່ເຫມາະສົມທີ່ມີຄວາມຜິດພາດຕ່ໍາແລະຄວາມຄິດສ້າງສັນທີ່ດີກວ່າ. ມັນໄດ້ເຮັດຄວາມຜິດພາດການປິ່ນປົວຢ່າງງ່າຍດາຍ, ແຕ່ໄດ້ປິ່ນປົວຂໍ້ມູນທີ່ຖືກນໍາໃຊ້. ປະມານ 3 – 4 ວິນາທີ per page ໃນປັດຈຸບັນ. ຄວາມໄວຫຼາຍກ່ວາ GPT-4o, ບໍ່ມີ slowdowns ບໍ່ຄາດຄະເນ. Speed : ການຄາດຄະເນດິນດີຕ້ອນຮັບ $ 4-5 per 1,000 pages using the Gemini API in text-only experimental mode. Image input was not tested in this benchmark. Cost ຊື່ຫຍໍ້ຂອງ : Gemini ສະຫນັບສະຫນູນຄວາມແມ່ນຍໍາສູງໃນໄລຍະບັນຊີລາຍຊື່ແລະທ້ອງຖ່າຍຮູບໂດຍບໍ່ຈໍາເປັນຕ້ອງເຂົ້າລະຫັດ vision ຫຼືການຕິດຕັ້ງທີ່ສົມບູນແບບ. ມັນແມ່ນໄວ, ການຄົ້ນຄວ້າຄຸນນະສົມບັດ, ແລະປອດໄພກັບບັນຊີລາຍລະອຽດຫຼາຍກ່ວາຮູບແບບອື່ນໆທີ່ທົດສອບ. Verdict ການນໍາໃຊ້ທີ່ດີທີ່ສຸດໃນເວລາທີ່ທ່ານຕ້ອງການຜະລິດຕະພັນຄຸນນະພາບຈາກເອກະສານ inconsistent ແລະສາມາດຄວບຄຸມຮູບແບບ input. ສະຫນັບສະຫນູນທີ່ມີຄວາມປອດໄພພາຍໃຕ້ຄວາມກົດດັນ - ບໍ່ມີ Dramatic, ພຽງແຕ່ output. ຄວາມຄິດເຫັນ ຊື່ຫຍໍ້ຂອງ : Five models. Same tasks. Same documents. Very different results. Gemini ແມ່ນທີ່ດີທີ່ສຸດ all-around - ຄວາມໄວ້ວາງໃຈ, ຄວາມຖືກຕ້ອງ, ແລະຄຸນນະສົມບັດທີ່ແຕກຕ່າງກັນ. GPT-4o ໂທລະສັບສົນທະນາ, ສະຫນັບສະຫນູນໃນທ້ອງຖ່າຍຮູບ. AWS Textract ແມ່ນໄວ, rigid, ແລະງ່າຍທີ່ຈະຕັດ. Azure ໄດ້ຮັບພື້ນຖານທີ່ດີ, ແຕ່ບໍ່ຫຼາຍກ່ວາ. Google ໄດ້ຕັດສິນໃຈກັບສິ່ງທຸກຢ່າງທີ່ບໍ່ແມ່ນຄຸນນະພາບແລະບໍ່ມີປະເພດ. ໃນຖານະເປັນບໍລິສັດທີ່ໃຫ້ບໍລິການໃຫ້ບໍລິການໃຫ້ບໍລິການໃຫ້ບໍລິການໃຫ້ບໍລິການໃຫ້ບໍລິການຂອງພວກເຮົາ.