ວິທີການ
ເພື່ອເຮັດໃຫ້ແນວຄິດຍຸດຕິທໍານີ້ເຂົ້າໄປໃນການປະຕິບັດແລະສະແດງໃຫ້ເຫັນຄວາມແຕກຕ່າງກັບຄວາມຍຸຕິທໍາຂອງກຸ່ມແບບດັ້ງເດີມ, ພວກເຮົາປຽບທຽບສາມແບບທີ່ນໍາໃຊ້ຄຸນລັກສະນະທີ່ລະອຽດອ່ອນກັບຕົວແບບພື້ນຖານ. ວິທີການທີ່ຄຸນລັກສະນະທີ່ລະອຽດອ່ອນຖືກນໍາໃຊ້ໂດຍຕົວແບບແມ່ນເປັນທີ່ຮູ້ຈັກຜົນກະທົບຕໍ່ຄວາມຍຸຕິທໍາແລະການປະຕິບັດຂອງຕົວແບບ [3,39,41,11]. ດັ່ງນັ້ນ, ພວກເຮົາໃຊ້ຕົວແບບທີ່ມີຄຸນລັກສະນະທີ່ລະອຽດອ່ອນຢ່າງຈະແຈ້ງ, ຫຼືໃນທາງກັບກັນ, ເອົາການເຂົ້າລະຫັດປະຊາກອນອອກຈາກຂໍ້ມູນການປ້ອນຂໍ້ມູນ.
ສີ່ຕົວແບບໄດ້ຖືກຝຶກອົບຮົມກ່ຽວກັບບັນຫາການຈັດປະເພດຫຼາຍປ້າຍຂອງຜົນການຄົ້ນພົບໃນ radiography ຫນ້າເອິກ (CXR). ໃນການຕັ້ງຄ່າທັງຫມົດ, ກະດູກສັນຫຼັງຂອງ Densenet-121 [13] ຖືກນໍາໃຊ້, ເຊິ່ງໄດ້ຖືກກໍານົດຢ່າງຈະແຈ້ງເພື່ອໃຫ້ປະສິດທິພາບທີ່ດີທີ່ສຸດສໍາລັບບັນຫານີ້. ສະຖາປັດຕະຍະກໍາແບບທີ່ແນ່ນອນແມ່ນສະແດງຢູ່ໃນຮູບ 2 ແລະອະທິບາຍຂ້າງລຸ່ມນີ້:
– M1 : ຕົວຈັດປະເພດພື້ນຖານໂດຍໃຊ້ຮູບພາບເປັນການປ້ອນຂໍ້ມູນ ແລະໄດ້ຮັບການຝຶກອົບຮົມເພື່ອຄາດຄະເນການຄົ້ນພົບ CXR ເປົ້າໝາຍທີ່ກ່ຽວຂ້ອງກັບຊຸດຂໍ້ມູນຂອງພວກເຮົາ. ຮູບແບບດັ່ງກ່າວປະກອບດ້ວຍກະດູກສັນຫຼັງເພື່ອສະກັດລັກສະນະຮູບພາບແລະສາຂາການຄົ້ນຫາທີ່ປະກອບດ້ວຍຊັ້ນເຊື່ອມຕໍ່ຢ່າງເຕັມສ່ວນແລະການສູນເສຍຂອງ entropy ຂ້າມ binary ສໍາລັບແຕ່ລະການຄົ້ນຫາ.
– M2 : ການຈັດປະເພດການນໍາໃຊ້ທັງຮູບພາບແລະລັກສະນະເຊື້ອຊາດເປັນການປ້ອນຂໍ້ມູນ. ຂໍ້ມູນເຊື້ອຊາດມາໃນຮູບແບບຂອງຕົວແປປະເພດ, ເຊິ່ງພວກເຮົາປ່ຽນເປັນ vector ຮ້ອນຫນຶ່ງແລະ feed ກັບ layer ເຊື່ອມຕໍ່ຢ່າງເຕັມສ່ວນ. ພວກເຮົາ concatenate ລັກສະນະຈາກຊັ້ນເຊື່ອມຕໍ່ຢ່າງເຕັມສ່ວນແລະລັກສະນະຮູບພາບກ່ອນທີ່ຈະສົ່ງຕໍ່ໄປຫາສາຂາ. ແບບຈໍາລອງແມ່ນການຝຶກອົບຮົມຈາກຈຸດຈົບ.
– M3 : ການຈັດປະເພດທີ່ໃຊ້ຮູບພາບເປັນການປ້ອນຂໍ້ມູນເທົ່ານັ້ນ, ແຕ່ໄດ້ຮັບການຝຶກອົບຮົມເພື່ອຄາດຄະເນການຄົ້ນພົບຮູບພາບເຊັ່ນດຽວກັນກັບກຸ່ມເຊື້ອຊາດ (ເຊັ່ນ: ຮູບແບບນີ້ມີຈຸດປະສົງເພື່ອໃຊ້ການເຂົ້າລະຫັດເຊື້ອຊາດທີ່ມີຢູ່ໃນຮູບພາບ). ສໍາລັບຮູບແບບນີ້, ພວກເຮົາດັດແປງຊັ້ນສຸດທ້າຍຂອງການຈັດປະເພດພື້ນຖານໂດຍການປັບຫນ້າທີ່ສູນເສຍເພື່ອເພີ່ມປະສິດທິພາບສອງຫນ້າວຽກ: ການຄົ້ນພົບ CXR ແລະກຸ່ມເຊື້ອຊາດ. ພວກເຮົາຍັງປ່ຽນຂໍ້ມູນເຊື້ອຊາດເປັນ vector encoded ຮ້ອນດຽວເພື່ອນໍາໃຊ້ການສູນເສຍຫຼາຍຊັ້ນຮຽນ. ສາຂາການຈັດປະເພດເຊື້ອຊາດແມ່ນເຮັດດ້ວຍຊັ້ນເຊື່ອມຕໍ່ຢ່າງເຕັມສ່ວນແລະຫນ້າທີ່ສູນເສຍ entropy ຂ້າມ. ການສູນເສຍສຸດທ້າຍແມ່ນຄິດໄລ່ໂດຍການເພີ່ມການຊອກຫາການສູນເສຍແລະການສູນເສຍເຊື້ອຊາດດ້ວຍການສູນເສຍນ້ໍາຫນັກ λ.
– M4 : ຕົວຈັດປະເພດທີ່ໃຊ້ຮູບພາບເປັນການປ້ອນຂໍ້ມູນ, ການຝຶກອົບຮົມເພື່ອຄາດຄະເນການຄົ້ນພົບຮູບພາບ, ໃນຂະນະທີ່ຫຼຸດຜ່ອນການໃຊ້ຂໍ້ມູນເຊື້ອຊາດທີ່ເຂົ້າລະຫັດໃນຮູບພາບ. ສໍາລັບຮູບແບບນີ້, ພວກເຮົາປະຕິບັດເຕັກນິກການປີ້ນກັບກັນ gradient ທີ່ອະທິບາຍໄວ້ໃນ [28]. ພວກເຮົານໍາໃຊ້ຊັ້ນການປີ້ນກັບກັນ gradient ກ່ອນສາຂາເຊື້ອຊາດ.
ຜູ້ຂຽນ:
(1) Samia Belhadj∗, Lunit Inc., Seoul, ສາທາລະນະລັດເກົາຫຼີ ([email protected]);
(2) Sanguk Park [0009 −0005 −0538 −5522]*, Lunit Inc., Seoul, ສາທາລະນະລັດເກົາຫຼີ ([email protected]);
(3) Ambika Seth, Lunit Inc., Seoul, ສາທາລະນະລັດເກົາຫຼີ ([email protected]);
(4) Hesham Dar [0009 −0003 −6458 −2097], Lunit Inc., Seoul, ສາທາລະນະລັດເກົາຫຼີ ([email protected]);
(5) Thijs Kooi [0009 −0003 −6458 −2097], Kooi, Lunit Inc., Seoul, Republic of Korea ([email protected]).
ເອກະສານນີ້ ມີຢູ່ໃນ arxiv ພາຍໃຕ້ໃບອະນຸຍາດ CC BY-NC-SA 4.0.