Uthorsazyjylar:
(1) Makao uniwersitetinden Jianhui Pang we Jianhui Pang we Fanghua Ye Tencent AI laboratoriýasynda ([email protected]) interwensiýa edeniňizde edildi;
(2) Fanghua Ye, London uniwersitet kolleji we Jianhui Pang we Fanghua Ye Tencent AI laboratoriýasyna ([email protected]) interwensiýa edeniňizde edildi;
(3) Derek F. Wong, Makao uniwersiteti;
(4) Longyue Wang, Tencent AI laboratoriýasy we degişli ýazyjy.
3 Gämi esasly Uly Dil Modelleri
3.2 Gämi esasly öz-özüne üns beriş torlary
4 Synag we 4.1 Biziň durmuşa geçirişimiz
7 Netije, çäklendirmeler, etika beýany we salgylanmalar
Gözlegimizde, netijelerimize baha bermek üçin dürli tekst uzynlygy bolan dürli ölçegler toplumyny ulanýarys, şol sanda OpenBookQA (OBQA) (Mihaýlow we başg., 2018), WinoGrande (WG) (Sakaguchi we başg., 2021), ARC-aňsat. . , 2017) we BoolQ (Klark we başg., 2019). Bu görkezijiler pikirlenmek, düşünmek, fiziki dünýä düşünmek we geljekdäki wakalary çaklamak ýaly dürli taraplara giňişleýin baha bermegi üpjün edýär. Möhümi, olar dürli uzynlykdaky tekstleri öz içine alýar, OBQA-nyň gysga giriş şertlerinden başlap, BoolQ-daky uzyn tekstlere çenli dürli meseleler we tekst çylşyrymlylygy boýunça modelimiziň işine doly baha bermäge kömek edýär. Modellerimiziň takyklygyny we netijeliligini ölçemek üçin, nol atyş we bäş atyş sazlamalary üçin üç aýratyn ölçeg ulanyp, üç ölçeg boýunça baha berýäris. Bäş okly ýagdaýda AnLLMAC üçin, her demonstrasiýanyň ahyrynda labyr belligini goşýarys.
• Takyklyk (Acc). Bu adaty ölçeg, modelleriň çaklama takyklygyny kesgitlemek üçin ulanylýar. Öňki gözleglere (Gao we başg., 2023) laýyklykda, çaklamalar hökmünde iň ýokary ähtimallyklary saýlaýarys we altyn standart ýazgylary ulanyp takyklygy hasaplaýarys.
• Düwmeler / bahalar keş keşbini azaltmak (C⇓). Bäş okly baha bermegiň çäginde, görkezişler soňraky ulanmak üçin GPU ýadynda saklanyp bilner. Muňa garamazdan, uzaldylan görkezişler ýadyň sarp edilmegini talap edip biler. Bu ölçeg, AnSAN tehnikasynyň ýadyň netijeliligini bahalandyrmak üçin döredildi.
• Çalt tizlenme gatnaşygy (T⇑). Wang we ş.m. (2023), keş görnüşli düwmelerden / bahalardan peýdalanyp, AnSAN tehnikasynyň netijeliliginiň görkezijisi bolup hyzmat edýän Inferensiýa tizlenme gatnaşygyny hödürleýäris.
Ilki bilen ähli modeller üçin doly üns beriş netijelerini habar berýäris, soňra bolsa yzygiderli maglumatlary labyr belliklerine gysyp, ulanylýan AnSAN usuly (+ AnSAN) bilen hödürleýäris.
Bu kagyz, CC BY 4.0 DEED ygtyýarnamasy boýunça arxiv-de elýeterlidir .