لیکوالان:
(1) Junwei Su، د کمپیوټر ساینس څانګه، د هانګ کانګ پوهنتون او [email protected]؛
(2) چوان وو، د کمپیوټر ساینس څانګه، د هانګ کانګ پوهنتون او [email protected].
5 د لنډې لارې واټن په اړه د قضیې مطالعه
9 د Eq د حل کولو طرزالعمل. (۶)
10 اضافي تجربې توضیحات او پایلې
د کمپیوټر لید او د ماشین زده کړې ډیری ستونزې په ګرافونو کې د زده کړې دندو په توګه ماډل شوي، چیرې چې د ګراف عصبي شبکې (GNNs) د ګراف جوړښت شوي ډیټا نمایندګۍ زده کړې لپاره د یوې مهمې وسیلې په توګه راپورته شوي. د GNNs یوه مهمه ځانګړنه د ګراف جوړښتونو څخه د انپټ په توګه کارول دي، دوی ته دا توان ورکوي چې د ګرافونو د موروثي ټوپولوژیکي ملکیتونو څخه ګټه پورته کړي — چې د GNNs د ټوپولوژي پوهاوي په نوم پیژندل کیږي. د GNNs تجربوي بریالیتوبونو سره سره، د عمومي کولو فعالیت باندې د ټوپولوژي پوهاوي اغیزه نا معلومه پاتې ده، په ځانګړې توګه د نوډ کچې دندو لپاره چې د معلوماتو خپلواکه او په ورته ډول ویشل شوي (IID) له انګیرنې څخه توپیر لري. د GNNs د ټوپولوژی پوهاوی دقیق تعریف او ځانګړتیا، په ځانګړې توګه د مختلفو توپولوژیکي ځانګړتیاوو په اړه، لاهم روښانه نده. دا مقاله یو هراړخیز چوکاټ معرفي کوي ترڅو د GNNs د ټاپولوژیکي پوهاوي ځانګړتیا په هر ډول ټوپولوژیکي ځانګړتیاو کې مشخص کړي. د دې چوکاټ په کارولو سره، موږ د GNN عمومي کولو فعالیت باندې د ټوپولوژي پوهاوي اغیزې څیړو. د موجوده باور برعکس چې د GNNs د ټوپولوژي پوهاوی لوړول تل ګټور دي، زموږ تحلیل یو مهم بصیرت څرګندوي: د GNNs د ټوپولوژي پوهاوی ښه کول ممکن په ناببره توګه په جوړښتي ډلو کې د غیر عادلانه عمومي کولو لامل شي، کوم چې ممکن په ځینو سناریوګانو کې مطلوب نه وي. برسیره پردې، موږ د داخلي ګراف میټریک په کارولو سره د قضیې مطالعه ترسره کوو، د لنډې لارې فاصله، په مختلفو بنچمارک ډیټاسیټونو کې. د دې قضیې مطالعې تجربې پایلې زموږ نظري بصیرت تاییدوي. سربیره پردې، موږ د ګراف فعال زده کړې کې د سړې پیل ستونزې سره د مبارزې لپاره د دې په کارولو سره د خپل چوکاټ عملي تطبیق ښیې.
د کمپیوټر لید او ماشین زده کړې کې ډیری ستونزې په ګرافونو کې د زده کړې دندو په توګه ماډل شوي. د مثال په توګه، په سیمانټیک برخو کې، ګرافونه د مختلف انځور سیمو ترمنځ اړیکې نمونې کوي، دقت لوړول او د شرایطو پوهه قطع کول. د ګراف عصبي شبکې (GNNs) د ماشین زده کړې ماډلونو د غالب ټولګي په توګه راپورته شوي چې په ځانګړي توګه د ګراف جوړښت شوي ډیټا نمایندګۍ زده کړې لپاره ډیزاین شوي. دوی په مختلفو ډومینونو لکه کیمیا [10]، بیولوژي [37]، ټولنیز شبکې [6, 22]، د صحنې ګراف تولید [46, 51] او د لید اړیکو کشف کې د ګراف پورې اړوند ستونزو پراخه لړۍ په نښه کولو کې د پام وړ بریالیتوب ښودلی دی. [24,43,49]. د GNNs یوه مشخصه ځانګړتیا دا ده چې د ګراف جوړښت ته د پیغام لیږد له لارې د فیچر راټولولو لپاره د ځایي چلند کارول دي. دا GNNs ته دا وړتیا ورکوي چې ساختماني معلومات یا انحصار (د ټوپولوژي پوهاوي په نوم یادیږي) د اصلي ګراف جوړښت څخه خوندي کړي، دوی ته اجازه ورکوي چې د نوډ طبقه بندي په څیر کارونو کې خورا اغیزمن وي. انځور 1 د GNNs د زده کړې ټولیز بهیر روښانه کوي.
د دوی د عملي کیدو او امکاناتو سره سره، د GNNs په اړه د نظري پوهې نشتوالی پاتې دی، په ځانګړې توګه د نیمه نظارت شوي نوډ طبقه بندي ترتیب کې چیرې چې د معلوماتو تر مینځ انحصار د ماشین زده کړې نورو ماډلونو څخه د پام وړ توپیر لري [25]. په دې ترتیب کې، هدف د اړیکو ګټه اخیستل دي، لکه څنګه چې د ګراف جوړښت لخوا نیول شوي، د معلوماتو او لیبل شوي نوډونو یو کوچنی سیټ تر منځ د پاتې نوډونو لپاره د لیبلونو وړاندوینه کول. د GNNs ډیری موجوده تیوریکي مطالعاتو د GNNs د پیغام لیږد میکانیزم او Weisfeiler-Lehman isomorphism test [19] تر مینځ اړیکې باندې تمرکز کړی ، چې هدف یې د GNNs وړتیا باندې پوهیدل دي چې په زده شوي نمایندګیو کې د مختلف ګراف جوړښتونو توپیر کولو لپاره پیژندل شوي. د GNNs د څرګند ځواک په توګه. د څرګندولو مطالعاتو څخه الهام اخیستل، دا عموما په دې باور دي چې د ټوپولوژي پوهاوی زیاتوالی په نړیواله کچه ګټور دی او ډیری مطالعې د GNNs وړ کولو باندې تمرکز کوي ترڅو په زده شوي نمایش کې نور ساختماني ملکیتونه وساتي [29, 33, 48].
په هرصورت، لکه څنګه چې GNNs د ان پټ په توګه د ګراف جوړښت په اړه ډیر تکیه کوي او حساس (خبرتیا) لري، دوی ممکن د ډیټا دننه د ځانګړو ساختماني فرعي ګروپونو په وړاندې د عمومي کولو مختلف فعالیتونه نندارې ته وړاندې کړي (د ډیټا ځانګړي فرعي سیټونه چې د روزنې سیټ سره د ساختماني ورته والی لخوا ګروپ شوي). په جلا جوړښتي فرعي ګروپونو کې د GNN عمومي کولو اندازه کول د ساختماني فرعي ګروپ عمومي کولو په نوم یادیږي [25]. دا ډول نظرونه د GNN غوښتنلیک او پراختیا کې حیاتي دي. د مثال په توګه، د پروټین - پروټین متقابل عمل شبکې کې، دا ساختماني فرعي ګروپونه کولی شي د مختلف مالیکولر پیچلتیا استازیتوب وکړي، د تعامل وړاندوینې دقت اغیزه کوي. په ورته ډول، پوهیدل چې څنګه د GNNs د ټوپولوژي پوهاوی په عمومي کولو اغیزه کوي کله چې د روزنې لپاره د نمونې کولو ستراتیژیو طرح کول اړین دي. تر کومه حده چې د GNNs عمومي کولو فعالیت د ګراف ډیټا ځانګړي جوړښتي ځانګړتیاو لخوا اغیزمن کیږي د روزنې ډیټاسیټونو جوړښت پریکړه کولو کې خورا مهم دی. د دې اهمیت سره سره، د GNNs او د دې ساختماني فرعي ګروپ عمومي کولو لپاره د ټوپولوژي پوهاوي ترمنځ د اړیکو پوهه لاهم شتون نلري. برسېره پردې، د GNNs د ټوپولوژي پوهاوی ځانګړتیا یوه ننګونه ده، په ځانګړې توګه د دې په پام کې نیولو سره چې مختلف ډومینونه او دندې ممکن جلا جوړښتي اړخونو ته لومړیتوب ورکړي. له همدې امله، د مختلفو جوړښتونو په اړه د GNNs د ټوپولوژي پوهاوي ارزولو لپاره یو څو اړخیز چوکاټ ته اړتیا ده.
د دې تشې د حل کولو لپاره، په دې مقاله کې، موږ د نیمه څارل شوي نوډ طبقه بندي کولو په شرایطو کې د ساختماني فرعي ګروپ عمومي کولو او د GNNs د ټوپولوژي پوهاوي ترمنځ د اړیکو مطالعې لپاره د نږدې میټریک ایمبیډینګ پر بنسټ یو نوی چوکاټ وړاندیز کوو. وړاندیز شوی چوکاټ د مختلفو ساختماني فرعي ګروپونو په اړه د GNNs ساختماني فرعي ګروپ عمومي کولو تحقیق ته اجازه ورکوي. په دقیق ډول، د دې کار اصلي ونډې په لاندې ډول لنډیز شوي.
1. موږ د GNNs ساختماني فرعي ګروپ عمومي کولو او د ټوپولوژي پوهاوي تر مینځ د متقابل عمل معاینه کولو لپاره د نږدې میټریک ایمبیډینګ په کارولو سره یو ناول ، جوړښت - اګنوسټیک چوکاټ وړاندیز کوو. دا چوکاټ هر اړخیز دی، مختلف ساختماني اقدامات لکه د لنډې لارې فاصله ځای په ځای کوي، او یوازې ورته ساختماني اندازې ته اړتیا لري. د کلیدي فکتورونو اټکل کولو کې د هغې سادگي دا په پراخه کچه سناریوګانو کې د تطبیق وړ او عمومي کولو وړ ګرځوي.
2. زموږ په چوکاټ کې د رسمي تحلیل له لارې، موږ د GNN ټوپولوژي پوهاوی او د دوی د عمومي کولو فعالیت (Theorem 1) ترمنځ روښانه اړیکه رامینځته کوو. موږ دا هم په ډاګه کوو چې په داسې حال کې چې د ټوپولوژي پوهاوی لوړول د GNN اظهار ته وده ورکوي، دا کولی شي د غیر مساوي عمومي کولو فعالیت پایله ولري، د فرعي ګروپونو سره د روزنې سیټ ته ورته جوړښت سره ورته وي (تیوریم 2). دا ډول ساختماني ملکیت ممکن زیانمن وي (د نا انصافۍ مسلې رامینځته کوي) یا ګټور (د ډیزاین پریکړو خبرتیا) د سناریو پورې اړه لري. دا موجوده باور ننګوي چې د ټوپولوژي پوهاوی زیاتوالی په نړیواله کچه GNNs ته ګټه رسوي [29, 33, 48]، د ټوپولوژي پوهاوي او عمومي کولو فعالیت تر مینځ د اړیکو په پام کې نیولو باندې ټینګار کوي.
3. موږ د لنډې لارې په فاصله کې د قضیې مطالعې له لارې خپل چوکاټ تایید کوو، د دې عمليیت او تړاو په ګوته کوي. پایلې زموږ نظري موندنې تاییدوي، دا ښیي چې GNNs د لنډې لارې واټن په اړه د لوړ پوهاوي سره د روزنې سیټ ته نږدې د عمودی ګروپونو طبقه بندي کولو کې غوره دي. برسېره پردې، موږ وښایه چې څنګه زموږ موندنې د ګراف فعال زده کړې [11,15] کې د سړې پیل ستونزې کمولو لپاره پلي کیدی شي، زموږ د چوکاټ او پایلو عملي اغیزې روښانه کوي.
دا پاڼه د CC BY 4.0 DEED جواز لاندې په آرکسیو کې شتون لري .