paint-brush
په ګراف عصبي شبکو کې د توپولوژي پوهاوی پوهیدل: په عمومي کولو او جوړښت باندې اغیزې لخوا@computational
نوی تاریخ

په ګراف عصبي شبکو کې د توپولوژي پوهاوی پوهیدل: په عمومي کولو او جوړښت باندې اغیزې

ډېر اوږد؛ لوستل

دا مقاله په ګراف عصبي شبکو (GNNs) کې د ټوپولوژي پوهاوي او عمومي کولو فعالیت تر مینځ اړیکې تحلیل کولو لپاره چوکاټ معرفي کوي. دا په ډاګه کوي چې د ټوپولوژي پوهاوی زیاتوالی کولی شي په ساختماني فرعي ګروپونو کې د غیر مساوي عمومي کولو لامل شي، دا انګیرنه ننګوي چې د ټوپولوژي پوهاوي لوړول تل ګټور وي. د لنډې لارې فاصلې په اړه د قضیې مطالعه دا موندنې تاییدوي او د ګراف فعال زده کړې کې د سړې پیل ستونزې کمولو کې عملي غوښتنلیکونه روښانه کوي.
featured image - په ګراف عصبي شبکو کې د توپولوژي پوهاوی پوهیدل: په عمومي کولو او جوړښت باندې اغیزې
Computational Technology for All HackerNoon profile picture
0-item

لیکوالان:

(1) Junwei Su، د کمپیوټر ساینس څانګه، د هانګ کانګ پوهنتون او [email protected]؛

(2) چوان وو، د کمپیوټر ساینس څانګه، د هانګ کانګ پوهنتون او [email protected].

د لینکونو جدول

لنډیز او 1 پیژندنه

2 اړونده کار

3 چوکاټ

4 اصلي پایلې

5 د لنډې لارې واټن په اړه د قضیې مطالعه

6 پایله او بحث، او حوالې

7 د تیورم ثبوت 1

8 د تیورم ثبوت 2

9 د Eq د حل کولو طرزالعمل. (۶)

10 اضافي تجربې توضیحات او پایلې

11 نور احتمالي غوښتنلیکونه

خلاصون

د کمپیوټر لید او د ماشین زده کړې ډیری ستونزې په ګرافونو کې د زده کړې دندو په توګه ماډل شوي، چیرې چې د ګراف عصبي شبکې (GNNs) د ګراف جوړښت شوي ډیټا نمایندګۍ زده کړې لپاره د یوې مهمې وسیلې په توګه راپورته شوي. د GNNs یوه مهمه ځانګړنه د ګراف جوړښتونو څخه د انپټ په توګه کارول دي، دوی ته دا توان ورکوي چې د ګرافونو د موروثي ټوپولوژیکي ملکیتونو څخه ګټه پورته کړي — چې د GNNs د ټوپولوژي پوهاوي په نوم پیژندل کیږي. د GNNs تجربوي بریالیتوبونو سره سره، د عمومي کولو فعالیت باندې د ټوپولوژي پوهاوي اغیزه نا معلومه پاتې ده، په ځانګړې توګه د نوډ کچې دندو لپاره چې د معلوماتو خپلواکه او په ورته ډول ویشل شوي (IID) له انګیرنې څخه توپیر لري. د GNNs د ټوپولوژی پوهاوی دقیق تعریف او ځانګړتیا، په ځانګړې توګه د مختلفو توپولوژیکي ځانګړتیاوو په اړه، لاهم روښانه نده. دا مقاله یو هراړخیز چوکاټ معرفي کوي ترڅو د GNNs د ټاپولوژیکي پوهاوي ځانګړتیا په هر ډول ټوپولوژیکي ځانګړتیاو کې مشخص کړي. د دې چوکاټ په کارولو سره، موږ د GNN عمومي کولو فعالیت باندې د ټوپولوژي پوهاوي اغیزې څیړو. د موجوده باور برعکس چې د GNNs د ټوپولوژي پوهاوی لوړول تل ګټور دي، زموږ تحلیل یو مهم بصیرت څرګندوي: د GNNs د ټوپولوژي پوهاوی ښه کول ممکن په ناببره توګه په جوړښتي ډلو کې د غیر عادلانه عمومي کولو لامل شي، کوم چې ممکن په ځینو سناریوګانو کې مطلوب نه وي. برسیره پردې، موږ د داخلي ګراف میټریک په کارولو سره د قضیې مطالعه ترسره کوو، د لنډې لارې فاصله، په مختلفو بنچمارک ډیټاسیټونو کې. د دې قضیې مطالعې تجربې پایلې زموږ نظري بصیرت تاییدوي. سربیره پردې، موږ د ګراف فعال زده کړې کې د سړې پیل ستونزې سره د مبارزې لپاره د دې په کارولو سره د خپل چوکاټ عملي تطبیق ښیې.

۱. پېژندنه

د کمپیوټر لید او ماشین زده کړې کې ډیری ستونزې په ګرافونو کې د زده کړې دندو په توګه ماډل شوي. د مثال په توګه، په سیمانټیک برخو کې، ګرافونه د مختلف انځور سیمو ترمنځ اړیکې نمونې کوي، دقت لوړول او د شرایطو پوهه قطع کول. د ګراف عصبي شبکې (GNNs) د ماشین زده کړې ماډلونو د غالب ټولګي په توګه راپورته شوي چې په ځانګړي توګه د ګراف جوړښت شوي ډیټا نمایندګۍ زده کړې لپاره ډیزاین شوي. دوی په مختلفو ډومینونو لکه کیمیا [10]، بیولوژي [37]، ټولنیز شبکې [6, 22]، د صحنې ګراف تولید [46, 51] او د لید اړیکو کشف کې د ګراف پورې اړوند ستونزو پراخه لړۍ په نښه کولو کې د پام وړ بریالیتوب ښودلی دی. [24,43,49]. د GNNs یوه مشخصه ځانګړتیا دا ده چې د ګراف جوړښت ته د پیغام لیږد له لارې د فیچر راټولولو لپاره د ځایي چلند کارول دي. دا GNNs ته دا وړتیا ورکوي چې ساختماني معلومات یا انحصار (د ټوپولوژي پوهاوي په نوم یادیږي) د اصلي ګراف جوړښت څخه خوندي کړي، دوی ته اجازه ورکوي چې د نوډ طبقه بندي په څیر کارونو کې خورا اغیزمن وي. انځور 1 د GNNs د زده کړې ټولیز بهیر روښانه کوي.


د دوی د عملي کیدو او امکاناتو سره سره، د GNNs په اړه د نظري پوهې نشتوالی پاتې دی، په ځانګړې توګه د نیمه نظارت شوي نوډ طبقه بندي ترتیب کې چیرې چې د معلوماتو تر مینځ انحصار د ماشین زده کړې نورو ماډلونو څخه د پام وړ توپیر لري [25]. په دې ترتیب کې، هدف د اړیکو ګټه اخیستل دي، لکه څنګه چې د ګراف جوړښت لخوا نیول شوي، د معلوماتو او لیبل شوي نوډونو یو کوچنی سیټ تر منځ د پاتې نوډونو لپاره د لیبلونو وړاندوینه کول. د GNNs ډیری موجوده تیوریکي مطالعاتو د GNNs د پیغام لیږد میکانیزم او Weisfeiler-Lehman isomorphism test [19] تر مینځ اړیکې باندې تمرکز کړی ، چې هدف یې د GNNs وړتیا باندې پوهیدل دي چې په زده شوي نمایندګیو کې د مختلف ګراف جوړښتونو توپیر کولو لپاره پیژندل شوي. د GNNs د څرګند ځواک په توګه. د څرګندولو مطالعاتو څخه الهام اخیستل، دا عموما په دې باور دي چې د ټوپولوژي پوهاوی زیاتوالی په نړیواله کچه ګټور دی او ډیری مطالعې د GNNs وړ کولو باندې تمرکز کوي ترڅو په زده شوي نمایش کې نور ساختماني ملکیتونه وساتي [29, 33, 48].


په هرصورت، لکه څنګه چې GNNs د ان پټ په توګه د ګراف جوړښت په اړه ډیر تکیه کوي او حساس (خبرتیا) لري، دوی ممکن د ډیټا دننه د ځانګړو ساختماني فرعي ګروپونو په وړاندې د عمومي کولو مختلف فعالیتونه نندارې ته وړاندې کړي (د ډیټا ځانګړي فرعي سیټونه چې د روزنې سیټ سره د ساختماني ورته والی لخوا ګروپ شوي). په جلا جوړښتي فرعي ګروپونو کې د GNN عمومي کولو اندازه کول د ساختماني فرعي ګروپ عمومي کولو په نوم یادیږي [25]. دا ډول نظرونه د GNN غوښتنلیک او پراختیا کې حیاتي دي. د مثال په توګه، د پروټین - پروټین متقابل عمل شبکې کې، دا ساختماني فرعي ګروپونه کولی شي د مختلف مالیکولر پیچلتیا استازیتوب وکړي، د تعامل وړاندوینې دقت اغیزه کوي. په ورته ډول، پوهیدل چې څنګه د GNNs د ټوپولوژي پوهاوی په عمومي کولو اغیزه کوي کله چې د روزنې لپاره د نمونې کولو ستراتیژیو طرح کول اړین دي. تر کومه حده چې د GNNs عمومي کولو فعالیت د ګراف ډیټا ځانګړي جوړښتي ځانګړتیاو لخوا اغیزمن کیږي د روزنې ډیټاسیټونو جوړښت پریکړه کولو کې خورا مهم دی. د دې اهمیت سره سره، د GNNs او د دې ساختماني فرعي ګروپ عمومي کولو لپاره د ټوپولوژي پوهاوي ترمنځ د اړیکو پوهه لاهم شتون نلري. برسېره پردې، د GNNs د ټوپولوژي پوهاوی ځانګړتیا یوه ننګونه ده، په ځانګړې توګه د دې په پام کې نیولو سره چې مختلف ډومینونه او دندې ممکن جلا جوړښتي اړخونو ته لومړیتوب ورکړي. له همدې امله، د مختلفو جوړښتونو په اړه د GNNs د ټوپولوژي پوهاوي ارزولو لپاره یو څو اړخیز چوکاټ ته اړتیا ده.


د دې تشې د حل کولو لپاره، په دې مقاله کې، موږ د نیمه څارل شوي نوډ طبقه بندي کولو په شرایطو کې د ساختماني فرعي ګروپ عمومي کولو او د GNNs د ټوپولوژي پوهاوي ترمنځ د اړیکو مطالعې لپاره د نږدې میټریک ایمبیډینګ پر بنسټ یو نوی چوکاټ وړاندیز کوو. وړاندیز شوی چوکاټ د مختلفو ساختماني فرعي ګروپونو په اړه د GNNs ساختماني فرعي ګروپ عمومي کولو تحقیق ته اجازه ورکوي. په دقیق ډول، د دې کار اصلي ونډې په لاندې ډول لنډیز شوي.


1. موږ د GNNs ساختماني فرعي ګروپ عمومي کولو او د ټوپولوژي پوهاوي تر مینځ د متقابل عمل معاینه کولو لپاره د نږدې میټریک ایمبیډینګ په کارولو سره یو ناول ، جوړښت - اګنوسټیک چوکاټ وړاندیز کوو. دا چوکاټ هر اړخیز دی، مختلف ساختماني اقدامات لکه د لنډې لارې فاصله ځای په ځای کوي، او یوازې ورته ساختماني اندازې ته اړتیا لري. د کلیدي فکتورونو اټکل کولو کې د هغې سادگي دا په پراخه کچه سناریوګانو کې د تطبیق وړ او عمومي کولو وړ ګرځوي.


انځور 1. په 2-پرت GNN کې د زده کړې پروسې یوه بیلګه. د پیغام لیږدولو میکانیزم د معلوماتو راټولولو لپاره د ګراف جوړښت څخه ګټه پورته کوي، په دې توګه د هدف عمودی a (په سور کې روښانه شوی) لپاره نمایش/ایمبیډنګ ha پیدا کوي.


2. زموږ په چوکاټ کې د رسمي تحلیل له لارې، موږ د GNN ټوپولوژي پوهاوی او د دوی د عمومي کولو فعالیت (Theorem 1) ترمنځ روښانه اړیکه رامینځته کوو. موږ دا هم په ډاګه کوو چې په داسې حال کې چې د ټوپولوژي پوهاوی لوړول د GNN اظهار ته وده ورکوي، دا کولی شي د غیر مساوي عمومي کولو فعالیت پایله ولري، د فرعي ګروپونو سره د روزنې سیټ ته ورته جوړښت سره ورته وي (تیوریم 2). دا ډول ساختماني ملکیت ممکن زیانمن وي (د نا انصافۍ مسلې رامینځته کوي) یا ګټور (د ډیزاین پریکړو خبرتیا) د سناریو پورې اړه لري. دا موجوده باور ننګوي چې د ټوپولوژي پوهاوی زیاتوالی په نړیواله کچه GNNs ته ګټه رسوي [29, 33, 48]، د ټوپولوژي پوهاوي او عمومي کولو فعالیت تر مینځ د اړیکو په پام کې نیولو باندې ټینګار کوي.


3. موږ د لنډې لارې په فاصله کې د قضیې مطالعې له لارې خپل چوکاټ تایید کوو، د دې عمليیت او تړاو په ګوته کوي. پایلې زموږ نظري موندنې تاییدوي، دا ښیي چې GNNs د لنډې لارې واټن په اړه د لوړ پوهاوي سره د روزنې سیټ ته نږدې د عمودی ګروپونو طبقه بندي کولو کې غوره دي. برسېره پردې، موږ وښایه چې څنګه زموږ موندنې د ګراف فعال زده کړې [11,15] کې د سړې پیل ستونزې کمولو لپاره پلي کیدی شي، زموږ د چوکاټ او پایلو عملي اغیزې روښانه کوي.


دا پاڼه د CC BY 4.0 DEED جواز لاندې په آرکسیو کې شتون لري .