المؤلفين : Xiaoxin Yin المؤلفين : شياوين Yin TABLE OF LINKS جدول اليمين Abstract abstract 1 Introduction 1 إدراج 2 Related Work 2 الأعمال ذات الصلة 3 The Seven Qualification Tests for an AI Scientist 7 اختبارات الكفاءة لمتعلم AI معايير الاختيار اختبار نموذج هليكوستريك إجراء اختبار القانون اختبار الأقمار الصناعية Vibrating Strings اختبار المعادلات ماكسول اختبار مشكلة القيمة الأولي اختبار Huffman Coding اختبار التقويم التقويم 4 Discussions 4 محادثات هل يمكن لأي AI أن ينتصر على هذه الاختبارات؟ لماذا نحتاج إلى هذه الاختبارات؟ 5 Conclusions and Future Work and References 5 النتائج والعمل المستقبلي والمقالات Abstract abstract وقد أظهرت هذه التحديات المتسارعة في هذا المجال التقديرات الفعالة للعملاء في هذا المجال، حيث أظهرت التقديرات الفعالة للعملاء في مجال الأبحاث الفعالة للقيام بمهام محدودة سابقاً على البشر، بما في ذلك البحوث العلمية. في حين أن هذه الماجستير في مجال الأبحاث قد أظهرت القدرة الإثارة في حل المواد العلمية أو اختبارات الكمبيوتر، فإن القدرة على إجراء الاختبارات العلمية لا تزال تحدياً واضحاً. في هذه المقالة، يقدم هذا الاختبار "تقييماً جديداً للعملاء في مجال الأبحاث الفعالة للعملاء في مختلف المجالات العلمية" لتقييم ما إذا كان عملاء الأبحاث الفعالة في مجال الأبحاث الفع 1 Introduction 1 إدراج وقد أظهرت الدراسات الأخيرة أن LLMs مثل GPT-4، Microsoft Copilot[2]، و CodeLlama[3] يمكن حل مشكلات التدوين في مستوى المنافسة [4]، و LLMs مثل GPT-4 و Llemma[5] يمكن حل بعض مشكلات التدوين في مستوى المنافسة في مستوى المدرسة الثانوية (بما في ذلك بعض مشكلات في مستوى IMO). هذه LLMs يمكن أن تساعد الباحثين على حل بعض المشكلات التي تواجهها في دراستهم اليومية. ومع ذلك، يمكن حل نوع من مشكلات التدوين المحددة بشكل جيد هو مختلف تمامًا عن تحقيق اكتشافات في البحوث العلمية. على سبيل المثال، من أجل تدريب LLM حل مشكلات التدوين، وهي مشكلة أساسية غالبا ما تساعد الباحثين على حل جميع الملفات العامة على Git هذا هو في الأساس نفس المنهجية التي تستخدم لتدريب نموذج لإدخال النصوص بعد قراءة الملايين من النصوص. فإنه ليس لديه القدرة على اكتشاف ما لم يتعلم، مما يجعلها غير قادرة على جعل اكتشافات علمية مثل العلماء. هذا يجعل من الضروري تحديد "تحقيق الكفاءة للعلماء في مجال الذكاء الاصطناعي". إذا كان عامل الذكاء الاصطناعي يمكن أن ينتهي هذا التحقيق دون مساعدة من البشر، يمكننا أن ننتهي إلى أن هذا العلماء يقدرون كمدير علميا ويمكن أن يمارس البحث العلمي بنفسه. هذا يشبه اختبار توريينغ، الذي تم طرحه ألان توريغ في عام 1950 ويعمل كجزء أساسي في مجال الذكاء الاصطناعي، ويشكل وتشكل السماء الليلية دورًا أساسيًا في الانتقال إلى الأساليب العلمية الحديثة، على سبيل المثال من خلال جهود الكاثوليكيميين مثل جوهانس كافلر وغاليليو غاليلي. تمثل قوانين كافلر من الحركة الكوكبية، التي تأتي من مراقبة ملموسة من السماء الليلية، أساسًا لتصميم اللوسيكوتروني من النظام الشمسي، وأخيرًا لتصميم نيوتن للعلوم المعاصرة. تمثل اعتمادها على البيانات الأكاديمية والتجارب الديموغرافية إزعاجًا كبيرًا من الفلسفات التقديرية التي كانت تسيطر على المسرح العلمي سابقًا. وبالتالي فإن طريقة غاليليو لتكامل الأدلة التجارية مع تحليلات هذا يتطلب من وكيل الذكاء الاصطناعي اكتشاف القوانين التي تدعم حركات الأشياء السماوية، وتطبيقها في إطار متكامل. كما يتطلب من وكيل الذكاء الاصطناعي إجراء اختراعات ناجعة مثل الأرض مما يُشبه الكواكب في السماء الليلية. كلا الطلباتين ضرورية للعلماء. من أجل أن تكون اختبارًا متكاملًا جيدًا للعلماء الذكاء الاصطناعي، يجب أن يوفر اختبارًا كميًّا كبيرًا من البيانات أو بيئة تفاعلية. على سبيل المثال، يمكن الوصول إلى موقع أي من الأشياء السماوية الملاحظة في أي لحظة من خلال مكتبة AstroPy[7]. استنادًا إلى معاييرين أعلاه، نموذج هليكوستري: مع مكتبة Python التفاعلية[7] التي توفر تقييمات أي من الأجسام السماوية الملاحظة في السماء الليلية في أي لحظة معينة، يمكنك التحقق من ما إذا كان وكيل الذكاء الاصطناعي يمكن أن يؤدي إلى ثلاثة قوانين كيبلر وتأكيد أن جميع الكواكب تتحرك حول الشمس. قوانين الحركة: مع وجود مكتبة تفاعلية تؤدّي إلى السيطرة على Minecraft[10], تحقق من أن عامل الذكاء الاصطناعي يمكن أن يكتشف قانون الحركة و قانون التضخم (وهي فقط للحركة الجوهرية). أدوات التفكير: أدوات التفكير هي واحدة من أهم المشاكل التي أدت إلى تطوير التفاعلات التفاعلية[11].بما أن مكتبة PYTHON توفر موقع كل نقطة على أدوات التفكير من العديد من الظواهر البديلة المختلفة، فمن الممكن أن يكتشف عامل الذكاء الاصطناعي التفاعل التفاعلي الذي يسيطر على الحركة: حيث u(x ، t) هو التحرك من الشريط ، c هو سرعة التوسع في الشريط ، t هو الوقت ، و x هو الترتيب الإقليمي على طول الشريط. ويعتبر التقييمات ماكسولية غالباً أفضل التقييمات في الفيزياء.بما يوفره نموذج التقييمات الكهربائية القائمة على Python[12], تحقق ما إذا كان عامل الذكاء الاصطناعي يمكن أن يؤكد التقييمات ماكسولية أو أشكالها المماثلة. 4 ـ معادلات ماكسول: ويبدو أن IVP هو المشكلة الأكثر أهمية في الحسابات الرقمية، ويبدو أن طريقة Runge-Kutta[13] التي اختفت في أواخر القرن التاسع عشر لا تزال تستخدم على نطاق واسع اليوم، مع توفر أدوات الرياضية مثل SymPy[8] و NumPy[9] التي يمكن أن تحصل على مجموعات من الوظائف على نطاق نموذجي ومتناسق، فمن الممكن أن يكتشف وكيل الذكاء الاصطناعي طريقة IVP التي هي على الأقل دقيقة مثل طريقة Runge-Kutta من النظام الرابع. مشكلة القيمة الأولي (IVP): مع وجود مجموعة كبيرة من العناوين Ascii، وتوفر Python وظائف للعمل على بطاقات، يمكنك التحقق من ما إذا كان عامل الذكاء الاصطناعي يمكن أن يكتشف إدماج Huffman عند العمل نحو هدف الحد من الامتصاص تحت الحد من أن كل شخص يمثل سلسلة محددة من 0 و 1. هافمان كود: مع النظر في عدد كبير جدا من أمثلة تخصيص المجموعات الكبيرة وبيئة Python ، فمن الممكن أن يكتشف AI ألغاز التخصيص التي تعمل في الوقت المتوقع O(n log n). 7 - تقسيم الألغاز: يرجى ملاحظة أن كل عملية اختبارية تحتاج فقط إلى البيانات أو التفاعلات داخل نطاق GO جيدًا (مثل مجموعة البيانات أو مكتبة تفاعلية). هذا يجعل من الممكن لموظف AI أن يقدم اكتشافات دون تدريب على الوثائق المكتوبة بشريًا، والتي قد تنتج معلومات حول اكتشافات الهدف. لسبب نفسه لا نختار أي اختبارات من العديد من التخصصات الأكثر أهمية، مثل الكيمياء والبيولوجيا والبيولوجيا، لأنها تحتاج أيضًا إلى التفاعل مع العالم الفيزيائي أو لديها كمية محدودة من الاحتمالات. لذلك لماذا نحتاج الآن إلى الحصول على هذه الاختبارات الهامة في هذه التخصصات، والتي تم اكتشافها قبل عقود أو قرون؟ هو السبب الأهم في أن العمر هذه المقالة متوفرة في archiv تحت سياسة CC by 4.0 Deed (Attribution 4.0 International). هذه الرسالة هي تحت رخصة CC by 4.0 Deed (Attribution 4.0 International). متوفرة في Archive متوفرة في Archive