Skip to content

المستوى الأول: في عصر الذكاء الاصطناعي، إذا كنت تستطيع التحدث، يمكنك البرمجة

هذا تعليمي تعليمي مبني على التعلم بالمشاريع. نشجعك على اتباع الخطوات خطوة بخطوة ومحاولة إعادة إنشاء النتائج. لا تقلق بشأن ارتكاب الأخطاء أو تعديل المحتوى، نحن نؤمن دائمًا بأنك تستطيع القيام بذلك، تذكر دائمًا:

الإنجاز أهم من الكمال 🐣

دليل هذا الفصل

🎯本章学习目标
برمجة الذكاء الاصطناعي الحواريةألعاب أصلية بالذكاء الاصطناعيمشروع عملي: لعبة الثعبان

إذا كنت لا تعرف أي شيء عن البرمجة على الإطلاق، أو تعرف فقط القليل، فهذا الفصل مُعد لك. سنبدأ من الأساسيات: استخدام طريقة الحوار لجعل الذكاء الاصطناعي يساعدك في كتابة الأكواد، بدون الحاجة لحفظ القواعد أو تهيئة البيئة، يمكنك تشغيل كل شيء مباشرة على صفحة الويب.

ستصنع بنفسك أول برنامج قابل للتشغيل - لعبة ثعبان تأكل الكلمات وتكتب الشعر وترسم. من خلال هذا المشروع العملي، ستختبر ما يعنيه البرمجة بالذكاء الاصطناعي حقًا: ليس أن الذكاء الاصطناعي يحل محل تفكيرك، بل أنت تعبر عن أفكارك والذكاء الاصطناعي يساعدك على تحقيقها.

كل الإبداع يبدأ من الصفر إلى الواحد، يسعدنا أن ننقل لك كل جزء من الثقة والاحترافية، بالنسبة لك، القدرة على التنفيذ هي كل ما تحتاجه.

⏱️
预计耗时
حوالي 4 ساعات، يمكن إكمالها على عدة مراحل
📦
预期产出
لعبة ثعبان أصلية بالذكاء الاصطناعي + لعبة مبتكرة خاصة بك
1 لعبة ثعبان أصلية بالذكاء الاصطناعي قابلة للتشغيل + (اختياري) 1 لعبة أو Demo أصلية بالذكاء الاصطناعي ابتكرتها بنفسك

1. تحديات وفرص الأشخاص العاديين

الكثير من الناس لديهم حزمة من الأفكار للمنتجات: أداة صغيرة للمحاسبة، صفحة ويب لتسجيل نمو الطفل، أو حتى لعبة صغيرة. لكن بمجرد التفكير في كتابة الأكواد أو البحث عن مبرمج، يستسلمون فورًا.

بعد ظهور الذكاء الاصطناعي، ولأول مرة، تم منح الأشخاص العاديين إمكانية جديدة تمامًا: لا تحتاج إلى معرفة كيفية كتابة الأكواد، فقط تحتاج إلى تعلم كيف توضح للذكاء الاصطناعي ما تريده بوضوح. تُظهر البيانات من GitHub Copilot أن أكثر من 15 مليون مطور يستخدمون الذكاء الاصطناعي في البرمجة، ومتوسط 46% من الأكواد مُنشأة بالذكاء الاصطناعي! وفي مشاريع Java تصل هذه النسبة إلى 61%.

🚀قفزة في الكفاءة ومعدل التبني
55%
تحسن السرعة
2.4 يوم
وقت المهمة (كان 9.6 أيام)
81%
معدل التثبيت في اليوم الأول
96%
معدل قبول الاقتراحات
ما يثير الحماس حقًا هو القفزة في الكفاءة: سرعة إكمال المطورين للمهام تحسنت بنسبة 55%. ما كان يستغرق 9.6 أيام لتسليم الكود، أصبح الآن يحتاج فقط 2.4 يوم. هذا التحسن الملحوظ في الكفاءة يوضح أن الذكاء الاصطناعي لم يعد مجرد "أداة اختيارية"، بل أصبح مساعد برمجة لا غنى عنه في عملية التطوير. تؤكد بيانات التبني أيضًا ذلك: في اليوم الذي حصلوا فيه على صلاحية الوصول، قام 81% من المطورين بتثبيته واستخدامه فورًا؛ ومنهم 96% بدأوا في قبول اقتراحات الكود من الذكاء الاصطناعي في نفس اليوم. بعبارة أخرى، المطورون دمجوا الذكاء الاصطناعي تقريبًا فورًا في عملهم اليومي في البرمجة.

بالنسبة للأشخاص العاديين، هذا الاتجاه أكثر أهمية: إذا كان المبرمجون المحترفون يعتمدون بشكل كبير على الذكاء الاصطناعي في كتابة الأكواد، فلماذا لا يمكننا نحن الذين لا يعرفون البرمجة التحدث مباشرة مع الذكاء الاصطناعي لتحقيق أفكارنا؟

هدف هذه الدورة هو مساعدتك على إتقان مهارة جديدة: صنع التطبيقات من خلال الحوار باللغة الطبيعية. سنعلمك كيف تتواصل مع الذكاء الاصطناعي بلغة الكمبيوتر، وكيف تجعله يساعدك في تحويل الأفكار في رأسك إلى منتجات حقيقية قابلة للاستخدام.

2. إلى أي مدى يمكن للذكاء الاصطناعي أن يساعدك

في هذا القسم، سنناقش سؤالًا واحدًا فقط: إذا كنت لا تعرف كيفية كتابة الأكواد على الإطلاق، إلى أي مدى يمكن للذكاء الاصطناعي الحالي أن يساعدك؟

بشكل عام، يمكنك فهم قدرات النماذج اللغوية الكبيرة الحالية على النحو التالي: يمكنها التعامل مع تطوير الأدوات الداخلية البسيطة ولوحات تصور البيانات وبعض الألعاب الخفيفة. هذه القدرات كافية لصنع أدوات للاستخدام الشخصي والتحقق من المتطلبات من منظور مدير المنتج. ولكن إذا كنت تريد إنشاء منتجات تجارية ناضجة بنقرة واحدة، فلا يزال يلزم تدخل بشري مستمر في تصميم العمليات وتحسين التفاصيل.

بعد ذلك، سنأخذ لعبة الثعبان كمثال لنرى بالتحديد إلى أي مدى يمكن للبرمجة بالذكاء الاصطناعي أن تصل حاليًا.

2.1 صنع لعبة ثعبان في 60 ثانية

أولاً، يرجى فتح صفحة الويب التجريبية المستخدمة في الدورة z.ai، z.ai هي منصة ذكاء اصطناعي طورتها شركة Zhipu AI (إحدى الشركات الرائدة في مجال النماذج اللغوية الكبيرة في الصين)، وتعتمد قدراتها الأساسية على سلسلة النماذج اللغوية الكبيرة GLM التي طورتها Zhipu. المنصة تدمج العديد من وظائف الذكاء الاصطناعي، بما في ذلك إنشاء العروض التقديمية وتصميم الملصقات والتطوير الكامل. في هذا البرنامج التعليمي، سنركز على استخدام وحدة التطوير الكاملة.

💡 ما هو نموذج "البرمجة عبر الويب" الجديد؟

في الماضي، كان تطوير تطبيق ويب يتطلب:

  • تثبيت بيئة البرمجة (مثل Python أو Node.js)
  • تهيئة محرر الأكواد
  • تعلم لغات HTML/CSS/JavaScript وغيرها
  • التعامل مع مختلف التبعيات والأخطاء

أما الآن، بفضل منصات البرمجة بالذكاء الاصطناعي، كل ما تحتاجه هو:

  • فتح المتصفح والوصول إلى صفحة الويب
  • وصف الوظائف التي تريدها باللغة الطبيعية
  • يقوم الذكاء الاصطناعي بإنشاء الأكواد تلقائيًا ومعاينة النتائج في الوقت الفعلي

نموذج "الحوار هو البرمجة" هذا يحول البرمجة من "كتابة الأكواد" إلى "وصف المتطلبات". لا تحتاج للقلق بشأن التفاصيل التقنية الأساسية، فقط أخبر الذكاء الاصطناعي بوضوح بما تريد، وسيساعدك في تحويل أفكارك إلى برنامج قابل للتشغيل. هذا هو النموذج الجديد للبرمجة في عصر الذكاء الاصطناعي — Vibe Coding (البرمجة الجوهرية).

بعد إدخال متطلباتنا البسيطة، انقر على زر التطوير الكامل، يمكنك مشاهدة عملية إنشاء صفحة الويب بالكامل في الوقت الفعلي. عادةً ما يكون وقت تحضير فنجان قهوة كافيًا لتكتمل صفحة الويب تلقائيًا!

ساعدني في صنع لعبة ثعبان:
1. التحكم بحركة الثعبان باستخدام مفاتيح الاتجاه
2. عند أكل الطعام، يطول الثعبان وتزداد النقاط
3. عند الاصطدام بالجدار أو جسم الثعبان تنتهي اللعبة
4. يجب أن تكون هناك أزرار للبدء وإعادة البدء
5. الواجهة يجب أن تكون بسيطة وجميلة

بعد الانتهاء من الإنشاء، يمكنك رؤية واجهة صفحة ويب قابلة للتصفح على الجانب الأيمن. يمكنك التمرير لأعلى وأسفل لتصفح محتوى الصفحة، أو النقر على زر 🧭 في الجزء العلوي من الصفحة للتبديل إلى وضع ملء الشاشة لمشاهدة التأثير.

الأزرار من اليسار إلى اليمين في الجزء العلوي تعمل على التوالي: زر السهم يفتح شريط سجل المحادثات الجانبي، زر القلم لإنشاء محادثة جديدة، زر السهم الدائري لتحديث الصفحة، زر البوصلة للتبديل إلى وضع ملء الشاشة، زر Download لتنزيل المشروع، زر <> للتبديل إلى عرض الكود، زر Publish لنشر المشروع.

إذا كنت تريد عرض الكود المصدري لصفحة الويب، يمكنك النقر على أيقونة الكود في الزاوية العلوية اليمنى لعرض الكود الكامل.

🌐 استكشف المزيد من أدوات البرمجة بالذكاء الاصطناعي

بالإضافة إلى z.ai، نوصيك أيضًا بتجربة منصات البرمجة بالذكاء الاصطناعي الممتازة التالية:

الأداةالرابطالميزات
Google AI Studio (موصى به)aistudio.google.com/appsمن إنتاج Google الرسمي، يدعم نموذج Gemini، مناسب للتطوير السريع للنماذج الأولية
Figma Makefigma.com/makeتكامل عميق مع أدوات التصميم، مناسب للمصممين لإنشاء نماذج تفاعلية بسرعة
Cozecoze.comمنصة تطوير روبوتات الذكاء الاصطناعي من ByteDance، توفر قدرات بناء مرئي بدون كود. تكامل عميق مع نماذج كبيرة محلية مثل Doubao و Kimi، تدعم سوق الإضافات والمهام المجدولة والنشر متعدد القنوات
v0.devv0.devأداة إنشاء واجهات مستخدم بالذكاء الاصطناعي من Vercel، أدخل الوصف لتوليد أكواد مكونات React قابلة للتشغيل
Bolt.newbolt.newمنصة تطوير كاملة بالذكاء الاصطناعي من StackBlitz، يمكنها إنشاء ونشر تطبيقات ويب كاملة مباشرة
Lovablelovable.devتركز على إنشاء تطبيقات React عالية الجودة، تدعم تكامل GitHub والنشر بنقرة واحدة
Replit Agentreplit.comبيئة تطوير متكاملة عبر الإنترنت مع مساعد برمجة بالذكاء الاصطناعي، تدعم لغات متعددة والتعاون في الوقت الفعلي

لمعرفة المزيد عن المقارنة التفصيلية واستخدام أدوات البرمجة عبر الويب، يمكنك الرجوع إلى قراءتنا الإضافية: مقارنة عملية لـ 7 منصات Vibe Coding عبر الإنترنت

2.2 ما يمكن وما لا يمكن لبرمجة الحوار فعله

يركز هذا القسم على سؤال محدد: عندما تعتمد فقط على الذكاء الاصطناعي الحواري ولا تكتب أي كود، إلى أي مدى يمكنه حقًا أن يقدم المساعدة. على مستوى الخبرة، الاستنتاج المستقر نسبيًا هو: يمكنه مساعدتك في إنشاء شيء "صغير ومكتمل"، لكن "ما هو الحد الكافي" لا يزال يتطلب منك اتخاذ القرارات التفصيلية بنفسك في كل خطوة.

أفضل في التطبيقات "الصغيرة والواضحة"

من مثال لعبة الثعبان السابق، لقد رأيت نمطًا نموذجيًا: طالما يمكنك توضيح الواجهة والتفاعل، يمكن للذكاء الاصطناعي عادةً في بضعة جولات من الحوار أن يجمع صفحة ويب كاملة قابلة للفتح والنقر واللعب.

غالبًا ما تتميز هذه المهام بخصائص مشتركة:

  • نطاق واضح: صفحة ويب واحدة، أداة داخلية بسيطة، لعبة صغيرة
  • نتائج مرئية: يمكنك التحقق فورًا في المتصفح مما إذا كانت تعمل كما هو متوقع
  • تصحيح مباشر: بعد اكتشاف المشاكل، يمكنك الإشارة إلى الظواهر المحددة في المحادثات اللاحقة وطلب الإصلاح

ضمن هذا الحد، يمكنك اعتبار الذكاء الاصطناعي الحواري كمطور مساعد ذي تنفيذ جيد. كل ما عليك فعله هو تحسين المتطلبات وتعديلها باللغة الطبيعية في كل جولة، وستحصل بسرعة على نموذج أولي قابل للاستخدام.

معدل نجاح الذكاء الاصطناعي في إكمال المشاريع الصغيرة بشكل مستقل:

المشاريع الكبيرة تحتاج "منظور العملية"

بمجرد تجاوز النطاق الصغير والواضح، الاعتماد فقط على بضع جولات من الحوار لجعل الذكاء الاصطناعي يكمل نظامًا معقدًا من البداية إلى النهاية سيواجه سقفًا سريعًا. تتطلب المشاريع الكبيرة غالبًا الاتصال بالخادم وقواعد البيانات ودمج خدمات الطرف الثالث، بالإضافة إلى الصلاحيات والأمان والتزامن وقواعد العمل الكثيرة، والهدف هو تسليم نظام متكامل مرتبط بعمق بالعمليات التجارية الحالية، وليس مجرد صفحة ويب.

في هذه الحالة، النهج الأكثر منطقية ليس إلقاء جميع المتطلبات على الذكاء الاصطناعي دفعة واحدة، بل أولاً تنظيم عملية شاملة واضحة: ما هي الخطوات الرئيسية، ما هي المدخلات والمخرجات وتغييرات الحالة في كل خطوة، وأي العقد هي الأكثر حساسية للأداء والأمان. ثم بناءً على مخطط العملية هذا، فصل الأجزاء المستقلة نسبيًا وتكليف الذكاء الاصطناعي الحواري بإنشاء الواجهات والوحدات والسكريبتات والاختبارات.

بالنظر إلى القدرات الحالية، الذكاء الاصطناعي أفضل في تسريع الخطوات الصغيرة واحدة تلو الأخرى، بينما تقوم أنت (أو فريقك) بقرار كيفية تقسيم الخطوات وكيفية ربطها، وتتحمل المسؤولية عن التصميم المعماري وتكامل النظام والعمليات.

الفرق بين القدرة على الكتابة والقدرة على الاستخدام

عند النظرة الأولى، يبدو أن الذكاء الاصطناعي يستطيع كتابة أي شيء، لكن هل هذه الأشياء قابلة للاستخدام فعلاً، وإلى أي مدى يمكن استخدامها، وكيف يمكننا تحديد الحدود؟

مرجع خبرة يمكن الرجوع إليه:

⚠️ دليل السيناريوهات المناسبة

  • النماذج الأولية / Demo / الأدوات الداخلية للاستخدام الشخصي: مناسبة جدًا لتسليم النسخة الأولى للذكاء الاصطناعي ثم تكرار التفاصيل بنفسك.
  • المنتجات الكبيرة الموجهة للمستخدمين الحقيقيين: عادةً ما تحتاج إلى استثمار طويل الأمد من المهندسين في البنية والتجريد والأداء والصيانة.
  • أنظمة الأمان العالي / الامتثال الصارم (مثل الدفع وإدارة المخاطر والرعاية الصحية): في المرحلة الحالية، لا ينبغي "النشر مباشرة بعد الإنشاء"، يجب إدخال عمليات مراجعة واختبار صارمة.

في الوقت الحالي، يمكنك الاعتماد على الذكاء الاصطناعي بثقة نسبيًا كشريك فعال للنماذج الأولية والأدوات الشخصية: طالما أنت مستعد للاختبار والتحسين بشكل أكبر، وطرح المزيد من الأسئلة "هناك خطأ هنا، ساعدني في إصلاحه واشرح السبب"، في مستوى النماذج الأولية والأدوات الداخلية، فإن الجودة الإجمالية عادةً ما تكون كافية وذات قيمة عملية.

3. الممارسة العملية: أول تطبيق لك بالذكاء الاصطناعي الأصلي

لنعد إلى الجزء العملي، في الجزء السابق، استخدمنا الذكاء الاصطناعي لصنع نموذج أولي قابل للعب من لعبة الثعبان بسرعة، وعرفنا تقريبًا ما يمكن وما لا يمكن للذكاء الاصطناعي فعله. بعد ذلك سنتعلم كيفية استخدام تقنيات vibe coding الأساسية لإنشاء لعبة ثعبان بالذكاء الاصطناعي بإصدار حديث. سنجعل الثعبان يأكل أحرفًا نصية بدلاً من الحبوب. أخيرًا سنجعل اللعبة تولد قصيدة بناءً على الأحرف النصية المأكولة، وترسم لوحة.

من خلال هذا المثال العملي ستتمكن من فهم الفكرة الأساسية لطريقة البرمجة الجديدة تمامًا: كيف تتعلم التعبير عن المتطلبات بوضوح باللغة الطبيعية.

3.1 لعبة ثعبان أصلية بالذكاء الاصطناعي

في البداية، يمكننا التحدث مع النموذج اللغوي الكبير بأبسط طريقة ممكنة، مما سيساعدنا في الحصول على نموذج أولي للمنتج بسرعة. يمكننا إدخال النص مباشرة في مربع الدردشة:

💡 مثال على prompt: ساعدني في صنع لعبة ثعبان

💡 مثال على prompt: ساعدني في صنع لعبة ثعبان يجب أن تدعم

  1. يمكنني أكل كلمات مختلفة سيتم جمعها في صندوق

💡 مثال على prompt: ساعدني في صنع لعبة ثعبان يجب أن تدعم:

  1. يمكنني أكل كلمات مختلفة سيتم جمعها في صندوق
  2. عندما يأكل الثعبان 8 كلمات، يجب أن ينشئ LLM قصيدة بناءً على هذه الكلمات، ويمكننا إعادة مزج القصيدة حسب الحاجة.
  3. عند اكتمال القصيدة، ستقوم الخطوة التالية تلقائيًا بإنشاء صورة بناءً على القصيدة.

لاحظ أنه أثناء عملية التطوير، قد نواجه مشاكل غير مرضية، مثل عدم استجابة الأزرار عند النقر، أو ظهور أخطاء عند استخدام الوظائف، أو عدم عمل الوظائف كما هو متوقع، أو عدم تطابق واجهة الواجهة الأمامية مع التصميم المتوقع.

في هذه الحالة، نحتاج إلى طرح المزيد من الأسئلة على النموذج لمساعدته في إصلاح هذه المشاكل غير المتوقعة.

3.2 إضافة ميزات جديدة للعبة

بعد الانتهاء من الوظائف الأساسية، يمكننا محاولة إضافة بعض التحسينات الجديدة لبرنامجنا! إذا شعرت أن عملية أكل الثعبان للكلمات أو الأحرف مملة بعض الشيء، يمكنك جعل الثعبان يأكل كلمات بألوان مختلفة وتغيير لون الثعبان وفقًا لذلك.

يمكنك أيضًا إضافة تأثيرات بصرية لعملية "الأكل"، أو تقديم كلمات سحرية تؤدي إلى تأثيرات خاصة — مثل زيادة سرعة أو حجم الثعبان. فكرة أخرى هي جعل النموذج يولد قصيدة وصورة في كل مرة يأكل فيها الثعبان كلمة، بدلاً من الانتظار حتى يأكل ثماني كلمات.

إذا وجدت هذا تحديًا، يمكنك طلب المساعدة مباشرة من النموذج اللغوي! يمكنه تقديم اقتراحات إبداعية لجعل لعبتك أكثر متعة. جربها!

1. آلية "الكلمات تفتح عوالم"
في كل مرة يأكل الثعبان كلمة، يقوم LLM بإنشاء تداعيات شعرية للكلمة (مثلاً، "شجرة" ← "غابة"، "ظلال خضراء")، ويقوم نموذج الصور بإنشاء عمل فني صغير للكلمة على الفور. هذه الصور تتجمع تدريجيًا لتشكل لوحة بانورامية فريدة من صنع اللاعب، لذلك كل لعبة هي "رسم وكتابة شعر".

2. لعبة " puzzles الشعر"
كل كلمة يأكلها الثعبان تؤدي إلى توليد LLM لسطر شعري قصير، ونموذج الصور يولد رسمًا توضيحيًا. هذه الأبيات والصور تتحد معًا مثل puzzle لتشكل قصيدة وفنًا تعاوني بالذكاء الاصطناعي في نهاية الجولة.

3. "الكلمات السحرية" و "فروع القصة"
كلمات سحرية خاصة (مثل "ريح"، "ليل"، "حلم") لا تؤدي فقط إلى توليد LLM للشعر، بل تغير أيضًا مزاج الموقف أو موضوعه — تحويل أسلوب الصور المولدة إلى ليلي أو عاصفي أو حالمة.
فروع القصة: LLM يعطي موضوعًا أو لغزًا في البداية (مثل "ذكريات الخريف"). اختيارات الكلمات لدى اللاعب تؤثر مباشرة على تطور القصة والشعر، ويقوم نموذج الصور بتحديث الخلفية والتأثيرات البصرية في الوقت الفعلي.

4. "الإنشاء التفاعلي في الوقت الفعلي"
بعد كل كلمة، يولد LLM سطر حوار أو وصف، يمكن لـ NPC في اللعبة "التحدث" مع اللاعب، أو يمكن للبيئة أن تتغير وفقًا لذلك.
مظهر الثعبان أو العوائق في اللعبة يمكن أن تتغير بصريًا بناءً على الكلمات المأكولة، بفضل نموذج الصور.

5. "الإبداع والمشاركة"
يمكن للاعبين حفظ ومشاركة قصائدهم وصورهم المبتكرة بالذكاء الاصطناعي في نهاية الجلسة، للتباهي بإبداعهم "التعاوني بالذكاء الاصطناعي" الفريد.
لوحات المتصدرين مثل "أجمل شعر وفن"، "أكثر مزيج كلمات إبداعي"، لتشجيع إعادة اللعب والإبداع.

6. تحدي "الثعبان حسب الجمل"
الوضع العكسي: LLM يعطي سطرًا شعريًا أو لغزًا، يجب على اللاعب توجيه الثعبان لأكل الكلمات بالترتيب لإعادة بناء الجملة. أكل كلمة خاطئة يؤدي إلى عواقب ممتعة أو فنية من خلال نموذج إنشاء الصور.

7. "مراحل ذاتية" و "اختيار الأسلوب"
في بداية اللعبة، يختار اللاعب موضوعًا (مثل "حكايات خرافية"، "خيال علمي"، "شعر تانغ")، وسيكيف كل من LLM ونموذج الصور اختيار الكلمات وأسلوب الشعر والتأثيرات البصرية ليتطابق مع الموضوع، مما يجعل كل لعبة تبدو جديدة.

8. "الإبداع المشترك الحي"
عند أكل كلمة خاصة، يمكن لـ LLM أن يطلب من اللاعب إدخال عبارة أو اختيار أسلوب، ثم يقوم الذكاء الاصطناعي بتوليد الأبيات والرسوم التوضيحية المناسبة، مما يجعلها إبداعًا مشتركًا حقيقيًا بين الإنسان والذكاء الاصطناعي.

9. " مفاجآت الذكاء الاصطناعي والإنجازات"
مجموعات كلمات معينة يتعرف عليها LLM كمواضيع خاصة أو نكات داخلية (مثل "قمر"، "زهر Osmanthus"، "ضفة النهر")، مما يؤدي إلى أبيات ورسوم توضيحية نادرة كمكافأة على الاستكشاف.

10. "قصة النمو"
مع نمو الثعبان، يولد LLM قصيدة قصة متصلة، ويقوم نموذج الصور بإنشاء لوحة طويلة أو بانورامية سلسة، لذلك اللاعب "يكتب ويرسم ويلعب" في نفس الوقت.

بالإضافة إلى ذلك، يمكننا أيضًا طلب من LLM مساعدتنا في توليد prompt على مستوى المشروع مباشرة. في القسم السابق، كتبنا بأنفسنا فقط prompt لعبة الثعبان. الآن دعنا نحاول جعل النموذج اللغوي الكبير يولد prompt مع إطار كامل ومسار تنفيذ (يمكنك استخدام z.ai مباشرة للتوليد).

إذا كنت تريد تعلم كيفية كتابة prompts أفضل، يمكنك الاطلاع على ملحق هندسة Prompts.

أريد أن يجعل الذكاء الاصطناعي يولد لعبة ثعبان على الويب، أحتاج إلى prompt أكثر اكتمالاً لجعل النتيجة أكثر إثارة وإمتاعًا. يرجى توليد prompt المناسب. الهدف الحالي: إنشاء لعبة ثعبان يجب أن تطبق وظيفة أكل كلمات مختلفة لتوليد الشعر، ويجب أن تتضمن وحدة إنشاء الصور.

ستكون إجابة z.ai كالتالي:

يمكننا استخدام هذا prompt لإعادة إنشاء المشروع في وضع التطوير الكامل:

3.3 حاول صنع ألعاب صغيرة أخرى

بالإضافة إلى لعبة الثعبان، يمكننا ترك الخيال يبحر بحرية.

نبتكر أي شيء نريد ابتكاره، بل ونحاول إفساد كل شيء! ثم نبدأ من جديد!

1. معرض فنون الذكاء الاصطناعي
   الوصف: معرض على الإنترنت لعرض الأعمال الفنية المولدة بالذكاء الاصطناعي، يمكن للمستخدمين رفع ومشاركة والتعليق على الأعمال الفنية.
   الوظائف: نظام حسابات المستخدمين، رفع وعرض الأعمال الفنية، نظام التقييم، التصفح حسب الفئة، تكامل أدوات إنشاء الذكاء الاصطناعي.
   التميز التقني: واجهة React/Vue، خادم Node.js، قاعدة بيانات MongoDB، تكامل واجهة برمجة تطبيقات الذكاء الاصطناعي.

2. أرشيف الألعاب الكلاسيكية
   الوصف: موقع يكرم الألعاب الكلاسيكية، يتضمن تاريخ الألعاب، أدلة اللعب، وألعاب كلاسيكية قابلة للعب عبر الإنترنت.
   الوظائف: قاعدة بيانات الألعاب، عرض الخط الزمني، محاكي عبر الإنترنت، تعليقات المستخدمين، وظيفة جمع الألعاب.
   التميز التقني: تصميم متجاوب، تنفيذ ألعاب WebGL/Canvas، واجهة RESTful API، نظام مصادقة المستخدمين.

3. متتبع الحياة المستدامة
   الوصف: موقع يساعد المستخدمين على تتبع وتقليل بصمتهم الكربونية من خلال نصائح بيئية وتحديات مجتمعية.
   الوظائف: حاسبة البصمة الكربونية الشخصية، تحديد الأهداف، تتبع التقدم، تحديات مجتمعية، قاعدة معرفة بيئية.
   التميز التقني: تصور البيانات، تحسين الجوال، وظائف اجتماعية، إشعارات الدفع.

4. مساعد المطبخ الافتراضي
   الوصف: منصة توجيه طبخ قائمة على الذكاء الاصطناعي توصي بوصفات مخصصة وإرشادات طبخ خطوة بخطوة.
   الوظائف: قاعدة بيانات الوصفات، التعرف على المكونات، توصيات مخصصة، مؤقت الطبخ، تحليل التغذية.
   التميز التقني: واجهة برمجة التعرف على الصور، نظام توصيات التعلم الآلي، التحكم الصوتي، إرشادات فيديو في الوقت الفعلي.

5. منصة اكتشاف الموسيقى المستقلة
   الوصف: منصة بث موسيقي تركز على الفنانين المستقلين والناشئين، توفر تجربة اكتشاف فريدة.
   الوظائف: بث الموسيقى، ملفات الفنانين الشخصية، توصيات مخصصة، إنشاء قوائم التشغيل، تعليقات المجتمع.
   التميز التقني: معالجة البث الصوتي، خوارزميات التوصية، وظائف اجتماعية، تصور الموسيقى.

6. نظام إدارة المهام البسيط
   الوصف: أداة إدارة مهام بجماليات Zen، تركز على التنظيم البسيط والفعال للمهام.
   الوظائف: إنشاء وتصنيف المهام، تحديد الأولويات، تتبع التقدم، تعاون الفريق، تحليل البيانات.
   التميز التقني: تصميم واجهة مستخدم بسيط، وظيفة السحب والإفلات، المزامنة في الوقت الفعلي، توافق متعدد المنصات.

7. ورشة كتابة الخيال العلمي
   الوصف: منصة توفر أدوات إبداعية وإلهامًا لكتاب الخيال العلمي، بما في ذلك أدوات بناء العالم وتطوير الشخصيات.
   الوظائف: أدوات بنية القصة، ملفات الشخصيات، قوالب بناء العالم، إحصائيات الكتابة، ملاحظات المجتمع.
   التميز التقني: محرر نصوص منسق، تصور البيانات، تعاون في التحرير، إبداع بمساعدة الذكاء الاصطناعي.

8. خريطة المعرفة الشخصية
   الوصف: أداة تساعد المستخدمين على بناء شبكة معرفة شخصية، تصور وربط الأفكار والمعلومات المختلفة.
   الوظائف: إنشاء وربط العقد، نظام العلامات، وظيفة البحث، أدوات الاستيراد/التصدير، رسوم بيانية مرئية.
   التميز التقني: قاعدة بيانات الرسم البياني، خوارزميات تصور البيانات، دعم Markdown، المزامنة عبر الأجهزة.

9. حديقة نباتات افتراضية
   الوصف: موسوعة نباتات تفاعلية يمكن للمستخدمين استكشاف عالم النباتات وإنشاء حديقة افتراضية.
   الوظائف: قاعدة بيانات النباتات، نماذج نباتات ثلاثية الأبعاد، محاكاة النمو، أدلة البستنة، عرض المجتمع.
   التميز التقني: تصيير ثلاثي الأبعاد، محاكاة تغير الفصول، تكامل AR، واجهة برمجة التعرف على النباتات.

10. ساحة تحديات البرمجة
    الوصف: منصة مسابقات عبر الإنترنت للمبرمجين مع تحديات برمجة بمستويات صعوبة مختلفة.
    الوظائف: أسئلة التحدي، محرر أكواد، تقييم تلقائي، لوحة المتصدرين، مسارات التعلم.
    التميز التقني: بيئة sandbox للأكواد، نظام تقييم في الوقت الفعلي، تصور الخوارزميات، وظائف التعلم الاجتماعي.

والمزيد... إذا كنت تحب الألعاب، دعنا نحاول ابتكار ألعاب معًا!

1. RPG عالم مفتوح ثلاثي الأبعاد
   الوصف: RPG خيالية بعالم مفتوح واسع ومهام وتطور الشخصيات.
   الوظائف: دورة ليل ونهار، طقس ديناميكي، شجرة المهارات، تعاون متعدد اللاعبين، نظام التصنيع.
   التميز التقني: Three.js أو Babylon.js للتصيير ثلاثي الأبعاد، منطق اللعبة من جانب الخادم، تخصيص الشخصية، نظام الحفظ.

2. ساحة إطلاق نار من منظور شخص أول (FPS)
   الوصف: FPS سريع الإيقاع متعدد اللاعبين مع أوضاع لعب وخرائط متنوعة.
   الوظائف: قتال فرق، التقاط العلم، تخصيص الأسلحة، مباريات تصنيف.
   التميز التقني: WebGL/Three.js للرسومات ثلاثية الأبعاد، شبكة لعب متعددة، كشف التصادم، دردشة صوتية.

3. شطرنج الذكاء الاصطناعي ولعب متعدد اللاعبين
   الوصف: منصة شطرنج كاملة الميزات مع منافسين بالذكاء الاصطناعي ولعب عبر الإنترنت.
   الوظائف: مستويات صعوبة الذكاء الاصطناعي، تحديات نهاية اللعبة، وضع البطولة، تحليل إعادة اللعب.
   التميز التقني: مكتبة منطق الشطرنج، WebSocket للعب في الوقت الفعلي، نظام تصنيف ELO، مكافحة الغش.

4. لعبة Mahjong متعددة اللاعبين عبر الإنترنت
   الوصف: لعبة Mahjong تقليدية مع لعب متعدد اللاعبين عبر الإنترنت ونظام تسجيل النقاط.
   الوظائف: مجموعات قواعد متعددة، غرف خاصة، نظام تصنيف، وظيفة إعادة اللعب.
   التميز التقني: منطق مطابقة البلاط، لعب متعدد اللاعبين في الوقت الفعلي، نظام اللوبي، تتبع النقاط.

5. لعبة استراتيجية قائمة على الأدوار
   الوصف: لعبة استراتيجية تكتيكية مع قتال شبكي وإدارة الوحدات.
   الوظائف: وضع الحملة، معارك عشوائية، ترقية الوحدات، ضباب الحرب، لعب متعدد اللاعبين.
   التميز التقني: نظام حركة الشبكة، اتخاذ قرارات الذكاء الاصطناعي، مزامنة الأدوار، نظام الحفظ/التحميل.

6. لعبة سباق سيارات مع الوقت
   الوصف: لعبة سباق سيارات ثلاثية الأبعاد تركز على سباقات الوقت وأرقام الحلبات.
   الوظائف: حلبات متعددة، تخصيص السيارات، إعادة لعب الأشباح، لوحة المتصدرين.
   التميز التقني: فيزياء سيارات ثلاثية الأبعاد، محرر الحلبات، نظام إعادة اللعب، لوحة متصدرين عبر الإنترنت.

7. لعبة بطاقات قتالية (بناء المجموعة)
   الوصف: لعبة بطاقات استراتيجية يبني اللاعبون مجموعاتهم ويقاتلون الخصوم.
   الوظائف: جمع البطاقات، بناء المجموعة، مباريات تصنيف، أحداث موسمية.
   التميز التقني: منطق لعبة البطاقات، نظام المطابقة، خصوم الذكاء الاصطناعي، حركات البطاقات.

8. Battle Royale (عرض علوي ثنائي الأبعاد)
   الوصف: لعبة Battle Royale بعرض علوي ثنائي الأبعاد مع منطقة لعب تتقلص وآلية الغنائم.
   الوظائف: وضع فردي وفريق، تنوع الأسلحة، أحداث داخل اللعبة، لوحة المتصدرين.
   التميز التقني: لعب متعدد اللاعبين في الوقت الفعلي، منطق تقليص المنطقة، نظام توليد الغنائم، المطابقة.

9. لعبة رعب بقاء (منظور شخص أول)
   الوصف: لعبة رعب من منظور شخص أول مع إدارة الموارد وآليات الهروب.
   الوظائف: بيئة غامضة، حل الألغاز، ذكاء اصطناعي للعدو، نهايات متعددة.
   التميز التقني: إضاءة ديناميكية، تصميم الصوت، البحث عن المسار للعدو، نظام الحفظ.

10. لعبة إيقاع موسيقي (ثلاثية الأبعاد)
    الوصف: لعبة إيقاع ثلاثية الأبعاد يضرب اللاعب النوتات مع إيقاع الموسيقى.
    الوظائف: مستويات صعوبة متعددة، محرر الحلبات، دعم الأغاني المخصصة، لوحة المتصدرين.
    التميز التقني: تحليل الصوت، مزامنة الإيقاع، مسار النوتات ثلاثي الأبعاد، كشف توقيت الإدخال.

📚 الواجب

🎯 واجب هذا الفصل: أنجز أول مجموعة من ألعابك الصغيرة الأصلية بالذكاء الاصطناعي

في هذا القسم، اتبعت الخطوات وتجربت العملية الكاملة من "توليد لعبة الثعبان عبر الحوار" إلى "فهم أسلوب تصميم الألعاب الصغيرة الأصلية بالذكاء الاصطناعي". الواجب التالي يساعدك على تحويل هذا الفهم إلى قدرات حقيقية خاصة بك.

  1. إعادة إنشاء لعبة الثعبان الأصلية بالذكاء الاصطناعي بالكامل
    • الحد الأدنى: الثعبان يتحرك، وعند أكل "الطعام" يتغير الطول والنقاط، والاصطدام بالجدار أو الجسم ينتهي اللعبة.
    • أثناء إعادة الإنشاء، تدرب على إلقاء ظاهرة الخطأ + رسالة الخطأ + مقتطف الكود الرئيسي على الذكاء الاصطناعي دفعة واحدة، واطلب منه الإصلاح "بالوضع المبسط".
  2. (اختياري) ابتكار لعبة أو Demo صغيرة أصلية بالذكاء الاصطناعي
    • يمكن أن تكون أي لعبة خفيفة حول النصوص أو الصور أو الموسيقى أو الإيقاع، مثل "أكل الكلمات وكتابة الشعر" أو "النقر بالإيقاع" أو "الركض التوليدي" وغيرها.
    • التركيز ليس على مدى روعة الرسومات، بل على قدرتك على التوضيح بوضوح: كيف ساعد الذكاء الاصطناعي تحديدًا، وما هو الجزء الذي حلّ مشكلة "صعبة أو مرهقة يدويًا".

هذه هي نهاية البرنامج التعليمي! قد تحتاج إلى 4 ساعات لإكمال جميع المحتويات وبناء لعبة الثعبان الخاصة بك. لا تستعجل — استكشف وجرب واستمتع بالعملية. إذا واجهت مفاهيم لا تفهمها أثناء العملية، نوصي بالرجوع إلى الأقسام ذات الصلة في الملحق أدناه.

الملحق

تنقل الملحق
هنا مجموعة من المفاهيم الأساسية المتعلقة بهذا الفصل: إذا واجهت أسئلة مثل "ما هو الواجهة الأمامية" أو "ما يعنيه Vibe Coding بالضبط" أثناء التعلم، يمكنك العودة هنا للرجوع إليها في أي وقت.
الملحق 1: هل نحتاج إلى معرفة تطوير الواجهة الأمامية؟
فهم موقع الواجهة الأمامية في التطبيق، ومعرفة الأجزاء "المرئية".
الملحق 2: ما هو Vibe Coding بالضبط
فهم الفكرة الأساسية لـ "التطوير الحواري"، ومعرفة كيفية التعاون مع الذكاء الاصطناعي.
الملحق 3: سياق النموذج
فهم المفاهيم مثل "طول السياق" التي نسمعها كثيرًا لكنها يسهل الخلط بينها.
الملحق 4: قدرة اتباع التعليمات
فهم لماذا لا "يفهم" النموذج أحيانًا، وكيف تكتب بشكل أوضح.
نصيحة: يمكنك استخدام Ctrl/⌘+F للبحث عن الكلمات الرئيسية، أو نسخ الفقرات التي لا تفهمها ولصقها في الذكاء الاصطناعي، واطلب منه إعادة شرحها بطريقة "يمكن للمبتدئ تمامًا فهمها".

الملحق 1: هل نحتاج إلى معرفة تطوير الواجهة الأمامية؟

💡 ملخص بجملة واحدة

لا تحتاج إلى معرفة كيفية كتابة الأكواد، لكن فهم المفاهيم الأساسية يساعدك على وصف المتطلبات للذكاء الاصطناعي بشكل أفضل.

👁️الواجهة الأماميةمرئي
كل المحتوى الذي يمكن للمستخدم **رؤيته والنقر عليه**
  • عناوين الصفحة، النصوص، الصور
  • الأزرار، مربعات الإدخال، القوائم المنسدلة
  • واجهة اللعبة، تأثيرات الحركة
⚙️الواجهة الخلفيةغير مرئي
معالجة البيانات التي تعمل على الخادم
  • تخزين نقاط المستخدم
  • التحقق من حساب تسجيل الدخول
  • توزيع محتوى المراحل

الثلاثي الأساسي للواجهة الأمامية

يستخدم المتصفح ثلاثة أنواع من "الأكواد" لبناء الصفحات:

كيف يتحول الكود إلى صفحة؟

عندما تفتح صفحة ويب، يعالج المتصفح ثلاثة أنواع من الأكواد بالترتيب:

1. HTML — تعريف هيكل الصفحة يحلل المتصفح أولاً HTML لمعرفة العناصر الموجودة على الصفحة (العناوين، الفقرات، الصور، الأزرار، إلخ) والعلاقات الهرمية بينها.

2. CSS — تطبيق التنسيقات ثم يضيف المتصفح الأنماط لهذه العناصر بناءً على قواعد CSS: الألوان، الأحجام، المواضع، المسافات، مما يجعل الصفحة جميلة.

3. JavaScript — إضافة التفاعل أخيرًا ينفذ كود JavaScript لجعل الصفحة "تتحرك": الاستجابة للنقرات، إرسال النماذج، تشغيل الرسوم المتحركة، إلخ.

4. عرض الصفحة نتيجة تعاون الثلاثة هي صفحة الويب التي تراها في النهاية.

أطر الواجهة الأمامية الحديثة: من HTML إلى React/Vue

HTML و CSS و JavaScript المذكورة سابقًا هي "الثلاثي الأساسي" لتطوير الواجهة الأمامية، وهي أساس جميع صفحات الويب. ولكن عندما تصبح الصفحات معقدة، يواجه التطوير المباشر بالثلاثي تحديات: صعوبة صيانة الكود، الكثير من العمل المتكرر، مشاكل مزامنة البيانات.

أطر الواجهة الأمامية الحديثة (مثل React و Vue و Angular) مبنية على HTML/CSS/JS لجعل التطوير أكثر كفاءة:

1. HTML/CSS/JS (المرحلة الأساسية) التعامل المباشر مع عناصر الصفحة، مناسب للصفحات البسيطة. ولكن عندما يزيد حجم الكود، تختلط كل المنطقيات معًا ويصبح من الصعب صيانتها.

2. jQuery (مرحلة الانتقال) بسّط عمليات DOM وجعل الكود أكثر إيجازًا. لكن لا يزال يتطلب الإدارة اليدوية لحالة الصفحة، وعند تغير البيانات يجب العثور على العنصر المقابل وتحديثه يدويًا.

3. React/Vue (المرحلة الحديثة) اعتماد تصميم قائم على المكونات والمدفوع بالحالة:

  • المكونات: تقسيم الصفحة إلى وحدات مستقلة قابلة لإعادة الاستخدام (مثل الأزرار والبطاقات وشريط التنقل)
  • المدفوع بالحالة: عند تغير البيانات، يقوم الإطار بتحديث الواجهة المقابلة تلقائيًا بدون تدخل يدوي

💡 فهم بسيط

  • HTML/CSS/JS = المواد الأساسية (الطوب، الإسمنت، الحديد)
  • React/Vue = إطار البناء (يوفر المعايير والأدوات لبناء المنزل)

في عصر البرمجة بمساعدة الذكاء الاصطناعي، لا تحتاج إلى إتقان جميع تفاصيل الأطر، فقط فهم المفاهيم الأساسية، ويمكنك من خلال وصف اللغة الطبيعية جعل الذكاء الاصطناعي يساعدك في توليد الأكواد.

في Vibe Coding

النقطة الأساسية: لا تحتاج إلى كتابة الأكواد، فقط تحتاج إلى الوصف.

بعد فهم مفاهيم الواجهة الأمامية، يمكنك وصف المتطلبات للذكاء الاصطناعي بهذه الطريقة:

"اصنع صفحة لوحة متصدرين باستخدام React، عرض قائمة النقاط على الجانب الأيمن، عند النقر على صف يظهر تفاصيل اللاعب في الأسفل، بأسلوب بسيط وعصري."

إذا كنت تريد فهمًا أعمق لمفاهيم الواجهة الأمامية الأساسية مثل HTML و CSS و JavaScript، يمكنك الاطلاع على ملحق أساسيات الويب. لمعرفة تاريخ تطوير تقنيات الواجهة الأمامية، يمكنك الاطلاع على ملحق تاريخ تطور الواجهة الأمامية.

الملحق 2: ما هو Vibe Coding بالضبط

💡 ما هو Vibe Coding؟ عالم الكمبيوتر Andrej Karpathy (أحد المؤسسين المشاركين لـ OpenAI، الرئيس السابق للذكاء الاصطناعي في تسلا) صاغ مصطلح vibe coding في فبراير 2025. يشير هذا المفهوم إلى طريقة برمجة تعتمد على LLM، تسمح للمبرمجين بتوليد أكواد قابلة للعمل من خلال تقديم أوصاف باللغة الطبيعية بدلاً من كتابة الأكواد يدويًا.

1767350588191

من حيث المعنى الحرفي، يمكن فهم Vibe Coding على أنه «طريقة تطوير من خلال الكلام». التغيير الأساسي هو: لم تعد بحاجة إلى كتابة الأكواد سطرًا بسطر، أو البحث عن القواعد، أو تصحيح الأخطاء، بل تصف ما تريده مباشرة باللغة الطبيعية، مثل:

  • أحتاج إلى صفحة تسجيل دخول بها مربع إدخال رقم الهاتف ومربع إدخال رمز التحقق.
  • بعد نجاح تسجيل الدخول، الانتقال إلى الصفحة الرئيسية وعرض اسم المستخدم في الزاوية العلوية اليمنى.
  • أعطني لعبة ثعبان بسيطة يمكن التحكم بها بمفاتيح الاتجاه.

النموذج اللغوي الكبير (LLM) يترجم هذه الأوصاف تلقائيًا إلى أكواد قابلة للتشغيل حقًا، وينشئ الصفحات والمنطق وهياكل البيانات المقابلة. بعد رؤية النتيجة، تقدم ملاحظات التعديل باللغة الطبيعية، مثل تكبير الزر قليلًا، أو تغيير الخلفية إلى داكنة، أو تسجيل النقاط وعرض لوحة المتصدرين، ويستمر الذكاء الاصطناعي في تعديل التنفيذ وفقًا لمتطلباتك.

في هذا النموذج، لا تحتاج إلى تعلم لغة البرمجة أولاً ثم كتابة الأكواد؛ بل تركز جهودك الرئيسية على: توضيح ما يجب فعله، وتقييم موضع الخطأ بعد رؤية النتائج، ثم تقديم تعديلات جديدة. الذكاء الاصطناعي مسؤول عن تحويل هذه الأفكار العليا إلى تنفيذ ملموس، مما يقلل بشكل كبير من عمل البرمجة الميكانيكي والمتكرر.

يمكنك النقر هنا لمعرفة المزيد من التفاصيل حول vibe coding: https://www.ibm.com/think/topics/vibe-coding

يمكنك النقر هنا لمعرفة المزيد من محتوى Karpathy: https://karpathy.bearblog.dev/blog/

كيف تتظاهر بأنك خبير في Vibe Coding

في الواقع، في عملية vibe coding الحقيقية، نادرًا ما نستخدم prompts معقدة. ربما نحتاج في البداية إلى تقديم prompt محدد ومعقد بشكل معتدل للبرنامج بأكمله، ولكن بعد ذلك في كل خطوة، قد تحتاج فقط إلى الأنواع التالية من prompts:

على سبيل المثال، قد تطلب من النموذج إصلاح خطأ في الكود، أو إعادة إخراج النسخة الكاملة بعد التعديل، أو عدم تغيير المنطق الأصلي، أو عدم إضافة وظائف غير مطلوبة، أو الالتزام بأسماء المتغيرات والدوال الموجودة. الفكرة الأساسية هي أن prompt اليومي في vibe coding غالبًا لا يكون طويلًا، بل يكون طلبًا مباشرًا يصف المشكلة أو القيد الذي تريد من النموذج الالتزام به.

قد يبدو هذا مبالغًا فيه بعض الشيء، لكن في الواقع، هذه هي prompts التي قد نستخدمها في عملنا اليومي. بسبب حدود طول السياق للنماذج اللغوية الكبيرة، أو أحيانًا لأن قدرة اتباع التعليمات ليست قوية جدًا، قد ينسى النموذج ما تمت مناقشته في وقت مبكر من المحادثة. في vibe coding، نميل إلى استخدام النماذج ذات السياق الطويل والنماذج ذات قدرة اتباع تعليمات قوية، ويمكننا الحكم على ما إذا كان النموذج جيدًا من خلال ترتيب أو مؤشرات كلاهما.

أو، بسبب أسلوب مجموعة بيانات التدريب، تميل النماذج الكبيرة إلى الرد بأسلوب بيانات التدريب الخاصة بها. على سبيل المثال، بعض الأشخاص يتحدثون بجدية، وبعضهم يحب إضافة الكثير من الزخارف، وبعض النماذج الكبيرة تحب إضافة الكثير من التعليقات أو وحدات غير ضرورية في الكود.

الملحق 3: سياق النموذج

سياق النموذج يمكن فهمه على أنه الذاكرة قصيرة المدى للذكاء الاصطناعي. يشير إلى جميع المحتوى النصي الذي يمكن للنموذج "رؤيته" و"تذكره" في محادثة واحدة أو مهمة واحدة، بما في ذلك أسئلتك السابقة والإرشادات المقدمة من النظام والمواد ذات الصلة وغيرها.

بفضل السياق، يمكن للذكاء الاصطناعي فهم أنك تستمر في السؤال بناءً على المحتوى السابق، ويمكنه إجراء محادثات تبدو متماسكة وطبيعية جولة بعد جولة. بدون السياق، كل جملة منك ستبدو للمثل استفسارًا جديدًا تمامًا، ولن يعرف ما قلته سابقًا، وبالتالي لا يمكنه متابعة المحادثة.

كل نموذج لديه طول سياق فعّال خاص به (context window). هذا الطول يُقاس عادةً بـ token (يمكن فهمها تقريبًا كوحدة "أجزاء الكلمات")، حاليًا معظم النماذج السائدة تتراوح بين 32k إلى 128k token. كلما طال السياق، كلما استطاع النموذج "قراءة" محتوى أكثر في المرة الواحدة، مثل:

  • قراءة ورقة بحثية أو تقرير طويل بالكامل دفعة واحدة
  • الرجوع إلى مواد متعددة وحالات متعددة في نفس جولة المحادثة
  • جعل النموذج يتذكر استنتاجات المناقشات المعقدة من الجولات السابقة

عندما يقترب المحتوى الذي تدخله من حد سياق النموذج أو يتجاوزه، غالبًا ما تظهر بعض الظواهر الشائعة:

  • يبدأ النموذج في نسيان التفاصيل أو المعلومات الرئيسية في النصوص الطويلة السابقة
  • مع تقدم المحادثة، ينحرف الموضوع تدريجيًا عن الهدف الأصلي
  • بين الإجابات المختلفة على نفس المادة، يكون المحتوى المشار إليه غير متسق

هذه الظواهر ليست لأن النموذج "أصبح أغبى" فجأة، بل هي نتيجة طبيعية عندما يتم ملء سعة السياق أو الاقتراب من ملئها.

في الاستخدام الفعلي، نأمل أن يكون السياق طويلاً قدر الإمكان، ولكن يجب أيضًا أن ندرك:

  • كلما طال السياق، زادت موارد الحوسبة المستهلكة
  • تكلفة الاستدعاء المقابلة (الرسوم) سترتفع أيضًا

لذلك، عند تصميم تطبيقات الذكاء الاصطناعي، نحتاج إلى تحقيق التوازن بين جعل النموذج يرى ما يكفي والتحكم في التكلفة وتحسين الكفاءة. على سبيل المثال:

  • استخلاص المعلومات التي تحتاج حقًا إلى الاحتفاظ بها طويل الأمد قبل تقديمها للنموذج
  • بالنسبة للمعلومات التفصيلية التي لم تعد ضرورية، تجنب إدخالها كما هي مرارًا وتكرارًا في السياق
  • استخدام قواعد المعرفة الخارجية وغيرها من الطرق لتسليم "الذاكرة طويلة المدى" للنظام بدلاً من إجبارها في سياق النموذج

الملحق 4: قدرة اتباع التعليمات

قدرة اتباع التعليمات تشير إلى: بعد أن يفهم النموذج تعليماتك، هل يمكنه تنفيذها بدقة واكتمال وفقًا لمتطلباتك. لا تشمل فقط القدرة على الإجابة على الأسئلة، بل تشمل أيضًا القدرة على إتمام المهام بالتنسيق والأسلوب والخطوات المحددة.

على سبيل المثال، فيما يلي جميعها تعليمات ذات متطلبات واضحة للنموذج:

  • تلخيص هذه المقالة في ثلاث نقاط رئيسية
  • كتابة رد بريد إلكتروني بنبرة رسمية ومهذبة
  • ترجمة هذه الكلمة إلى الإنجليزية مع إنشاء جملة مثال لكل منها
  • استخراج المؤلف والوقت والأحداث الرئيسية من المقالة

النموذج ذو قدرة قوية في اتباع التعليمات عادةً ما يتميز بالخصائص التالية:

  • إخراج المحتوى بالكمية المطلوبة على سبيل المثال، إذا طُلب تلخيص ثلاث نقاط، فلن يعطي خمس نقاط.
  • تغطية جميع العناصر المحددة على سبيل المثال، إذا طُلب استخراج المؤلف والوقت والحدث، فلن يفوت أيًا منها.
  • الالتزام بالتنسيق والنبرة المحددين على سبيل المثال، إذا طُلب استخدام نبرة رسمية، فلن يُخرج ردًا شفهيًا جدًا.
  • عدم القيام بإضافات غير ضرورية على سبيل المثال، إذا طُلب الترجمة وإنشاء جمل، فلن يُخرج فقرة طويلة من التفسيرات غير ذات الصلة.

في التطبيقات العملية، قدرة قوية في اتباع التعليمات مهمة جدًا، والأسباب تشمل:

  • تحسين الاستقرار: نفس التعليمات في أوقات مختلفة وعند التشغيل المتعدد، تكون بنية الإخراج وأنماط السلوك أكثر اتساقًا، وأقل عرضة للتفلسف
  • تحسين إمكانية التكرار: عندما تقوم بتكوين prompt في منتج أو عملية، يمكنك توقع كيف سيستجيب النموذج تقريبًا، مما يسهل الاختبار والتكرار
  • تسهيل تكامل النظام: عندما يطابق إخراج النموذج التنسيق المتوقع، يكون من الأسهل التكامل تلقائيًا مع البرامج الخلفية وسير العمل أو الأدوات الأخرى

لذلك، عند اختيار وتقييم نموذج لغوي كبير، بالإضافة إلى الانتباه إلى ما إذا كان ذكيًا وما إذا كان تغطية المعرفة واسعة، تحتاج أيضًا إلى الانتباه بشكل خاص إلى قدرته في اتباع التعليمات. بالنسبة للتطبيقات الصناعية، القدرة على تنفيذ التعليمات بشكل مستقر ودقيق غالبًا ما تكون أهم من تقديم إجابة مذهلة في بعض الأحيان.

--- title: 'Beginner 1: Talking Is Programming' description: 'Build an AI-native snake game through conversation, then reuse the workflow to create your own mini game or demo.' ---