ai for designersApril 25, 202610 min read

شرح نافذة السياق، لماذا تسوء المحادثات الطويلة مع الذكاء الاصطناعي

ما هي نافذة السياق في الواقع، ولماذا تتباطأ محادثات الذكاء الاصطناعي الطويلة وتفقد حدتها قبل أن تصل إلى الحد الأقصى، وعتبات النسبة المئوية التي تخبرك متى تستمر، أو تضغط، أو تبدأ من جديد.

By Boone
XLinkedIn
Context window explained, why long AI chats get worse
البطل: مشهد فوكسل لمساحة عمل دردشة ذكاء اصطناعي، يُظهر الجانب الأيسر جلسة نظيفة ومركزة مع عدد قليل من الكتل الواضحة، بينما يُظهر الجانب الأيمن جلسة متضخمة مع أكوام من الكتل الباهتة المزدحمة التي تتلاشى في الضوضاء
البطل: مشهد فوكسل لمساحة عمل دردشة ذكاء اصطناعي، يُظهر الجانب الأيسر جلسة نظيفة ومركزة مع عدد قليل من الكتل الواضحة، بينما يُظهر الجانب الأيمن جلسة متضخمة مع أكوام من الكتل الباهتة المزدحمة التي تتلاشى في الضوضاء

لم تُحل نوافذ السياق الكبيرة مشكلة المحادثات الطويلة، بل نقلتها فقط.

يصبح النموذج الذي يستطيع استيعاب مليون رمز أبطأ وأكثر تكلفة وأقل دقة كلما طالت مدة الجلسة الواحدة. نادرًا ما يكون الحد الأقصى هو المشكلة الحقيقية، بل التباطؤ التدريجي. تتلاشى المحادثات الطويلة تدريجيًا، ولا يلاحظ معظم المشغلين ذلك إلا عندما تتوقف الإجابات عن الوصول وتصبح التكاليف غير منطقية.

هذا المقال هو النسخة العملية. ما هي نافذة السياق في الواقع، ولماذا تتدهور الجلسات الطويلة قبل أن تتعطل، وجدول نسب مئوية يمكنك تصويره واستخدامه اليوم.

نافذة السياق هي الذاكرة العاملة

نافذة السياق هي كمية المحادثات والملفات والتعليمات التي يمكن لنموذج الذكاء الاصطناعي أخذها في الاعتبار في دورة واحدة. كل شيء داخلها مهم: رسائلك، وردود النموذج، وإشعارات النظام، والمرفقات، والمقتطفات المسترجعة، ومخرجات الأدوات. إذا احتاج النموذج إلى "رؤيتها" للإجابة، فستجدها في النافذة.

نموذج ذهني مفيد: نافذة السياق هي ذاكرة الوصول العشوائي (RAM)، وليست مساحة تخزين. سريع ومحدود. يُعاد تحديثه فور انتهاء الجلسة. لا يحتفظ بأي بيانات بين المحادثات إلا إذا قمت بحفظها في مكان دائم.

الرموز هي الوحدة الفعلية

الرموز هي الوحدات التي تحسبها النماذج فعليًا، وليست الأحرف أو الكلمات. عادةً ما تُحسب الكلمة الإنجليزية القصيرة برمز واحد، بينما تُقسم الكلمات الأطول إلى رمزين أو ثلاثة، وغالبًا ما تستخدم الشفرات وعلامات الترقيم والنصوص غير الإنجليزية عددًا أكبر من الرموز لكل حرف مما هو متوقع. تُسعّر معظم النماذج الحديثة كل مليون رمز مُدخل وكل مليون رمز مُخرج، حيث يكون الإدخال أرخص بكثير من الإخراج، ولكنه يتراكم بسرعة في الجلسات الطويلة لأن سجل المحادثة بالكامل يُحفظ في كل دور.

إذا كنت ستتذكر شيئًا واحدًا فقط عن الرموز، فتذكر هذا: يُعيد النموذج قراءة المحادثة بأكملها تقريبًا في كل دور. سجل المحادثة الطويل ليس مجانيًا.

سياق واسع لا يعني محادثة لا نهائية

نافذة 200 ألف أو 500 ألف أو مليون رمز هي ميزانية، وليست ترخيصًا. يستطيع النموذج تقنيًا معالجة كل ذلك، لكن الأداء العملي ليس ثابتًا عبر هذا النطاق. يزداد زمن الاستجابة مع حجم المدخلات، وكذلك التكاليف. أما الجودة، وهي الجانب الذي لا يرغب أحد في الاعتراف به، فترتفع ثم تنخفض. تُحقق معظم النماذج أفضل أداء لها مع المحتوى ذي الصلة الوثيقة في بداية الجلسة ونهايتها، بينما يكون أداؤها أسوأ مع المحتوى الكثيف في منتصف الجلسة الذي يتعين عليها فرزه للإجابة على السؤال الأخير.

تزيد النوافذ الأكبر من الحد الأقصى، لكنها لا تزيد من الحد الأدنى.

المحادثات الطويلة تُكلف أكثر في كل دور

مع ازدياد حجم الجلسة، يتعين على النموذج إعادة معالجة المزيد من السياق، مما يزيد من استخدام الرموز، وزمن الاستجابة، والتكلفة. هذا أمرٌ آلي، وليس فلسفيًا. كل رسالة جديدة تُرسلها تحمل معها المحادثة السابقة بأكملها.

لماذا تتراكم رموز الإدخال؟

قد تستخدم محادثة قصيرة بثلاث رسائل متبادلة بضعة آلاف من رموز الإدخال في كل دور. جلسة مراجعة تصميم مدتها ساعتان، مع إرفاق المستندات ولقطات الشاشة المُولّدة واقتباسات التعليمات البرمجية، قد تتجاوز بسهولة 50 ألف رمز إدخال في كل دورة دون أن تلاحظ ذلك. بحلول الدورة الأربعين من جلسة كهذه، ستجد نفسك تُنفق وقتًا أطول في إعادة قراءة ما سبق بدلًا من إنتاج الإجابة التالية.

الحسابات مُرهقة لكنها بسيطة. إذا تراكمت في جلسة ما 80 ألف رمز إدخال، فإن كل دورة جديدة تُغطي تكلفة هذه الرموز بالإضافة إلى أي بيانات مُولّدة. تتراكم هذه التكلفة دورةً بعد دورة لبقية الجلسة.

لماذا تنمو الجلسات التي تعتمد بكثافة على الأدوات بشكل أسرع؟

يُسرّع استخدام الأدوات من تراكم البيانات. في كل مرة يستدعي فيها نموذج أداةً ويحصل على استجابة، تُضاف مُخرجات الأداة إلى سياق الجلسة. عمليات قراءة الملفات الطويلة، ونتائج البحث الكبيرة، ومقارنات الملفات المتعددة، ومُخرجات الأوامر، وإنشاء الصور، كلها تظهر في نافذة البرنامج وتبقى هناك لبقية الجلسة.

جلسات الهندسة والتحليل هي الأسرع في استهلاك سياق الجلسة. جلسة برمجة تقرأ عشرات الملفات، وتُجري بعض الاختبارات، وتفحص السجلات، قد تستهلك 60% من نافذة بحجم 200 ألف قبل حتى أن يبدأ العمل الفعلي. وبحلول وقت وصول المهمة الفعلية، يكون النموذج قد بدأ بالفعل في التعامل مع بيئة عمل مزدحمة.

انخفاض الجودة قبل الوصول إلى الحد الأقصى

المشكلة الحقيقية لا تكمن فقط في الخروج عن السياق، بل في التدهور التدريجي للدقة الذي يحدث أولاً.

التدهور التدريجي مقابل الفشل التام

الفشل التام واضح. ترفض الجلسة استقبال مدخلات جديدة أو تقطع الرسائل. تلاحظ ذلك فورًا وتعرف بالضبط ما حدث.

التدهور التدريجي هادئ. يستمر النموذج في الاستجابة، لكن إجاباته تصبح أسوأ قليلاً. يبدأ بتكرار أخطاء سابقة. يتجاهل القيود التي حددتها قبل عشر رسائل. يلتقط تفاصيل خاطئة ويستمر في العمل بناءً عليها. يتجنب الخوض في التفاصيل المباشرة. تبدو الجلسة غير طبيعية، لكن لا يوجد عطل تقني.

التدهور التدريجي هو نمط الفشل الأكثر تكلفة لأنه الأصعب اكتشافًا.

كيف يُفسد السياق المُهمَل العمل الجيد

السياق ليس مجرد حجم، بل هو نسبة الإشارة إلى الضوضاء. فالجلسة المركزة المليئة بالتفاصيل ذات الصلة وبيان المشكلة الواضح تُؤدي أداءً مختلفًا عن الجلسة المُشتتة التي تحتوي على ثلاث أفكار مهملة، وقيدين قديمين تغيرا لاحقًا، وحديث جانبي عن موضوع آخر تمامًا.

النماذج التي تسعى إلى تقديم المساعدة تُعطي وزنًا لكل شيء في نافذة النقاش. إذا غيرت اتجاهك في منتصف الجلسة ولم تتراجع صراحةً عن الاتجاه السابق، فإن كلا الاتجاهين يتنافسان على التأثير. وتبدأ إجابات النموذج بالتنازل بينهما، وهذا التنازل نادرًا ما يكون ما تريده.

السياق المُشتت أسوأ من السياق الواسع

جلسة مركزة بنسبة 60% غالبًا ما تكون أفضل من جلسة فوضوية بنسبة 30% مليئة بالتفرعات غير المُجدية والعمل غير ذي الصلة. فكمية نافذة النقاش أقل أهمية من محتواها.

لماذا يُؤدي تغيير الموضوع إلى إبطاء الكفاءة؟

كل تغيير في الموضوع يُخلّف أثرًا. فالموضوع السابق لا يُحذف من السياق، بل يتوقف فقط عن كونه محور التركيز. لا يزال النموذج يأخذ هذا الأمر في الحسبان في كل خطوة لاحقة. إذا تنقلت بين ثلاث مهام غير مترابطة في جلسة واحدة، يُطلب من النموذج ضمنيًا موازنة المهام الثلاث حتى عندما تسأل عن مهمة واحدة فقط.

يظهر هذا على شكل مخرجات غير مترابطة. كود يحل مشكلة خاطئة لأن النموذج يفكر جزئيًا في نص التسويق الذي ناقشته قبل عشرين رسالة. اقتراحات تصميم ترث قيودًا من علامة تجارية أخرى ذكرتها عرضًا.

لماذا تُجدي جلسة واحدة لكل مسار عمل؟

أفضل نمط يتبناه معظم المستخدمين هو تخصيص مسار عمل واحد لكل جلسة. العمل على العلامة التجارية في محادثة، والعمل الهندسي في أخرى، والاستراتيجية أو التخطيط في ثالثة. يعني تبديل مسارات العمل بدء جلسة جديدة، وليس الانتقال بين سياقات داخل نفس الجلسة.

لا يتعلق الأمر هنا بالحرص المفرط، بل بإتاحة مساحة كافية للنموذج لكل نوع من العمل. تكلفة بدء جلسة جديدة تكاد تكون معدومة، بينما تكلفة إقحام سياق خاطئ في عملية اتخاذ القرار باهظة.

استخدم عتبات النسبة المئوية للسياق هذه

لا يحتاج معظم الناس إلى بيانات تتبع دقيقة، بل يحتاجون إلى عتبات عملية تُحدد لهم متى يستمرون ومتى يتوقفون. إليك الجدول الذي يمكنك تصويره.

| السياق المستخدم | الحالة | الشعور | الإجراء المطلوب |

|--------------|--------------|--------------------------------------------------------------|---------------------------------------------|

| من 0% إلى 40% | جيد | إجابات دقيقة، استجابة سريعة، تكلفة منخفضة | استمر، هذه هي منطقة الإنتاجية |

| من 40% إلى 60% | جيد | لا تزال الإجابات دقيقة، لكن التكاليف تتزايد | حافظ على تركيزك، وتجنب تغيير المواضيع |

| من 60% إلى 75% | تحذير | استجابة أبطأ، تشتت مؤقت، إعادة قراءة أكثر | اضغط أو لخص قبل إضافة عمل جديد |

| من 75% إلى 85% | بطيء | التأخير واضح، والأخطاء تتكرر، لذا يُنصح بالتحوط | إنهاء المهمة، وبدء جلسة جديدة |

85% فأكثر | إعادة ضبط | خطر التقصير، انخفاض حاد في الجودة، تكاليف غير اقتصادية | ضغط العمل وفقًا لخطة، ثم إعادة ضبط |

من 0% إلى 40% هي المنطقة الخضراء

تعامل مع هذه المرحلة كما لو كانت مطبخًا جديدًا. اعمل بحرية. مسار عمل واحد، تركيز دقيق، تكاليف تشغيل منخفضة. هنا يتم إنجاز معظم العمل عالي الجودة.

من 40% إلى 60% لا تزال جيدة

أنت في منتصف الطريق. يرتفع التأخير والتكلفة، لكن الجودة لا تزال ممتازة إذا حافظت الجلسة على تركيزها. قاوم الرغبة في إضافة مهام غير ذات صلة. الجلسة تُغطي تكلفة إعداد النموذج؛ لذا عليك الاستمرار في الاستفادة من ذلك.

من 60% إلى 75% هي نطاق التحذير

الأمور لا تزال تعمل، لكن النموذج يبذل جهدًا أكبر لإنجاز نفس المهمة. هناك خطوتان مفيدتان: تلخيص القرارات المتخذة حتى الآن في ملخص قصير، وحذف أي معلومات غير ضرورية (مثل الأساليب المهملة والمرفقات غير ذات الصلة). يُجنّبك ضغط المعلومات هنا إعادة ضبط أكبر بكثير لاحقًا.

من 75% إلى 85% هي منطقة التباطؤ

يتعلم كل مُشغّل يُجري جلسات طويلة الشعور بهذه المنطقة. تصبح الإجابات أبطأ، ويُعيد النموذج النظر في قراراته، ويتخلى عن بعض القيود. أنهِ المهمة الحالية، واحفظ النتيجة في ملف أو خطة، وابدأ المهمة التالية في جلسة جديدة.

فوق 85% يعني الضغط أو إعادة الضبط

أنت الآن تدفع ثمنًا باهظًا مقابل عائد متناقص. كما أن النموذج على وشك التوقف التام، وهو أسوأ من البدء من جديد. اضغط المعلومات المهمة في خطة واضحة، واحفظها خارج المحادثة، ثم أعد الضبط.

ابدأ محادثة جديدة مبكرًا

بدء محادثة جديدة لا يعني فقدان السياق إذا كانت معلوماتك الأساسية موجودة في الملفات والخطط والملاحظات المنظمة. يُتيح هذا الأسلوب للذاكرة العاملة العمل بكفاءة، مع الحفاظ على الذاكرة طويلة المدى في مكانها الصحيح.

متى يجب الاحتفاظ بالجلسة الحالية؟

استمر في العمل عندما يكون العمل عبارة عن مهمة واحدة متصلة، ونافذة السياق أقل من 60%، والجلسة مُركزة على مسار عمل واحد، والنموذج لا يزال يعمل بكفاءة عالية. هذه هي الجلسات التي يجب استغلالها بالكامل.

متى يجب إعادة الضبط فورًا؟

أعد الضبط عند تغيير مسارات العمل، أو عندما تتجاوز نافذة السياق 75%، أو عندما يبدأ النموذج بتكرار الأخطاء أو التردد، أو عندما تتراكم في الجلسة ثلاثة فروع جانبية أو أكثر. أعد الضبط أيضًا عند الانتهاء من مهمة منفصلة. تكلفة نقل مهمة منجزة إلى المهمة التالية غالبًا ما تكون أعلى من تكلفة البدء من جديد.

بناء الأنظمة، لا المحادثات الخالدة

أفضل مسارات عمل الذكاء الاصطناعي تخزن المعرفة الدائمة خارج المحادثة، حتى تظل الجلسات فعّالة ومنظمة. المحادثة هي الأداة، وليست الأرشيف.

استخدام المستندات والخطط وقوائم المراجعة

أرخص وسيلة تخزين خارجية هي ملف Markdown. خطة مختصرة، قائمة بالقرارات، قائمة بالخطوات التالية. أضفها إلى مشروعك، وليس إلى المحادثة. تبدأ الجلسات الجديدة بقراءة الملف، وهو ما يكلف جزءًا بسيطًا من تكلفة نقل سجل محادثة كامل بحجم 80 ألف كلمة.

حفظ سير العمل القابل لإعادة الاستخدام كمهارات

أي شيء تقوم به أكثر من مرتين يستحق أن يكون خارج المحادثة. عملية مراجعة تصميم قابلة للتكرار، نموذج تسليم قياسي، سير عمل بحثي. سجّله كمهارة قابلة لإعادة الاستخدام، أو قالب توجيه، أو ملاحظة نظام. ترث كل جلسة جديدة سير العمل دون أن ترث التفاصيل غير الضرورية.

يبدو إعداد الذكاء الاصطناعي الفعال أقل شبهاً بمحادثة عبقرية لا نهائية، وأكثر شبهاً بورشة عمل منظمة بأدوات حادة، وأدراج مُصنّفة، ودفتر ملاحظات جديد لكل مهمة. تبقى ورشة العمل، أما دفاتر الملاحظات فهي للاستخدام لمرة واحدة.

الأسئلة الشائعة

هذه هي الأسئلة التي يطرحها المستخدمون عندما يدركون أن المشكلة ليست في النموذج، بل في سير العمل.

هل يُحلّ سياق المليون رمز كل شيء؟

لا. نافذة المليون رمز ترفع الحد الأقصى، لكنها لا تُحسّن الأداء. فالجلسات الطويلة تُصبح أبطأ وأكثر تكلفة وأقل دقة قبل الوصول إلى الحد الأقصى. التحسين حقيقي للمهام التي تتطلب تحميل كمية كبيرة من البيانات ذات الصلة دفعة واحدة، مثل قراءة قاعدة بيانات كاملة أو مجموعة بيانات ضخمة. لكنها لا تُحوّل الجلسة الفوضوية إلى جلسة مُركّزة.

هل بدء محادثة جديدة يُؤثر سلبًا على استمرارية المحادثة؟

فقط إذا كانت الاستمرارية مُرتبطة بالمحادثة نفسها. إذا كانت قراراتك وخططك وتعليماتك مُخزّنة في ملفات، فإن المحادثة الجديدة تستكمل من حيث توقفت السابقة تمامًا، دون أي تشويش. معظم المُشغّلين الذين يشعرون بأن بدء جلسة جديدة "يُفقد السياق" يفقدون في الواقع النسخة الوحيدة من ذلك السياق، وهي مشكلة في سير العمل، وليست مشكلة في المحادثة.

كم مرة يجب إعادة ضبط جلسة الذكاء الاصطناعي؟

لا توجد وتيرة مُحدّدة. يُعاد ضبط الجلسة عند إنجاز مهمة محددة، أو عند التبديل بين مسارات العمل، أو عند تجاوز استخدام السياق 75%. بالنسبة للمستخدمين الذين يستخدمونها بكثرة، قد يحدث ذلك من ثلاث إلى عشر مرات يوميًا. أما بالنسبة للمستخدمين الذين يستخدمونها بشكل أقل، فقد يحدث ذلك مرة واحدة في الجلسة. العامل المُحفز هو العمل نفسه، وليس الوقت.

لماذا يصبح الذكاء الاصطناعي أبطأ في المحادثات الطويلة؟

لأن كل دور يُعيد قراءة سجل المحادثة بالكامل. ومع ازدياد حجم السجل، يزداد حجم المدخلات في كل دور، لذا فإن كل إجابة جديدة تتطلب موارد حاسوبية أكبر وتستغرق وقتًا أطول للبدء. أضف إلى ذلك مخرجات الأدوات والمرفقات وقراءة التعليمات البرمجية الكبيرة، وسيزداد حجم المدخلات أسرع من سرعة المحادثة نفسها.

تعامل مع الجلسات كمساحات عمل

أفضل طريقة لاستخدام الذكاء الاصطناعي هي الحفاظ على هوية المستخدم وذاكرته بشكل دائم، مع إمكانية حذف الجلسات.

الجلسات هي مساحات عمل. تقوم بإعدادها، وتستخدمها، ثم تحذفها. يتم حفظ العمل المهم في ملفات وخطط وملاحظات دائمة. لا يلزم بقاء الجلسة نفسها. من المفترض أن تكون سريعة الاستخدام.

يكمن الخطأ في التعامل مع المحادثات كعلاقة طويلة الأمد، متراكمة، يصعب التخلي عنها. هذا الخطأ هو ما يجعل استخدام الذكاء الاصطناعي يبدو أبطأ وأقل كفاءة مع مرور الوقت، حتى مع تطور النماذج الأساسية وتحسنها. المحادثة ليست شريكك في العمل، بل هي بيئة عمل. بيئة عمل منظمة أسرع من بيئة عمل مزدحمة، بلا شك.

ابنِ أنظمة أكثر تنظيمًا بدلًا من محادثات لا تنتهي. إذا كنت ترغب في المساعدة في تصميم سير العمل الفعلي لأدوات الذكاء الاصطناعي، وعلامتك التجارية، ومنتجك، تواصل معنا عبر الرابط استئجار Brainy. نحن نبني بيئة العمل، لا مجرد الرسائل.

Build cleaner AI systems instead of immortal chats. Brainy designs the workflows, not just the prompts.

Get Started