طراحی حافظه عامل: کتابچه راهنمای طراحان ۲۰۲۶
حافظه عامل، سطح طراحی جدید هوش مصنوعی است که هیچکس آن را آموزش نمیدهد. ویژگیهای حافظهای را بسازید که کاربران واقعاً به آنها اعتماد دارند، با ۴ نوع، ۵ اصل اعتماد، به علاوه یک کارگاه.

محصول هوش مصنوعی شما حالا چیزها را به خاطر میسپارد. شما آن بخش را طراحی نکردهاید، درست است؟
اکثر تیمها حافظه را در سالهای ۲۰۲۵ و ۲۰۲۶ به همان روشی که در سال ۲۰۱۲ اعلانها را ارسال میکردند، عرضه کردند، با روشن کردن آن، تماشای عصبانیت کاربران و وصله کردن بدترین شکایات. این یک راه خوب برای ساختن یک محصول فراموششدنی است. این یک راه وحشتناک برای اعتماد کردن کاربران به کارشان، تنظیماتشان و حقایق کوچک شرمآوری است که باعث میشود یک عامل احساس کند آنها را میداند.
این کتابچه راهنمای طراح برای حافظه عامل است. یک بار آن را بخوانید، سپس محصول خود را اصلاح کنید.
حافظه عامل در واقع چیست؟
حافظه عامل هر چیزی است که محصول شما در طول جلسات از یک کاربر به خاطر میسپارد و از آن برای تغییر رفتار آینده خود استفاده میکند. این کل تعریف است. کلمه کلیدی "استفاده برای تغییر" است، زیرا ذخیرهسازی بدون تغییر رفتار فقط یک پایگاه داده است و پایگاه داده یک مشکل طراحی نیست.
یک گزارش تاریخچه چت، حافظه نیست. لیستی از تنظیمات که مدل بیصدا به هر اعلان تزریق میکند، حافظه است. یک مخزن برداری از مکالمات گذشته که عامل در صورت لزوم جستجو میکند، حافظه است. زمینه پروژه پین شده در Claude یا دستورالعملهای سفارشی در GPT، آنها نیز حافظه هستند، فقط با اشکال و طول عمر متفاوت.
طراحان باید به سه ویژگی هر ویژگی حافظه اهمیت دهند. چه چیزی ذخیره میشود، چه زمانی استفاده میشود، و چه کسی میتواند آن را ببیند و تغییر دهد. اگر محصول شما در هر یک از این سه مورد مبهم باشد، کاربران شما نیز مبهم خواهند بود، و کاربران مبهم به چیزی که استفاده میکنند اعتماد ندارند.
چرا حافظه در سالهای 2025 و 2026 وارد جریان اصلی تجربه کاربری شد
سه چیز با هم همگرا شدند. ChatGPT حافظه را در اوایل سال 2025 برای همه ارسال کرد، Claude کمی بعد پروژههایی با زمینه پایدار را ارائه داد، و هزینه اجرای پنجرههای زمینه طولانی بالاخره به اندازهای کاهش یافت که "فقط همه چیز را به خاطر بسپار" دیگر یک نکته کلیدی نبود و به یک استراتژی محصول تبدیل شد. تا پایان سال 2025، حافظه یک کادر انتخاب استاندارد در راهاندازی محصولات هوش مصنوعی بود.
انتظار کاربر به سرعت برآورده شد. افرادی که هر روز از Claude، ChatGPT، Cursor و Granola استفاده میکنند، اکنون انتظار دارند که هر ابزار هوش مصنوعی جدیدی آنها را به خاطر بسپارد. وقتی اشتباه به خاطر میآورد، ناراحت میشوند و وقتی چیزهایی را که خودشان متوجه نشده بودند به او گفته بودند، به خاطر میآورد، وحشت میکنند.
عرضه محصولاتی با ویژگیهای حافظه به شدت افزایش یافته است. عرضه محصولاتی با طراحی خوب حافظه هنوز نزدیک به صفر است. این شکاف، فرصت است.
چهار نوع حافظه که هر طراح باید بداند
اکثر تیمها با حافظه به عنوان یک سطل نامتمایز رفتار میکنند. این اولین اشتباه است. چهار نوع مجزا وجود دارد و هر کدام الزامات ذخیرهسازی، سطحیسازی و اعتماد متفاوتی دارند.

ترجیحات انتخابهای اعلام شده کاربر در مورد نحوه رفتار عامل هستند. لحن، قالب، طول، زبان، آنچه باید از آن صرف نظر کرد، آنچه باید همیشه شامل شود. اینها صریح، با تغییر آهسته و با اعتماد بالا هستند. کاربران میخواهند این موارد را یک بار تنظیم کنند و فراموش کنند.
حقایق کاربر چیزهایی در مورد کاربر به عنوان یک شخص هستند. نام، نقش، شرکت، پروژههایی که روی آنها کار میکنند، ابزارهایی که استفاده میکنند، نام فرزندانشان در صورت اشاره به آنها. این موارد به سرعت جمع میشوند و حس صمیمیت ایجاد میکنند. کاربران میخواهند آنها را ببینند، ویرایش کنند و موارد عجیب را حذف کنند.
زمینه کار در حال انجام هر چیزی است که به یک کار خاص مرتبط است. خلاصه برند دیروز، سندی که کاربر روی آن کار میکند، دادههایی که سهشنبه گذشته در آن جایگذاری کردهاند. این در طول کار ارزش بالایی دارد و پس از آن صرفاً نویز است. چالش طراحی این است که بدانیم چه زمانی دیگر مفید نیست.
سیگنالهای رفتاری الگوهای استنباطی هستند که عامل برای پیشبینی آنچه باید انجام دهد استفاده میکند. کاربر همیشه کد را در TypeScript میخواهد، کاربر همیشه سه مفهوم اول لوگو را رد میکند، کاربر در ساعت ۹ شب سریعتر از ۹ صبح است. اینها مفیدترین و نامرئیترین هستند و این ترکیب آنها را به خطرناکترین تبدیل میکند.
پنج اصل اعتماد برای طراحی حافظه
پنج اصل وجود دارد. اگر از هر یک از آنها صرف نظر کنید، ویژگی حافظه شما تبدیل به یک مشکل میشود که منتظر اسکرینشات گرفتن و ارسال توسط یک کاربر عصبانی است.
قابل مشاهده. هر قطعه حافظهای که عامل استفاده میکند باید با یک کلیک از مکالمه قابل پیدا شدن باشد. نه در تنظیمات، نه در یک سند راهنما، نه در سه منو پنهان. اگر کاربر مجبور شود بپرسد "از کجا این را میداند"، شما از قبل باختهاید.
قابل ویرایش. هر ورودی حافظه باید به صورت متن قابل ویرایش و با یک کلیک قابل حذف باشد. تکرار مکررات "ما از این برای بهبود مدل خود استفاده خواهیم کرد" ممنوع است. کاربر آن را نوشته، مالک آن است، کاربر میتواند اکنون آن را حذف کند و دیگر وجود ندارد.
محدودهبندی شده. حافظه باید یک محدوده اعلام شده داشته باشد. برای هر مکالمه، برای هر پروژه، برای هر حساب. ترجیح پاسخهای مختصر در ویرایشگر کد شما نباید به چتبات درمانی شما سرایت کند. محدوده بخشی است که اکثر محصولات اشتباه میکنند و این شکست است که سریعترین اعتماد را از بین میبرد.
منقضیشدنی. حافظه باید طول عمر داشته باشد، چه توسط کاربر اعلام شود و چه توسط سیستم استنباط شود. زمینهی کار در حال انجام باید هنگام ارسال کار از بین برود. اگر رفتار تغییر کند، سیگنالهای رفتاری باید از بین بروند. حافظهای که برای همیشه زنده است، به نشت آهستهی دادههای قدیمی تبدیل میشود که هر پاسخ آینده را مسموم میکند.
قابل استخراج. کاربران باید بتوانند حافظهی خود را در قالبی قابل خواندن صادر کنند و آن را به جای دیگری ببرند. JSON، markdown، متن ساده، یکی را انتخاب کنید. این اصلی است که بقیه را اثبات میکند، زیرا هیچ چیز مانند نوشتن لایهی حافظه برای خواندن توسط شخص دیگری، وضوح را تحمیل نمیکند.
حافظهی ChatGPT و مشکل بهروزرسانیهای خاموش
حافظهی ChatGPT پرکاربردترین ویژگی حافظه در جهان است. همچنین همان چیزی است که به وضوح نشان میدهد وقتی چند اصل را رعایت میکنید و اصول دیگر را از دست میدهید، چه اتفاقی میافتد.

بخش قابل مشاهده مناسب است. یک کشوی حافظه وجود دارد، میتوانید آن را باز کنید، میتوانید ورودیها را ببینید. بخش قابل ویرایش کار میکند، میتوانید یک ورودی را حذف کنید و آن را از بین ببرید. تا اینجا خوب بوده است.
بهروزرسانیهای بیصدا جایی است که از هم میپاشد. ChatGPT ورودیهای حافظه جدید را در طول مکالمه عادی بدون درخواست مینویسد و تنها سیگنال، یک پیام کوچک "حافظه بهروز شد" است که در عرض دو ثانیه ناپدید میشود. کاربران به طور معمول ماهها حقایق انباشته شدهای را که هرگز به صراحت تأیید نکردهاند، کشف میکنند، از جمله استنباطهای اشتباه و اطلاعات جزئی شرمآور از یک چت تکنفره. رفتار پیشفرض باعث تعجب میشود و تعجب نقطه مقابل اعتماد است.
راه حل، یک درخواست مجوز کوچک در ده بار اول ذخیره حافظه، به علاوه یک خلاصه هفتگی است که نشان میدهد از آخرین بررسی کاربر چه چیزی اضافه شده است. هیچکدام وجود ندارند. این یک تصمیم طراحی است، نه یک محدودیت فنی.
حافظه Claude در پروژهها، و آنچه درست انجام میدهد
رویکرد Claude برعکس رویکرد ChatGPT است. حافظه در Claude بیشتر درون پروژهها قرار دارد که کانتینرهای ایجاد شده توسط کاربر با دستورالعملهای صریح و فایلهای آپلود شده هستند. کاربر پروژه را ایجاد میکند، نامگذاری میکند و آن را با متن پر میکند. حافظه با ساخت انتخاب میشود.
این مشکل محدوده را به طور واضح حل میکند. پروژه "استراتژی بازاریابی" شما پروژه "دفترچه درمانی" شما را آلوده نمیکند، زیرا آنها کانتینرهای جداگانهای با متن جداگانه هستند. کاربر مرز را درک میکند زیرا کاربر آن را ترسیم کرده است.
مقابله این است که Claude کار کمتری برای شما انجام میدهد. هیچ حافظه خودکاری از تنظیمات شما در بین پروژهها وجود ندارد، بنابراین در نهایت خودتان را تکرار میکنید. ویژگیهای جدیدتر حافظه Claude شروع به پر کردن این شکاف کردهاند، اما درس طراحی از قبل واضح است. محدودههای ترسیم شده توسط کاربر، محدودههای استنتاج شده توسط سیستم را از نظر اعتماد شکست میدهند، حتی اگر کمی راحتی داشته باشند.
قوانین مکاننما، الگوی .cursorrules و حافظه به عنوان کد
مکاننما کاملاً از یک مدل متفاوت استفاده میکند. قوانین پروژه در فایلی در مخزن به نام .cursorrules یا در .cursor/rules/ قرار دارند. توسعهدهندگان قوانین را به صورت متن ساده مینویسند، آنها را به گیت اختصاص میدهند و عامل در هر تعامل آنها را میخواند.
این حافظه به عنوان کد است. این حافظه تمام ویژگیهای اصول اعتماد را به صورت رایگان دارد، زیرا فایلهای متنی در یک مخزن طبق تعریف قابل مشاهده، قابل ویرایش، محدودهبندی شده و قابل استخراج هستند. تنها نقطه ضعف، انقضا است که توسعهدهنده باید با ویرایش فایل آن را مدیریت کند.
درسی که برای محصولات غیر توسعهدهنده باید گرفت این نیست که "یک فایل پیکربندی ارسال کنید". درس این است که حافظهای که میتوانید به عنوان یک سند واحد بخوانید، نسبت به حافظهای که باید از طریق یک رابط کاربری جستجو کنید، امنتر به نظر میرسد. وقتی یک کشوی حافظه طراحی میکنید، ابتدا نمای سند و سپس ویرایشگر را روی آن طراحی کنید.
گرانولا، دستورالعملهای سفارشی GPT و دنباله طولانی اشکال حافظه
گرانولا، ابزار یادداشتهای جلسه، با هر دفترچه یادداشت به عنوان زمینه خاص خود رفتار میکند. عامل آنچه را که در دفترچه یادداشت است میخواند تا یادداشتهای جدید بنویسد. هیچ حافظه جهانی از شما به عنوان یک کاربر وجود ندارد. شکل این است: «حافظه هر چیزی است که در اتاق است»، که به این دلیل کار میکند که جلسات به طور طبیعی محدود هستند.
دستورالعملهای سفارشی GPT قدیمیترین شکل حافظه در دوران هوش مصنوعی مدرن هستند. سازنده یک اعلان سیستم مینویسد، کاربر GPT را انتخاب میکند، اعلان هر پاسخ را شکل میدهد. این شکننده است، سازگار نمیشود و هنوز هم پرکاربردترین مکانیسم حافظه بر اساس تعداد خام است زیرا بسیار ساده و کاملاً خوانا است.
الگوی همه اینها این است که بهترین طراحیهای حافظه، کاربر را نویسنده حافظه میکنند. بدترینها، سیستم را نویسنده و کاربر را مخاطب قرار میدهند.

چهار حالت شکست که باید در برابر آنها طراحی کنید
هر ویژگی حافظه به یکی از چهار روش شکست میخورد. آنها را نام ببرید، مراقب آنها باشید، آنها را در بررسی طراحی از بین ببرید.
خزش. حافظه سریعتر از آنکه کاربر بتواند آن را اصلاح کند، انباشته میشود. پس از سه ماه، کاربر ۴۰۰ ورودی دارد که نیمی از آنها اشتباه یا قدیمی هستند و هیچ راه واقعبینانهای برای پاک کردن آنها وجود ندارد. این مشکل را با استفاده از caps، decay timers و ابزارهای bulk-delete برطرف کنید.
شگفتی. عامل از حافظهای استفاده میکند که کاربر از وجود آن بیخبر بوده و کاربر احساس میکند که تحت نظر است. این مشکل را با افشای پیشگیرانه، یک affordance با عنوان «چرا این را گفتی» در هر پاسخ و تأیید صریح در اولین باری که از یک حافظه استفاده میشود، برطرف کنید.
قفل شدن. کاربر نمیتواند آنجا را ترک کند زیرا حافظهاش در محصول شما گیر افتاده است. این مشکل را با خروجی گرفتن با یک کلیک به فرمت قابل حمل، بدون نیاز به ایمیل بازاریابی و بدون نیاز به تیکت پشتیبانی برطرف کنید.
حفره حافظه. عامل چیزی را که کاربر بیشتر از همه به خاطر سپردن آن نیاز دارد فراموش میکند. کاربر پنج بار متن یکسانی را تکرار میکند و محصول را عوض میکند. این مشکل را با پین کردن صریح، یک دکمه «این را به خاطر بسپار» که آنچه را که میگوید انجام میدهد و یک بازرس حافظه که وجود ورودی را ثابت میکند، برطرف کنید.
انتخاب کنید که محصول شما در حال حاضر به کدام یک از این موارد نزدیکتر است. این نقشه راه شما برای سه ماهه بعدی است.
واژگان طراحی برای ویژگیهای حافظه
شما نمیتوانید چیزی را که نمیتوانید نامگذاری کنید، طراحی کنید. این واژگان کاربردی است که بهترین تیمها روی آن همگرا شدهاند، با تعاریفی که میتوانید از آنها کپی کنید.
کارت حافظه واحد اتمی حافظه ذخیره شده است. یک کارت، یک حقیقت یا ترجیح، یک مهر زمانی، یک اسکوپ، یک منبع. کارتها را همانطور که پیامها را نشان میدهید، با قابلیت نمایش ثابت روی هر کدام، نشان دهید.
تراشه اسکوپ قرص کوچکی است که محدوده یک حافظه یا یک جلسه را اعلام میکند. "این مکالمه"، "این پروژه"، "تمام کار شما"، "همه چیز". تراشههای اسکوپ روی کارتهای حافظه، روی مکالمات و روی پاسخهای خود عامل هنگام استناد به حافظه قرار میگیرند.
تایمر زوال یک برچسب شمارش معکوس یا انقضای قابل مشاهده روی یک ورودی حافظه است. "۱۴ روز دیگر منقضی میشود"، "تا زمان بسته شدن پروژه نگه داشته میشود"، "دائمی". تایمرهای زوال ایده انتزاعی انقضا را به چیزی تبدیل میکنند که کاربر میتواند ببیند و تغییر دهد.
ردیابی حسابرسی گزارشی از کاری است که عامل انجام داده و چرا، از جمله خاطراتی که در هر پاسخ استفاده کرده است. این را به یک قابلیت دسترسی با یک کلیک برای هر پیام تبدیل کنید. اولین محصولی که بتواند مسیرهای حسابرسی برای پاسخهای هوش مصنوعی را به خوبی بررسی کند، بازار اعتماد را برای دهه آینده در اختیار خواهد داشت.
بازرس حافظه نمای تمام صفحه از تمام حافظه ذخیره شده است که بر اساس دامنه، قابل فیلتر کردن بر اساس منبع و قابل مرتبسازی بر اساس تازگی سازماندهی شده است. این مهمترین صفحه در محصول هوش مصنوعی شماست و اکثر محصولات آن را ندارند.
کارگاه طراحی ویژگی حافظه
در اینجا یک کارگاه شش مرحلهای وجود دارد که میتوانید در یک بعد از ظهر برای طراحی یک ویژگی حافظه از ابتدا اجرا کنید. یک طراح، یک مدیر محصول و یک مهندس که لایه مدل را میشناسد، بیاورید.

-
چهار نوع حافظه را برای محصول خود فهرست کنید. برای هر نوع یک جمله بنویسید که توصیف میکند نماینده شما باید در آن دسته چه چیزی را به خاطر بسپارد. اگر نوعی اعمال نمیشود، آن را به صراحت حذف کنید.
-
بازرس حافظه را رسم کنید. فقط بازرس، بدون صفحه نمایش دیگر. یک کارت حافظه واحد چه شکلی است، چه فیلترهایی وجود دارد، کاربر چه چیزی را میتواند حذف، ویرایش، پین یا صادر کند. ۳. محدوده پیشفرض هر نوع را تعیین کنید. برای هر مکالمه، برای هر پروژه یا سراسری. از هر انتخاب در یک جمله دفاع کنید. اگر نمیتوانید از آن دفاع کنید، پیشفرض اشتباه است.
۴. سیاست انقضا را برای هر نوع تنظیم کنید. یا یک مدت زمان ثابت، یک رویداد وابسته مانند "بسته شدن پروژه" یا "دائمی تا زمانی که کاربر حذف کند". هیچ نوع دادهای نباید مبهم باشد.
۵. افشای اطلاعات را طراحی کنید. کاربر چگونه میداند چه زمانی حافظه ذخیره میشود، چه زمانی استفاده میشود و چه زمانی بهروزرسانی میشود. در مورد تستها، نشانها، استنادهای درونخطی و خلاصههای هفتگی دقیق باشید.
۶. قالب خروجی را بنویسید. یک ویرایشگر متن باز کنید و JSON یا markdown را که دکمه خروجی شما برای یک کاربر پرکار با ۲۰۰ ورودی حافظه تولید میکند، بنویسید. اگر مانند یک رونوشت از پایگاه داده خوانده میشود، آن را دوباره طراحی کنید تا مانند یادداشتها خوانده شود.
این کارگاه است. آن را قبل از اولین خط کد حافظه خود اجرا کنید و پس از راهاندازی، وقتی متوجه شدید کاربران واقعاً از چه چیزی استفاده میکنند، دوباره آن را اجرا کنید.
مقایسهای سریع از جایگاه محصولات اصلی
در اینجا کارت امتیازی محصولاتی که امروزه اکثر تیمها به آنها ارجاع میدهند، آمده است. میزان پیشرفت شما با بهروزرسانیهای این محصولات متفاوت خواهد بود، اما الگوی نقاط قوت و ضعف آنها ثابت است.
| محصول | قابل مشاهده | قابل ویرایش | محدودهبندی شده | قابل انقضا | قابل صدور |
|---|---|---|---|---|---|
| حافظه ChatGPT | جزئی | بله | ضعیف | خیر | خیر |
| پروژههای Claude | بله | بله | قوی | دستی | جزئی |
| دفترچههای یادداشت گرانولا | بله | بله | بله | قوی | ناموجود |
| دستورالعملهای سفارشی GPT | بله | بله | قوی | دستی | بله |
الگو واضح است. محصولاتی که به کاربر اجازه ایجاد کانتینر را میدهند، بالاترین امتیاز را در محدوده و قابلیت صدور دارند و هزینه آن را با راحتی پرداخت میکنند. محصولاتی که حافظه را خودکار میکنند، بالاترین امتیاز را در راحتی کسب میکنند و هزینه آن را با اعتماد پرداخت میکنند. هنوز هیچ محصولی وجود ندارد که واقعاً هر دو مشکل را حل کرده باشد، به همین دلیل است که این هنوز یک فضای طراحی بسیار باز است.
این به چه معناست برای دو تا سه سال آینده
سه پیشبینی، که همگی به اندازه کافی مطمئن هستند که بتوان روی آنها شرطبندی کرد.
بازرسان حافظه به یک سطح استاندارد محصول تبدیل میشوند. ظرف 18 ماه، هر محصول جدی هوش مصنوعی یک صفحه نمایش حافظه اختصاصی خواهد داشت و کیفیت آن صفحه نمایش سه دلیل اصلی انتخاب یک محصول به جای محصول دیگر توسط کاربران خواهد بود. همین حالا طراحی محصول خود را شروع کنید.
اصول اعتماد تنظیم میشوند. قابلیت مشاهده، ویرایش و قابلیت صادرات حافظه هوش مصنوعی در قانون حفظ حریم خصوصی، احتمالاً ابتدا در اتحادیه اروپا، و احتمالاً به طور گسترده تا سال 2028، ظاهر خواهد شد. محصولاتی که به جای کار انطباق، آنها را به عنوان ویژگی در نظر میگیرند، بخش اعتماد بالا را به خود اختصاص خواهند داد.
حافظه به برند تبدیل میشود. دلیل اینکه مردم یک محصول هوش مصنوعی را به محصول دیگر ترجیح میدهند، دیگر کیفیت مدل نیست و به این بستگی دارد که محصول چقدر خوب آنها را به خاطر میسپارد. مدل یک کالا است، حافظه خندق است. طراحانی که آن خندق را برای محصولات خود در اختیار دارند، ارزشمندترین افراد در تیمهای هوش مصنوعی در این چرخه خواهند بود.
شما اکنون چارچوب را دارید. محصول خود را باز کنید، یک ویژگی حافظه پیدا کنید که یکی از پنج اصل را نقض میکند و این هفته آن را اصلاح کنید.
حافظه یک مشکل تنظیمات نیست. این یک مشکل رابطهای است که در قالب ذخیرهسازی پوشیده شده است. هر ورودی حافظه، ادعای کوچکی است که محصول شما در مورد اینکه کاربر کیست، مطرح میکند و این ادعا یا با تصویر ذهنی کاربر مطابقت دارد یا از آن انتقاد میکند.
تیمهایی که در این چرخه پیروز میشوند، حافظه را مانند جستجوی کارکنان یا ورود به سیستم، مدیریت میکنند. یک مالک اختصاصی، بررسیهای هفتگی از آنچه ذخیره شده و چرا، معیارهای واقعی در مورد دقت حافظه و اعتماد کاربر. این یک تلاش جانبی برای یک مهندس backend نیست.
اگر نقشه راه شما برای سه ماهه بعدی کار حافظه ندارد، نقشه راه اشتباه است. سند را باز کنید، کار را اضافه کنید، مالک را تعیین کنید. فرصت زود رسیدن به سرعت در حال از دست رفتن است.
Need a designer who actually understands AI products? Hire Brainy to design your memory layer.
Get Started

