ai for designersApril 28, 202614 min read

الگوهای طراحی رابط کاربری عامل هوش مصنوعی: نحوه ساخت رابط کاربری برای ابزارهای خودمختار

یک کتابخانه الگوی کاربردی برای طراحی رابط کاربری عامل هوش مصنوعی. هشت بررسی واقعی محصول از Claude Code، Cursor، Devin، Linear، ChatGPT Operator، Replit Agent، Bolt و v0، به علاوه هفت الگویی که هر رابط کاربری عامل به آن نیاز دارد.

By Boone

X LinkedIn

طراحی رابط کاربری عامل هوش مصنوعی، طراحی چت با خودمختاریِ پیچیده نیست. یک عامل، یک کارگر خودمختار است که هدفی را در پیش می‌گیرد، مسیری را برنامه‌ریزی می‌کند و بدون اجازه گرفتن برای هر مرحله، ابزارها را اجرا می‌کند. رابط کاربری برای آن کارگر، یک سطح کنترل است، نه یک مکالمه. محصولاتی که تمیزترین رابط‌های کاربری عامل را ارائه می‌دهند، از همان اولین وایرفریم، با آن اینگونه رفتار می‌کنند.

هفت الگو در هر رابط کاربری عاملی که ارزش استفاده دارد، نشان داده می‌شود. چارچوب‌بندی وظایف، کنترل‌های خودمختاری، سطح برنامه، جریان پیشرفت، دروازه‌های تأیید، بازیابی خطا و تحویل‌های عامل. اکثر محصولات امروزی چهار مورد از این هفت مورد را ارائه می‌دهند و وانمود می‌کنند که سه مورد دیگر اهمیتی ندارند. نتیجه، رابطی است که به خوبی نمایش داده می‌شود و در استفاده واقعی از هم می‌پاشد.

این قطعه، راه حل عملیاتی است. هفت الگو، هشت نمونه از Claude Code، Cursor، Devin، Linear AI، ChatGPT Operator، Replit Agent، Bolt و v0، سه اشکال رایج و رفع دقیق آنها، و یک چک لیست پانزده دقیقه‌ای قبل از ارسال که هر طراح می‌تواند قبل از اینکه رابط کاربری با یک کاربر واقعی تماس پیدا کند، اجرا کند.

رابط‌های کاربری عامل، سطوح کنترل هستند، نه پنجره‌های چت

یک رابط کاربری عامل هوش مصنوعی، رابطی برای یک کارگر مستقل است. مشکل طراحی بیشتر به یک عرشه پرواز شبیه است تا یک رشته چت. کاربر دیگر در حال تایپ کردن به جلو و عقب نیست، آنها یک هدف را تعیین می‌کنند و بر یک فرآیند نظارت دارند.

یک رابط کاربری چت برای نوبت‌گیری بهینه می‌شود. یک رابط کاربری عامل برای وضوح هدف، قابلیت مشاهده برنامه، تله‌متری پیشرفت و قابلیت‌های لغو بهینه می‌شود. اکثر محصولات اولیه عامل با گسترش چت با چند شاخص "تفکر" و یک گزارش استفاده از ابزار، این اشتباه را مرتکب شدند. کاربر به یک رشته چت خیره شده بود، بدون اینکه راهی برای دیدن طرح، توقف اجرا و بازیابی پس از انحراف عامل داشته باشد. با رابط کاربری عامل به عنوان یک سطح کنترل رفتار کنید و هفت الگوی زیر دیگر اختیاری نیستند و بار اضافی به دوش می‌کشند.

هفت الگویی که هر رابط کاربری عامل به آن نیاز دارد

قالب‌بندی وظیفه، اسلایدر استقلال، سطح برنامه، جریان پیشرفت، دروازه تأیید، بازیابی خطا و انتقال عامل. هر رابط کاربری عامل که امروزه ارسال می‌شود ترکیبی از این هفت مورد است.

قالب‌بندی وظیفه نحوه بیان هدف توسط کاربر است. کنترل‌های استقلال نحوه انتخاب میزان طنابی است که عامل دریافت می‌کند. سطح برنامه جایی است که عامل قبل از عمل، به دنباله‌ای از مراحل متعهد می‌شود. جریان پیشرفت، فید زنده‌ای از کاری است که عامل در حال حاضر انجام می‌دهد. دروازه تأیید لحظه آهسته قبل از یک اقدام مخرب است. بازیابی خطا مسیر بازگشت از یک مرحله ناموفق است. انتقال عامل، تخلیه وضعیت است که یک وظیفه را از عامل به انسان یا عامل به عامل بدون از دست دادن زمینه منتقل می‌کند.

نمودار وکسل از هفت بلوک سنگین کوچک که در یک ردیف افقی روی کف استودیو چیده شده‌اند، هر بلوک یک رنگ مات متفاوت دارد، با برچسب‌های تک کلمه‌ای که این عبارات را می‌خوانند: قاب، استقلال، طرح، پیشرفت، تأیید، بازیابی، تحویل، تعویض

هفت مورد از نظر وزن یکسان نیستند، اما همه آنها ضروری هستند. محصولی که چارچوب‌بندی وظایف را بدون سطح برنامه ارائه می‌دهد، یک بازی حدس و گمان است. محصولی که همه چیز را به جز دروازه‌های تأیید ارائه می‌دهد، یک حادثه مخرب در انتظار وقوع است. الگوها پیچیده می‌شوند. نادیده گرفتن یکی، بقیه را تضعیف می‌کند.

چارچوب‌بندی وظایف، قرارداد را تعیین می‌کند

چارچوب‌بندی وظایف بد، یک جعبه گفتگوی عمومی است که در آن کاربر یک جمله مبهم تایپ می‌کند و عامل بقیه را با فرضیات پر می‌کند. چارچوب‌بندی وظایف خوب، یک ورودی ساختاریافته است که موارد خاصی را که عامل باید بداند، درخواست می‌کند.

ویژگی‌های هوش مصنوعی Linear این کار را به خوبی انجام می‌دهند. کاربر یک خلاصه کوتاه تایپ می‌کند و هوش مصنوعی آن را به یک مسئله ساختاریافته با عنوان، توضیحات، برچسب‌ها و یک تکلیف پروژه که کاربر می‌تواند قبل از انجام ویرایش کند، تجزیه می‌کند. چارچوب‌بندی محدود است، خروجی ساختاریافته است و قبل از انجام ویرایش، یک امکان ویرایش واضح وجود دارد.

سطح چارچوب‌بندی باید به اندازه خود وظیفه ساختاریافته باشد. یک وظیفه کدنویسی به یک هدف، یک فایل هدف، یک معیار پذیرش نیاز دارد. یک وظیفه اتوماسیون وب به یک URL شروع، یک اقدام هدف و یک شرط توقف نیاز دارد. ورودی چت عمومی برای کاوش مناسب و برای تولید ناقص است.

کنترل‌های خودمختاری به کاربر اجازه می‌دهند تا افسار را انتخاب کند.

اعتماد یک چیز ثابت نیست و یک تنظیم واحد همه وظایف را پوشش نمی‌دهد.

Claude Code این کار را با سیستم مجوز خود انجام می‌دهد. کاربر می‌تواند در حالتی اجرا شود که هر فراخوانی ابزار نیاز به تأیید دارد، ابزارهای رایج به طور خودکار تأیید می‌شوند و ابزارهای پرخطر هنوز در حالت دروازه هستند، یا در حالت خودمختاری کامل. این حالت قابل مشاهده و تغییر در اواسط جلسه است و کاربر دقیقاً می‌داند که عامل روی کدام افسار قرار دارد.

اکثر محصولات یک تنظیم خودمختاری را در محصول ارائه می‌دهند که در محصول تعبیه شده است، بدون کنترل هر وظیفه، بدون وضعیت قابل مشاهده. کاربر هیچ ایده‌ای ندارد که آیا عامل قبل از استقرار، قبل از حذف، قبل از ارسال ایمیل سؤال خواهد کرد یا خیر. این عدم قطعیت کاربران را به مراقبت وسواسی یا اعتماد کورکورانه آموزش می‌دهد. هر دو حالت شکست هستند.

سطح طرح، اولین وعده‌ی عامل است

قبل از اینکه عامل عمل کند، باید نشان دهد که قصد انجام چه کاری را دارد. این طرح باید قابل خواندن، ویرایش و رد کردن باشد.

دیوین یکی از اولین سطوح طرح را که کار می‌کرد، ارسال کرد. عامل یک طرح تولید می‌کند، کاربر هر مرحله را به صورت درون خطی ویرایش می‌کند، مراحل را حذف می‌کند، مراحلی اضافه می‌کند یا کل طرح را رد می‌کند. پس از تأیید، طرح به گزارش اجرا تبدیل می‌شود و هر مرحله هنگام کار عامل روی آن روشن می‌شود. سطح طرح و جریان پیشرفت در دو حالت، قبل از اجرا و در حین اجرا، یک سطح هستند که انتخاب معماری مناسبی است.

ترکیب وکسل از دو سطح روی هم چیده شده در کف استودیو، سمت چپ یک پشته عمودی از کاشی‌های طرح پله‌ای با یک علامت چک‌باکس و سمت راست یک ستون بلند که نوارهای پیشرفت افقی را مانند یک گزارش زنده به صورت نزولی نشان می‌دهد.

یک اشکال رایج. محصولاتی که یک طرح را به عنوان یک پاراگراف نثر به جای یک لیست ساختار یافته نشان می‌دهند. این طرح در واقع قابل ویرایش نیست، به این معنی که کاربر یا کورکورانه تأیید می‌کند یا دوباره درخواست می‌دهد. این رفع اشکال به صورت ماشینی ساختار یافته است: لیستی از مراحل گسسته، هر مرحله یک ردیف، هر ردیف قابل ویرایش.

جریان پیشرفت، حلقه اعتماد است

عامل در حال کار است و کاربر منتظر است، بنابراین جریان پیشرفت تنها چیزی است که بین کاربر و تصمیم برای از بین بردن اجرا قرار دارد.

سطح عامل مکان‌نما این کار را درست انجام می‌دهد. همانطور که عامل فایل‌ها را ویرایش می‌کند، تفاوت به صورت زنده در ویرایشگر ظاهر می‌شود. همانطور که دستورات را اجرا می‌کند، خروجی ترمینال به صورت بلادرنگ پخش می‌شود. کاربر می‌تواند هر لحظه تماشای خود را متوقف کند و به یک گزارش کامل برگردد. اعتماد کوتاه است زیرا جریان صادقانه است.

آن را با عاملی مقایسه کنید که خلاصه‌ای به سبک چت مانند "من اکنون در حال بررسی مرحله بعدی هستم" را پخش می‌کند در حالی که بی‌سروصدا ده فراخوانی ابزار را در پس‌زمینه اجرا می‌کند. خلاصه یک پرده دود است. هر فراخوانی ابزار و ویرایش فایل را در یک گزارش ساختاریافته پخش کنید و استدلال مدل را در یک خلاصه یک خطی برای هر مرحله فشرده کنید. اشتباه گرفتن این دو، اعتماد را از بین می‌برد.

دروازه‌های تأیید از حرکات مخرب محافظت می‌کنند

برخی از اقدامات قابل لغو نیستند و رابط کاربری باید آن لحظات را عمداً کند کند.

ChatGPT اپراتور این کار را در وب باز انجام می‌دهد. وقتی عامل می‌خواهد فرمی را ارسال کند، اطلاعات پرداخت را پر کند یا اقدامی برای دسترسی به حساب انجام دهد، مکث می‌کند و از کاربر می‌خواهد که تأیید، اصلاح یا لغو کند. مکث قابل مشاهده است، اقدام به صورت متن ساده شرح داده می‌شود و کاربر می‌تواند جلسه مرورگر را به صورت دستی در دست بگیرد.

ترکیب وکسل از یک دروازه طاق‌دار مرجانی سنگین در کف استودیو با دو دکمه وکسل در پایه آن، یک مکعب سبز CONFIRM و یک مکعب کوچک‌تر کهربایی CANCEL، با یک علامت کوچک عامل که در سمت دیگر دروازه متوقف شده است.

اشتباهی که اکثر محصولات مرتکب می‌شوند این است که با هر عملی با وزن تأیید یکسان رفتار می‌کنند. یا همه چیز را مسدود می‌کند، به کاربران آموزش می‌دهد که بدون خواندن کلیک کنند، یا هیچ چیز را مسدود نمی‌کند، و به عامل اجازه می‌دهد آسیب‌های جبران‌ناپذیری وارد کند. اقدامات را به سه شدت تقسیم‌بندی می‌کند. دروازه نرم برای نوشته‌های برگشت‌پذیر (یک بنر لغو سی ثانیه‌ای). دروازه سخت برای اقدامات مخرب (یک مودال تأیید). دروازه دو مرحله‌ای برای اقدامات فاجعه‌بار (یک مودال به علاوه یک عبارت تأیید تایپ شده).

بازیابی خطا نیمی از محصول است

عامل‌ها دائماً شکست می‌خورند، و محصولاتی که قابل اعتماد به نظر می‌رسند، آنهایی هستند که تمیزترین سطوح بازیابی را دارند، نه آنهایی که بالاترین میزان موفقیت را دارند.

Bolt و v0 این کار را به خوبی انجام می‌دهند. وقتی یک ساخت با شکست مواجه می‌شود، خطا به صورت درون‌خطی ظاهر می‌شود، عامل سعی در رفع آن می‌کند و کاربر می‌تواند اجازه دهد که آن را تکرار کند یا مستقیماً وارد شود و کد را ویرایش کند. وضعیت در طول تلاش‌ها حفظ می‌شود.

بیشتر محصولات در اینجا شکست می‌خورند. خطایی رخ می‌دهد، عامل متوقف می‌شود، کاربر با این پیام مواجه می‌شود که "چیزی اشتباه پیش رفته است، می‌خواهم دوباره امتحان کنم" بدون اینکه بداند سیستم در چه وضعیتی است. هر خطایی به یک وضعیت مشخص، مجموعه‌ای از گزینه‌های بازیابی (تلاش مجدد، ویرایش، تصاحب، رها کردن) و ضمانت حفظ وضعیت نیاز دارد. خطاها تجربه‌ای عینی برای یک عامل در استفاده واقعی هستند، نه یک اتفاق نادر.

تحویل‌های عامل به یک سند کاغذی نیاز دارند

وقتی یک وظیفه از عامل به انسان یا عامل به عامل دیگر منتقل می‌شود، طرف دریافت‌کننده بدون نیاز به پرسیدن، به وضعیت کامل نیاز دارد.

ویژگی‌های هوش مصنوعی Linear این مشکل را با نوشتن به‌روزرسانی‌های ساختاریافته در مشکل برطرف می‌کند. هم‌تیمی بعدی متن کامل را به صورت درون‌خطی دارد. بدون داشبورد جداگانه، بدون ابزار اضافی. هر انتقال باید یک مصنوع state-dump (یک نظر ساختاریافته، یک خلاصه تولید شده، یک چک‌پوینت ذخیره شده) تولید کند که گیرنده بتواند در کمتر از سی ثانیه آن را بخواند. اگر گیرنده مجبور باشد بپرسد "از کجا رها کردی"، انتقال ناموفق بود. همان نظم خوب مهندسی سریع برای طراحان از هر گردش کار قابل استفاده مجددی می‌طلبد.

هشت رابط کاربری عامل واقعی، حاشیه‌نویسی شده

الگوها فقط در صورتی اهمیت دارند که در تماس با محصولات ارسال شده دوام بیاورند. هشت مورد در حال حاضر در حال تولید هستند، هر کدام کوتاه، هیچ کدام کامل نیستند.

Claude Code، رابط کاربری عامل به عنوان ترمینال شفاف

Claude Code تمیزترین رابط کاربری عامل ارسال شده تا به امروز است زیرا با ترمینال به عنوان سطح رفتار می‌کند و از پنهان کردن کاری که عامل انجام می‌دهد خودداری می‌کند. هر فراخوانی ابزار به ترمینال جریان می‌یابد، هر ویرایش فایل یک تفاوت را نشان می‌دهد، هر دستور خروجی خود را نشان می‌دهد. برد صداقت است. جایی که پول باقی می‌گذارد: سطح طرح تخفیف دارد، به عنوان یک لیست ساختار یافته قابل ویرایش نیست.

کرسر، رابط کاربری عامل به عنوان برنامه‌نویس جفت محیطی

عامل کرسر تا زمانی که به آن نیاز نداشته باشید، نامرئی به نظر می‌رسد، که بالاترین شکل ساخت رابط کاربری عامل است. ویرایش‌های کوچک فقط اتفاق می‌افتند و تفاوت را نشان می‌دهند. اصلاح‌کننده‌های چند فایلی، یک طرح را نمایان می‌کنند. برد، کالیبراسیون حضور است: کرسر، میزان دید عامل را نسبت به وظیفه افزایش می‌دهد. جایی که پول باقی می‌گذارد: سطح طرح برای اصلاح‌کننده‌های پیچیده به چت نزدیک‌تر است تا یک لیست وظیفه قابل ویرایش.

دوین، رابط کاربری عامل به عنوان فضای کاری

دوین فضای کاری کامل عامل شامل یک مرورگر زنده، ترمینال و ویرایشگر را نشان می‌دهد و شرط این است که شفافیت، اعتماد را سریع‌تر از انتزاع ایجاد می‌کند. یک طرح قابل ویرایش ساختار یافته از ابتدا قابل مشاهده است. کل فضای کاری، جریان پیشرفت است. کاربر در هر لایه‌ای کنترل را به دست می‌گیرد. برد، دید کامل است. جایی که پول باقی می‌گذارد: فضای کاری برای وظایف ساده سنگین است.

Linear هوش مصنوعی، رابط کاربری عامل به عنوان دستیار درون خطی

ویژگی‌های هوش مصنوعی Linear در داخل سطح موجود Linear قرار دارند، که الگوی مناسبی برای عامل‌های تعبیه‌شده است که باید مانند یک هم‌تیمی احساس شوند، نه یک برنامه جداگانه. هوش مصنوعی یک مصنوع ساختاریافته (یک مسئله، یک نظر، یک به‌روزرسانی وضعیت) را برمی‌گرداند که در داخل جریان موجود قرار دارد. برد، جاسازی است. جایی که پول باقی می‌گذارد: وظایف مستقل چند مرحله‌ای به یک سطح برنامه و یک جریان پیشرفت نیاز دارند که Linear هنوز ارسال نشده است.

ChatGPT اپراتور، رابط کاربری عامل به عنوان مرورگر تحت نظارت

اپراتور در یک مرورگر سندباکس اجرا می‌شود که کاربر می‌تواند آن را تماشا کند، مکث کند و کنترل آن را به دست گیرد، که الگوی مناسبی برای عامل‌هایی است که با وب باز در ارتباط هستند. مرورگر زنده جریان پیشرفت است. دروازه پرداخت‌ها و اقدامات مربوط به حساب. برد، خود الگوی مرورگر تحت نظارت است که سرعت را با اعتماد معاوضه می‌کند. جایی که پول باقی می‌گذارد: سطح طرح در چت قرار دارد و از جریان پیشرفت جدا شده است، که اصلاح مسیر در اواسط اجرا را دشوارتر از آنچه باید باشد، می‌کند.

Replit Agent، Bolt و v0، رابط کاربری عامل به عنوان بوم ساخت

Replit Agent، Bolt و v0 همگی الگوی یکسانی را ارائه می‌دهند: اعلان در سمت چپ، پیش‌نمایش زنده در سمت راست، و کار عامل بین آنها اتفاق می‌افتد. کاربر توضیح می‌دهد که چه چیزی باید ساخته شود، عامل اجرا می‌شود تا زمانی که پیش‌نمایش را نشان دهد. برد، بوم ساخت است که باعث شد وظیفه انتزاعی "برای من یک برنامه بساز" ملموس به نظر برسد. جایی که هر کدام پول باقی می‌گذارند: Replit Agent حالت زیادی را در نخ عامل خود پنهان می‌کند. سطح طرح Bolt برای برنامه‌های پیچیده نازک است. حلقه تکرار v0 در ویرایش‌های چند جزئی به چت نزدیک‌تر است تا یک طرح ساختاریافته. دوست‌داشتنی، در همان مسیر، یک سطح طرح قوی‌تر اما یک جریان پیشرفت ضعیف‌تر ارائه می‌دهد.

آیا رابط کاربری عاملی می‌خواهید که در اولین اجرا اعتماد کسب کند، نه در دهمین اجرا؟ استخدام ⟦برند ۰⟧. AppBrainy رابط کاربری محصول عامل را برای تیم‌هایی که ابزارهای خودکار می‌سازند، ارائه می‌دهد. ClaudeBrainy مهارت‌ها را ارائه می‌دهد و کتابخانه‌هایی را ارائه می‌دهد که لایه عامل را درست قبل از اینکه رابط کاربری مجبور به جبران آن شود، دریافت می‌کنند.

سه اشکال رایج رابط کاربری عامل و راه حل

بیشتر رابط‌های کاربری عامل با سه اشکال مشابه ارائه می‌شوند و راه حل‌ها نامحسوس نیستند.

اول. عاملی که طرح را پنهان می‌کند. محصول یک هدف را در نظر می‌گیرد، در پس‌زمینه اجرا می‌شود و نتیجه‌ای را گزارش می‌دهد. کاربر هیچ برنامه‌ای برای بررسی، هیچ پیشرفتی برای مشاهده و هیچ راهی برای متوقف کردن اجرا ندارد. راه حل: یک طرح قابل ویرایش ساختار یافته را قبل از اجرا، حتی اگر دو خط باشد، نمایش می‌دهد. هزینه آن بیست پیکسل رابط کاربری است. مزیت این است که کاربر می‌تواند قبل از ارسال چیز اشتباه توسط عامل، آن را اصلاح کند.

دوم. عاملی که همه چیز را تأیید می‌کند. محصول هر اقدام را با یک مدال محدود می‌کند و به کاربر آموزش می‌دهد که بدون خواندن، روی آن کلیک کند. تا زمانی که یک اقدام مخرب از راه برسد، کاربر نیز روی این مورد کلیک می‌کند. راه حل: اقدامات را به برگشت‌پذیر، مخرب و فاجعه‌بار طبقه‌بندی می‌کند. فقط دو مورد آخر را مسدود کنید و اجازه دهید اقدامات برگشت‌پذیر با یک بنر لغو سی ثانیه‌ای اجرا شوند.

سوم. عاملی که خرابی را پنهان می‌کند. محصول بی‌سروصدا دوباره تلاش می‌کند، خطاها را می‌بلعد، یا گزارش می‌دهد که "چیزی اشتباه پیش رفته است" بدون اینکه بگوید چه چیزی. رفع: هر خطا را با نقطه خرابی، وضعیت سیستم و گزینه‌های بازیابی مشخص آشکار کنید. اعتماد از خرابی صادقانه ناشی می‌شود، نه خرابی پنهان.

هر رفع، طراحی مجدد نیست. این اضافه یا حذف یک سطح واحد است تا زمانی که الگوها بتوانند کار خود را انجام دهند. اکثر اشکالات رابط کاربری عامل، مشکلات الگویی هستند که به عنوان مشکلات طراحی پنهان شده‌اند.

چک لیست پانزده دقیقه‌ای قبل از ارسال

این را قبل از اینکه به یک کاربر واقعی برسد، روی هر رابط کاربری عاملی اجرا کنید و الگوهایی را که در تولید شکست می‌خورند، خواهید دید.

چارچوب‌بندی وظیفه. یک هدف معمول را تایپ کنید. آیا ورودی ساختار کافی را برای عامل ایجاد می‌کند تا بر اساس آن عمل کند؟
قابلیت مشاهده خودمختاری. آیا می‌توانید در یک ثانیه بدون پرسیدن بگویید که عامل چه کاری انجام خواهد داد؟
سطح را برنامه‌ریزی کنید. یک کار غیر بدیهی را اجرا کنید. آیا عامل قبل از اقدام، یک طرح قابل ویرایش ساختاریافته را نشان می‌دهد؟

۴. صداقت در پیشرفت. آیا فراخوانی‌های ابزار و ویرایش‌های فایل قابل مشاهده هستند، یا جریان یک خلاصه به سبک چت است؟

۵. مکث در دسترس. سعی کنید یک عامل در حال اجرا را متوقف کنید. آیا دکمه مکث قابل مشاهده و فوری است؟

۶. اولویت‌بندی تأیید. آیا اقدامات برگشت‌پذیر آزادانه اجرا می‌شوند، اقدامات مخرب با یک مدال مسدود می‌شوند، اقدامات فاجعه‌بار نیاز به تأیید تایپی دارند؟

۷. قابلیت مشاهده خطا. ایجاد یک شکست. آیا رابط کاربری خطا را با گزینه‌های وضعیت و بازیابی نشان می‌دهد؟

۸. لغو دسترس. آیا یک مسیر لغو واضح در عرض سی ثانیه از یک اقدام برگشت‌پذیر وجود دارد؟

۹. حفظ وضعیت. در صورت شکست در یک مرحله، دوباره آن را امتحان کنید. آیا کار قبلی حفظ شده است؟

۱۰. مصنوعات دست به دست کردن. یک کار را در اواسط اجرا متوقف کنید. آیا یک نسخه پشتیبان از وضعیت وجود دارد که نفر بعدی بتواند از آن استفاده کند؟

۱۱. گزارش استفاده از ابزار. آیا گزارش ساختاریافته و قابل خواندن توسط ماشین است، یا استدلال و اقدامات را با هم ترکیب می‌کند؟ ۱۲. کلید قطع ارتباط. آیا همیشه قابل مشاهده است یا در منوی تنظیمات پنهان می‌شود؟

محصولی که از این دوازده مورد عبور کند، یک رابط کاربری عامل کاربردی دارد. کاربر می‌داند که عامل چه کاری انجام می‌دهد و چگونه آن را متوقف کند.

سوالات متداول

طراحی رابط کاربری عامل هوش مصنوعی چیست؟

طراحی رابط کاربری عامل هوش مصنوعی، رشته‌ای از ساخت رابط‌ها برای کارگران هوش مصنوعی مستقل است که هدفی را در نظر می‌گیرند، مراحل را برنامه‌ریزی می‌کنند و ابزارها را بدون تأیید هر مرحله اجرا می‌کنند. برخلاف رابط‌های کاربری چت، رابط‌های کاربری عامل، سطوح کنترلی با هفت الگوی اصلی هستند: چارچوب‌بندی وظایف، کنترل‌های استقلال، سطوح برنامه‌ریزی، جریان‌های پیشرفت، دروازه‌های تأیید، بازیابی خطا و تحویل‌های عامل.

رابط کاربری عامل هوش مصنوعی چه تفاوتی با رابط کاربری ربات چت دارد؟

یک رابط کاربری ربات چت، مکالمه نوبت به نوبت را فرض می‌کند. یک رابط کاربری عامل فرض می‌کند که عامل در پس‌زمینه اجرا می‌شود، چندین فراخوانی ابزار را اجرا می‌کند، حالت را تغییر می‌دهد و وقتی چیزی به ورودی انسان نیاز دارد، گزارش می‌دهد. رابط‌های کاربری عامل به سطوح برنامه‌ریزی، جریان‌های پیشرفت زنده، دروازه‌های تأیید و کلیدهای قطع ارتباط نیاز دارند که رابط‌های کاربری چت ندارند.

الگوهای کلیدی برای طراحی رابط‌های عامل هوش مصنوعی چیست؟

هفت الگو: چارچوب‌بندی وظیفه، کنترل‌های خودمختاری، سطح طرح، جریان پیشرفت، دروازه‌های تأیید، بازیابی خطا و تحویل‌های عامل. متناسب با وظیفه، کالیبره شده برای اعتماد، و پشتیبانی شده توسط کارایی زمینه محکم در لایه مدل.

کدام محصولات عامل هوش مصنوعی بهترین طراحی رابط کاربری را دارند؟

Claude Code در شفافیت برنده است. مکان‌نما در کالیبراسیون حضور برنده است. دوین در قابلیت مشاهده فضای کاری برنده است. Linear هوش مصنوعی در جاسازی برنده است. ChatGPT اپراتور در اجرای نظارت شده برنده است. Replit Agent، Bolt و v0 در الگوی ساخت بوم برنده هستند. هیچ‌کدام هر هفت الگو را با قدرت کامل ارائه نمی‌دهند، به همین دلیل است که این دسته هنوز کاملاً باز است.

چگونه خودمختاری و کنترل را در رابط کاربری یک عامل متعادل می‌کنید؟

خودمختاری را به یک تنظیم قابل مشاهده و قابل تنظیم در هر جلسه، هر وظیفه، هر ابزار تبدیل کنید. اقدامات را به برگشت‌پذیر (اجرای آزادانه با لغو)، مخرب (دروازه با یک مودال) و فاجعه‌بار (دروازه با تأیید تایپی) تقسیم کنید. قبل از اجرا و پیشرفت در حین اجرا، طرح را آشکار کنید. اجازه دهید کاربر در هر لحظه اجرا را متوقف کند، کنترل را به دست بگیرد یا از بین ببرد. اعتماد با قدرت لغو مقیاس‌پذیر است، نه با پیچیدگی پنهان.

رابط‌های کاربری عامل تغییر در واقع قفل را باز می‌کنند

رابط کاربری عامل یک محصول چت با خودمختاری متصل به آن نیست، بلکه یک مدل تعامل جدید است و محصولاتی که با آن به این شکل رفتار می‌کنند، برنده هستند.

اکثر تیم‌ها با رابط کاربری عامل به عنوان یک ویژگی در بالای چت رفتار می‌کنند. آنها یک رشته چت را می‌گیرند، یک شاخص "تفکر" اضافه می‌کنند، چند حباب استفاده از ابزار اضافه می‌کنند و آن را عامل می‌نامند. نتیجه یک ربات چت با تأخیر اضافی است. هر حالت خرابی چت پیچیده می‌شود زیرا عامل اکنون بیشتر اجرا می‌شود و وقتی از کار می‌افتد آسیب بیشتری وارد می‌کند.

تغییر این است که با عامل به عنوان یک کارگر خودمختار و با رابط کاربری به عنوان سطح کنترل کارگر رفتار شود. رشته چت به یک عنصر در داخل یک سطح بزرگتر با یک تابلوی برنامه، یک جریان پیشرفت، یک سوئیچ خودمختاری، یک ماژول تأیید، یک کنسول خطا و یک مصنوع تحویل تبدیل می‌شود. کاربر دیگر شریک مکالمه عامل نیست، بلکه سرپرست عامل است.

اگر تیم شما در حال ارسال عاملی است که کاربران یا وسواس‌گونه از او مراقبت می‌کنند یا کورکورانه اعتماد می‌کنند، مشکل تقریباً همیشه یک مشکل الگو است. راه حل، هفت الگوی فوق است که متناسب با وظیفه، کالیبره شده برای اعتماد، تعبیه شده در یک گردش کار طراحی هوش مصنوعی واقعی به جای نصب روی آن است.

اگر یک رابط کاربری عامل می‌خواهید که به جای دهمین اجرا، در اولین اجرا اعتماد را جلب کند، استخدام ⟦برند ۰⟧. AppBrainy رابط کاربری کامل محصول عامل را برای تیم‌هایی که ابزارهای خودمختار می‌سازند، ارائه می‌دهد. ClaudeBrainy گردش‌های کاری ⟦برند ۰⟧، بسته‌های مهارت و کتابخانه‌های سریع را ارائه می‌دهد که لایه عامل را به درستی دریافت می‌کنند تا رابط کاربری مجبور به جبران نباشد.

Want an agent UI that earns trust on the first run, not the tenth? Brainy ships ClaudeBrainy as a Skill pack and prompt library, and AppBrainy ships full agent product UI for teams building autonomous tools they want their users to actually use.

Get Started