ai for designersApril 30, 202611 min read

عصر استفاده از کامپیوتر: وقتی عامل‌های هوش مصنوعی واقعاً می‌توانند نرم‌افزار شما را اجرا کنند

یک دفترچه راهنمای کاربردی در مورد استفاده از هوش مصنوعی توسط کامپیوتر تا اواسط سال ۲۰۲۶. استفاده از کامپیوتر با برند ۱، اپراتور با برند ۰ و عامل‌های بومی مرورگر واقعاً چه کاری انجام می‌دهند، به کجا ارسال می‌شوند، کجا هنوز مشکل دارند و تصمیمات طراحی و توسعه‌ای که هر تیم باید قبل از شروع استفاده از محصول توسط عامل‌ها بگیرد.

By Boone
XLinkedIn
computer use agents 2026

سال ۲۰۲۵ وعده عامل‌های خودمختار را داد و چت را عرضه کرد. در واقع ۲۰۲۶ محقق شد. قابلیتی که باعث تغییر شد، استفاده از کامپیوتر بود. مدل صفحه نمایش را می‌بیند، ماوس و کیبورد را کنترل می‌کند و مانند یک انسان در نرم‌افزار پیمایش می‌کند. Anthropic آن را به عنوان یک API عمومی عرضه کرد. OpenAI Operator را عرضه کرد. Browserbase، Multi-On و Lutra زیرساختی را ارائه دادند که آن را برای تولید مناسب می‌کند.

یک دفترچه راهنمای کاربردی برای طراحان و سازندگان. کاربرد کامپیوتر چیست، کجا ارسال می‌شود، کجا از هم می‌پاشد، رابط کاربری شما برای سازگاری با عامل به چه چیزهایی نیاز دارد و تصمیمات توسعه‌دهندگان که یک عامل واقعی را از نسخه آزمایشی دیگر جدا می‌کند.

استفاده از کامپیوتر قابلیتی است که به دوران چت پایان داد

چت یک رابط کاربری برای هوش مصنوعی بود. استفاده از کامپیوتر یک بدنه است. مدل پیکسل‌ها را می‌بیند، تصمیم می‌گیرد کجا کلیک کند، یک فراخوانی ابزار ارسال می‌کند، منتظر اسکرین‌شات بعدی می‌ماند. همین یک عنصر اولیه، هر گردش کاری را بدون یک API تمیز باز می‌کند. پر کردن یک پورتال فروشنده. دریافت داده‌ها از یک داشبورد بدون خروجی. برنامه‌ریزی در دو برنامه وب. هوش مصنوعی باهوش‌تر نشد. هوش مصنوعی دست‌ها را رشد داد.

کاری که استفاده از کامپیوتر واقعاً انجام می‌دهد

حلقه مکانیکی است. مدل یک اسکرین‌شات و یک هدف دریافت می‌کند. یک عمل ساختاریافته را برمی‌گرداند: مختصات را کلیک کنید، یک رشته تایپ کنید، یک کلید را فشار دهید، اسکرول کنید، منتظر بمانید. میزبان عمل را اجرا می‌کند و اسکرین‌شات بعدی را برمی‌گرداند. تا زمانی که انجام شود یا گیر کند، تکرار کنید.

جادویی در کار نیست. این مدل یک استدلال‌گر تقویت‌شده با بینایی است که یک دسکتاپ از راه دور را هدایت می‌کند. این مدل کار می‌کند زیرا مدل‌های چندوجهی اکنون به اندازه کافی در خواندن رابط کاربری خوب هستند تا روی آن عمل کنند. این کار سخت است زیرا نرم‌افزار واقعی نامرتب است و برنامه‌های پیکسلی بی‌نقص به ندرت از اولین فرض اشتباه جان سالم به در می‌برند.

سه نوع در سال 2026 عرضه می‌شوند

استفاده از کامپیوتر امروزه به سه شکل عرضه می‌شود که هر کدام روی یک لایه متفاوت از پشته شرط‌بندی می‌کنند. Anthropic استفاده از کامپیوتر قابلیت خام است که به عنوان یک API ارائه می‌شود. OpenAI اپراتور، عامل مصرف‌کننده تحت نظارت است که در مرورگر OpenAI میزبانی می‌شود. Browserbase، Multi-On و Lutra لایه زیرساخت بدون سرور برای تیم‌هایی هستند که محصولات عامل خود را ارائه می‌دهند.

نمودار وکسل از سه تخته سنگ سنگین در یک ردیف در کف استودیو، برچسب‌های تک کلمه‌ای خواندن RAW BROWSER INFRA به عنوان سه نوع استفاده از کامپیوتر در حمل و نقل در سال ۲۰۲۶
نمودار وکسل از سه تخته سنگ سنگین در یک ردیف در کف استودیو، برچسب‌های تک کلمه‌ای خواندن RAW BROWSER INFRA به عنوان سه نوع استفاده از کامپیوتر در حمل و نقل در سال ۲۰۲۶

این انتخاب، مقایسه ویژگی‌ها نیست. این تصمیمی است که می‌خواهید چه مقدار از پشته را در اختیار داشته باشید.

Anthropic استفاده از کامپیوتر، قابلیت خام

Anthropic استفاده از کامپیوتر، پایین‌ترین سطح ارائه است، مدلی که یک دسکتاپ مجازی را می‌بیند و ماوس و صفحه کلید را کنترل می‌کند. شما یک جعبه شنی را می‌چرخانید، مدل را به سمت آن نشانه می‌گیرید و کد میزبان را می‌نویسید که اقداماتی را انجام می‌دهد و تصاویر را بازخورد می‌دهد. Replit Agent و Devin این الگو را برای سنگین‌ترین کارهای عامل اجرا می‌کنند و زمانی که عامل نیاز به هدایت برنامه‌های دسکتاپ دارد، نه فقط یک مرورگر، انتخاب مناسبی است.

جایی که پول باقی می‌ماند. شما صاحب جعبه شنی، مدل امنیتی، حلقه عمل، منطق تلاش مجدد و هزینه‌سنج هستید. استفاده از توکن زیاد است زیرا در هر مرحله یک تصویر از صفحه نمایش ارسال می‌شود. تأخیر دو تا شش ثانیه در هر مرحله است. قابلیت عمومی، عملیات‌های غیر بدیهی کار می‌کنند.

OpenAI اپراتور، عامل مرورگر تحت نظارت

OpenAI اپراتور یک عامل مرورگر میزبانی شده است که کاربر آن را در زمان واقعی تماشا می‌کند. ارائه دهنده خدمات، مصرف کننده است. به زبان طبیعی به آن هدفی بدهید، یک تب مرورگر باز می‌کند و شما می‌توانید هر لحظه اجرا را متوقف، کنترل یا متوقف کنید. خرید، برنامه‌ریزی، پر کردن فرم، بازیابی اسناد، تحقیقات سبک. این نقطه مطلوب است.

جایی که پول باقی می‌گذارد. اپراتور در محیط OpenAI در جعبه شنی قرار دارد، بنابراین شما عامل را وارد محصول خود نمی‌کنید. جریان‌های احراز هویت شده برای ورود به سیستم نیاز به تحویل کاربر دارند. سایت‌هایی با اقدامات تهاجمی ضد ربات آن را خراب می‌کنند. برنامه‌های JS سفارشی با رویدادهای غیر استاندارد، یک روی سکه هستند. برای کاربران نهایی، روان‌ترین تجربه استفاده از کامپیوتر در حال حاضر. برای سازندگان، یک رقیب، نه یک ابزار.

Browserbase و عامل‌های مرورگر بدون سرور

Browserbase، Multi-On و Lutra زیرساختی را ارائه می‌دهند که عامل‌های مرورگر را برای تولید مناسب می‌کند. Browserbase یک ناوگان Chromium میزبانی‌شده بدون سرور است که کد عامل شما می‌تواند آن را هدایت کند. Multi-On یک عامل مرورگر با API توسعه‌دهنده است. Lutra عامل‌های گردش کار را بر روی همان بدوی می‌سازد. شرط این است که بیشتر کار عامل محدود به مرورگر است و یک جعبه شنی دسکتاپ بیش از حد است.

ترکیب وکسل از یک صفحه نمایش بلند سفید مایل به کرم در کف استودیو با کاشی‌های رابط کاربری روی هم چیده شده و یک نشانگر شناور، که به عنوان رابط کاربری سازگار با عامل خوانده می‌شود
ترکیب وکسل از یک صفحه نمایش بلند سفید مایل به کرم در کف استودیو با کاشی‌های رابط کاربری روی هم چیده شده و یک نشانگر شناور، که به عنوان رابط کاربری سازگار با عامل خوانده می‌شود

برای تیمی که در حال ساخت یک محصول عامل است، این لایه معمولاً نقطه شروع مناسبی است. مرورگر میزبانی‌شده، پایداری جلسه، گرفتن اسکرین‌شات، همزمانی بدون اجرای ناوگان خود. هزینه آن انتزاعی نازک‌تر از پشته کامل Anthropic است، با کنترل کمتر بر احراز هویت و ذخیره‌سازی.

جایی که امروزه استفاده از کامپیوتر در تولید انجام می‌شود

استفاده از کامپیوتر روی مجموعه‌ای محدود اما مفید از وظایف کار می‌کند. تحقیقات مرورگرمحور، برنامه‌ریزی، پر کردن فرم، بازیابی اسناد از سیستم‌های بدون API، تضمین کیفیت سبک، اتوماسیون پورتال فروشنده، استخراج داده‌ها از داشبوردهایی که از خروجی گرفتن امتناع می‌کنند. تیم‌هایی که آن را ارائه می‌دادند، ارائه اطلاعات عمومی را متوقف کردند و شروع به ارائه ابزاری خاص برای یک کار خاص کردند.

الگویی که کار می‌کند. دامنه محدود، اجرای نظارت‌شده، معیارهای موفقیت روشن، تحویل سریع به یک انسان در صورت گیر کردن. Replit Agent از آن برای استقرار داشبوردها استفاده می‌کند. Devin کنسول‌های فروشنده را در داخل وظایف مهندسی طولانی هدایت می‌کند. اپراتور خرید و سفر مصرف‌کننده را مدیریت می‌کند. Multi-On گردش‌های کاری عمودی را برای فروش و عملیات اجرا می‌کند. هیچ‌کدام عامل عمومی نیستند. همه محصولات خوبی هستند.

جایی که استفاده از کامپیوتر هنوز از هم می‌پاشد

استفاده از کامپیوتر در قضاوت بلادرنگ، گردش‌های کاری پیچیده چند برنامه‌ای و هر چیزی که پس از ورود اولیه احراز هویت می‌شود، دچار مشکل می‌شود. دموهایی که از این حاشیه‌ها چشم‌پوشی می‌کنند، دموهایی هستند که باید نادیده گرفته شوند. ACT-1 ادپت داستان هشداردهنده اصلی بود، یک دموی زیبا که هرگز به یک محصول پایدار تبدیل نشد و تیم در نهایت تغییر مسیر داد.

آنچه کار نمی‌کند. وظایفی که در آن عامل باید یک نمودار را بخواند و قضاوت کند. گردش‌های کاری که شامل چهار یا پنج برنامه با وضعیت منتقل شده بین آنها هستند. سایت‌هایی با JS سفارشی سنگین، شناسه‌های پویا یا اقدامات ضد ربات تهاجمی. جریان‌هایی که نیاز به MFA، به‌روزرسانی OAuth یا توکن‌های جلسه‌ای دارند که کاربر به اشتراک نمی‌گذارد. وظایف بلندمدت بالای بیست مرحله با نرخ خطای ترکیبی شکست می‌خورند. استفاده از کامپیوتر شاید ده تا پانزده درصد از گردش‌های کاری را که می‌خواهید خودکار کنید، پوشش می‌دهد. محصولاتی که برنده شدند، ده درصد مناسب را انتخاب کردند.

پیامدهای طراحی برای رابط کاربری سازگار با عامل

اگر محصول شما می‌خواهد برای یک عامل استفاده کننده از کامپیوتر مفید باشد، رابط کاربری باید برای آن قابل خواندن باشد. اکثر رابط کاربری محصولات فعلی اینطور نیست. عامل پیکسل‌ها را می‌خواند. به ساختار قابل مشاهده، الگوهای قابل پیش‌بینی و برچسب‌های بدون ابهام نیاز دارد. هر چیزی که یک رابط کاربری سازگار با عامل را ایجاد می‌کند، آن را نیز قابل دسترس می‌کند. همان چک لیست بهداشتی به هر دو خدمت می‌کند.

این لحظه‌ای است که دسترسی دیگر اختیاری نیست. تیم‌هایی که کتابخانه‌های کامپوننت الگوهای رابط کاربری عامل تمیز و قابل دسترس را ارائه داده‌اند، در حال حاضر در این دور برنده هستند. تیم‌هایی که بر اساس تریگرهای فقط شناور، ویجت‌های سفارشی بوم و دکمه‌های مبهم فقط آیکون ساخته شده‌اند، در شرف فهمیدن این هستند که محصولشان برای موج بعدی کاربران نامرئی است.

چک لیست رابط کاربری سازگار با اپراتور

این را روی هر سطحی از محصول که ترافیک اپراتور می‌خواهد، اجرا کنید. کوتاهی عمدی.

اول. HTML معنایی. دکمه‌های واقعی، ورودی‌های واقعی، عنوان‌های واقعی، برچسب‌های واقعی. سوپ div سفارشی که درست به نظر می‌رسد اما برای فناوری کمکی چیزی نمی‌خواند، برای اپراتورها نیز چیزی نمی‌خواند.

دوم. الگوهای قابل پیش‌بینی. همان عمل در هر صفحه در یک مکان قرار دارد. فراخوان‌های اقدام اولیه در موقعیت‌های ثابت. فرم‌ها با یک طرح واحد. ناوبری که تغییر شکل نمی‌دهد.

سوم. برچسب‌های قابل دسترس. هر عنصر تعاملی دارای یک برچسب واضح و قابل خواندن توسط انسان است. دکمه‌های فقط آیکون دارای برچسب‌های آریا هستند. فیلدهای فرم دارای برچسب‌های واضح و قابل مشاهده هستند، نه فقط متغیرهایی.

چهارم. سلسله مراتب بصری واضح. اپراتور باید صفحه را از روی اسکرین شات بخواند. کنتراست قوی، بخش‌بندی واضح، مقیاس نوع ثابت. قابل اسکن برای انسان، قابل اسکن برای مدل نیز هست.

پنجم. هیچ محرکی که فقط با شناور شدن فعال شود، وجود ندارد. هر چیز مهمی باید بدون حالت شناور شدن قابل دسترسی باشد. منوهای فقط با شناور شدن، راهنماهای ابزار فقط با شناور شدن، حذف فقط با شناور شدن، در دنیای عامل مرده هستند. عامل شناور نمی‌شود.

پیامدهای توسعه، استفاده از ابزار در مقابل استفاده از کامپیوتر در مقابل ترکیبی

استفاده از کامپیوتر آخرین راه حل است. APIهای استفاده از ابزار برای هر چیزی که سطح API تمیزی داشته باشد، از نظر هزینه، تأخیر و قابلیت اطمینان برنده می‌شوند. الگوی ترکیبی چیزی است که اکثر سیستم‌های تولیدی روی آن قرار می‌گیرند.

ترکیب وکسل سه پایه در کف استودیو، برچسب‌های تک کلمه‌ای ابزار SEE HYBRID خواندن را به عنوان سه الگوی ادغام نشان می‌دهد
ترکیب وکسل سه پایه در کف استودیو، برچسب‌های تک کلمه‌ای ابزار SEE HYBRID خواندن را به عنوان سه الگوی ادغام نشان می‌دهد

استفاده از ابزار مستقیم است. عامل یک تابع را فراخوانی می‌کند، تابع داده‌های ساختاریافته را برمی‌گرداند. هزینه کم، تأخیر سریع، قابلیت اطمینان بالا. پروتکل Model Context و APIهای اصلی استفاده از ابزار این مسیر را پوشش می‌دهند. از آن برای هر چیزی که می‌توانید در یک API قرار دهید استفاده کنید. استفاده از کامپیوتر زمانی که سیستم API ندارد، از افشای آن امتناع می‌کند یا عمل را پشت یک رابط کاربری شخص ثالث که شما مالک آن نیستید پنهان می‌کند، جایگزین است.

الگوی ترکیبی برنده است. استفاده از ابزار برای هر چیزی که می‌توانید، و برای دنباله طولانی به استفاده از کامپیوتر. فراخوانی ابزار سنت است. مراحل استفاده از کامپیوتر ده سنت. نود درصد استفاده از ابزار، ده درصد استفاده از کامپیوتر با یک دهم هزینه یک عامل استفاده از کامپیوتر صرف ارسال می‌شود.

آیا می‌خواهید در ارسال محصولی که موج بعدی عامل‌ها واقعاً می‌توانند از آن استفاده کنند، یا اتصال استفاده از کامپیوتر به پشته خود بدون صرف یک چهارم برای نسخه آزمایشی، کمک بگیرید؟ استخدام ⟦برند ۰⟧. ClaudeBrainy مهارت‌ها را به عنوان یک بسته مهارت به همراه کتابخانه‌های سریع که لایه مدل را به درستی دریافت می‌کنند، ارسال می‌کند و AppBrainy نسخه‌های کامل محصول را برای تیم‌هایی که می‌خواهند عامل‌هایشان کار واقعی انجام دهند، نه اسکرین‌شات، ارسال می‌کند.

محصولات واقعی ارسال استفاده از کامپیوتر در سال 2026

عامل Replit Claude استفاده از کامپیوتر را برای مراحل استقرار و زیر ساخت بدون API تمیز اجرا می‌کند. Devin کنسول‌های فروشنده، داشبوردها و پنل‌های مدیریتی را در داخل وظایف مهندسی طولانی هدایت می‌کند. اپراتور خرید مصرف‌کننده، برنامه‌ریزی و پر کردن فرم را مدیریت می‌کند. Browserbase فهرست طولانی از استارت‌آپ‌های عامل عمودی را پشتیبانی می‌کند. Multi-On اتوماسیون گردش کار بومی مرورگر را برای فروش و عملیات ارائه می‌دهد. Lutra سازنده گردش کار در صدر است.

الگویی که آنها به اشتراک می‌گذارند. دامنه محدود، انتقال سریع، حالت قابل مشاهده، بازیابی خطای سخاوتمندانه، حسابداری هزینه واقعی. آنها با استفاده از کامپیوتر همانطور رفتار می‌کنند که تیم‌های مهندسی خوب با هرگونه وابستگی پوسته پوسته برخورد می‌کنند. Wrap، bound، instrument، برنامه‌ریزی برای شکست.

چهار حالت شکست که هر تیمی با آن مواجه می‌شود

اول. تله عامل عمومی. یک تیم استفاده از کامپیوتر را برای یک گردش کار انتخاب می‌کند که می‌توانست یک فراخوانی استفاده از ابزار باشد، عامل سی ثانیه و پنجاه سنت را صرف انجام کاری می‌کند که یک فراخوانی API می‌توانست در صد میلی‌ثانیه انجام دهد. رفع: ابتدا استفاده از ابزار، استفاده از کامپیوتر فقط برای دنباله طولانی.

دوم. تله نظارت-رد. عامل بدون نظارت روی یک گردش کار که داده‌های واقعی را تغییر می‌دهد، اشتباه در مرحله هفدهم، داده‌ها از بین رفته‌اند. رفع: اجرای نظارت شده برای هر چیز مخرب، دروازه‌های تأیید در نوشتن، اجرای خشک به طور پیش‌فرض.

سوم. تله انتخابگر شکننده. اعلان‌ها به حالت‌های خاص رابط کاربری بستگی دارند، سایت هدف به‌روزرسانی می‌شود، عامل بی‌صدا از کار می‌افتد. رفع مشکل: اعلان‌ها را بر اساس هدف بسازید، نه مختصات پیکسلی. هفتگی با سایت‌های واقعی آزمایش کنید.

چهارم. تله کوری هزینه. ویژگی را ارسال کنید، صورتحساب می‌رسد، اقتصاد واحد کار نمی‌کند. رفع مشکل: هزینه هر وظیفه را قبل از راه‌اندازی مدل کنید. کمتر از پنجاه سنت در هر اجرا معمولاً قابل اجرا است. بیش از پنج دلار در هر اجرا به ندرت قابل اجرا است.

ماتریس تصمیم‌گیری برای طراحان و سازندگان

طراح، توسعه‌دهنده فرانت‌اند، توسعه‌دهنده بک‌اند، بنیانگذار. هر نقش حرکت اول متفاوتی دارد.

| نقش | حرکت اول | چرا | |---|---|---| | طراح | چک لیست رابط کاربری سازگار با عامل را اجرا کنید | اکثر رابط‌های کاربری فعلی برای عامل‌ها نامرئی هستند. ابتدا این مشکل را برطرف کنید. | | توسعه‌دهنده فرانت‌اند | HTML معنایی، برچسب‌های ARIA، الگوهای کامپوننت قابل پیش‌بینی را ارسال کنید | همان کاری که آشنایی با محصول هوش مصنوعی سازگاری عامل را ارسال می‌کند. | | توسعه‌دهنده بک‌اند | یک سطح API با استفاده از ابزار برای هر عملی که محصول شما در معرض آن قرار می‌دهد، بسازید | استفاده از ابزار، هزینه و قابلیت اطمینان را افزایش می‌دهد. استفاده از کامپیوتر جایگزین است. | | بنیانگذار | کوچکترین گردش کار عامل را انتخاب کنید که ارزش واقعی را ارائه می‌دهد | بردهای محدود. عامل‌های عمومی ضرر می‌کنند. |

کار به طور ناموزون توزیع شده است. طراحان و توسعه‌دهندگان فرانت‌اند، خوانایی عامل را بر عهده دارند. توسعه‌دهندگان بک‌اند، استفاده از ابزار را بر عهده دارند. بنیانگذاران، مسیر را انتخاب می‌کنند.

سوالات متداول

استفاده از کامپیوتر هوش مصنوعی چیست؟

استفاده از کامپیوتر قابلیتی است که به یک مدل هوش مصنوعی اجازه می‌دهد صفحه نمایش را ببیند، ماوس و صفحه کلید را کنترل کند و مانند یک انسان در نرم‌افزار پیمایش کند. Anthropic استفاده از کامپیوتر، OpenAI اپراتور و عامل‌های بومی مرورگر از Browserbase، Multi-On و Lutra پیاده‌سازی‌های درجه تولید در سال 2026 هستند. مدل یک اسکرین‌شات می‌گیرد، یک عمل را انتخاب می‌کند، یک فراخوانی ابزار ارسال می‌کند و منتظر اسکرین‌شات بعدی می‌ماند.

آیا استفاده از کامپیوتر Anthropic بهتر از اپراتور OpenAI است؟

اشکال مختلف بهتر. Anthropic استفاده از کامپیوتر، قابلیت خام برای سازندگان است. اپراتور یک محصول مصرفی میزبانی شده است. سازندگان Anthropic استفاده از کامپیوتر یا یک لایه مادون قرمز به سبک Browserbase را انتخاب می‌کنند. کاربران نهایی اپراتور را انتخاب می‌کنند. آنها مشاغل متفاوتی دارند، نه رقبای مستقیم.

آیا یک عامل مرورگر می‌تواند کل شرکت من را اداره کند؟

نه، و محصولاتی که نوید می‌دهند محصولاتی نیستند که بتوان روی آنها شرط بست. استفاده از کامپیوتر شاید ده تا پانزده درصد از گردش‌های کاری را در یک تیم معمولی پوشش می‌دهد. الگوی برنده، عامل‌های محدود در گردش‌های کاری خاص با انتقال سریع به انسان‌ها است. ACT-1 ادپت همان چیزی است که جاه‌طلبی عامل عمومی در مقیاس به نظر می‌رسد.

آیا باید محصول خود را برای عامل‌های هوش مصنوعی دوباره طراحی کنم؟

اگر رابط کاربری قابل دسترس را با HTML معنایی، الگوهای قابل پیش‌بینی و برچسب‌های واضح ارائه می‌دهید، تقریباً به هدف رسیده‌اید. اگر محصول شما روی منوهای فقط با شناور، ویجت‌های بوم سفارشی و دکمه‌های آیکون بدون برچسب اجرا می‌شود، بله. قابل دسترس برای عامل سازگار است.

چه زمانی باید استفاده از کامپیوتر را به API با استفاده از ابزار ترجیح دهم؟

تقریباً هرگز اول از همه. APIهای با استفاده از ابزار، هر زمان که API وجود داشته باشد، از نظر هزینه، تأخیر و قابلیت اطمینان برنده می‌شوند. استفاده از کامپیوتر جایگزین سیستم‌هایی است که API ندارند. اکثر عوامل تولید در سال ۲۰۲۶ ترکیبی هستند، نود درصد استفاده از ابزار، ده درصد استفاده از کامپیوتر.

تغییر استفاده از کامپیوتر در واقع قفل را باز می‌کند

استفاده از کامپیوتر یک ربات چت هوشمندتر نیست. این اولین باری است که هوش مصنوعی می‌تواند ابزاری را مانند انسان نگه دارد. این یک دسته متفاوت از محصول است و تیم‌هایی که از ابتدا برای آن طراحی می‌کنند، دوازده ماه آینده را در اختیار خواهند داشت.

اکثر تیم‌ها هنوز با عوامل به عنوان یک ویژگی چت با استقلال متصل رفتار می‌کنند. تیم‌هایی که جلوتر می‌روند، با عامل به عنوان همکار رفتار می‌کنند که از همان نرم‌افزاری که تیم استفاده می‌کند استفاده می‌کند. اولی یک تب چت دیگر ارسال می‌کند. دومی محصولی را ارسال می‌کند که کار می‌کند. مقایسه ویرایشگر کد هوش مصنوعی بخش توسعه همان شیفت را پوشش می‌دهد.

اگر محصول شما در سال آینده توسط یک نماینده لمس شود، که اکثر آنها این کار را خواهند کرد، تصمیمات طراحی که در این سه ماهه می‌گیرید، تعیین می‌کند که آیا نماینده به کاربران شما کمک می‌کند یا شما را کاملاً نادیده می‌گیرد. چک لیست را اجرا کنید. گردش کار را انتخاب کنید. برد باریک را ارسال کنید.

اگر برای ارسال محصولی که موج بعدی نمایندگان واقعاً می‌توانند از آن استفاده کنند یا اتصال استفاده از کامپیوتر به پشته خود بدون صرف یک چهارم برای نسخه آزمایشی، به کمک نیاز دارید، استخدام ⟦برند ۰⟧. ClaudeBrainy بسته‌های مهارت و کتابخانه‌های سریع را ارسال می‌کند. AppBrainy نسخه‌های کامل محصول را برای تیم‌هایی که می‌خواهند نمایندگانشان کار واقعی انجام دهند، نه اسکرین‌شات، ارسال می‌کند.

Want help shipping a product the next wave of agents can actually use, or wiring computer use into your stack without burning a quarter on demoware? Brainy ships ClaudeBrainy as a Skill pack and prompt library, and AppBrainy ships full product builds for teams that want their agents to do real work, not screenshots.

Get Started

More from Brainy Papers

Keep reading