ai for designersApril 30, 202610 min read

چه چیزی Claude 4.7 واقعاً برای سازندگان هوش مصنوعی تغییر کرد؟

یک بررسی عملیاتی از Claude 4.7 برای سازندگان هوش مصنوعی. قابلیت اطمینان عامل در دو ساعت گذشته، استاندارد زمینه ۱M در سراسر خانواده، استفاده از رایانه به طور کلی در دسترس، بهبودهای سریع در سطح ذخیره‌سازی و جهش‌های سرعت Sonnet و Haiku که بارهای کاری با توان عملیاتی بالا را باز کردند.

By Boone
XLinkedIn
claude 4 7 for builders

Claude نسخه ۴.۷ یک جهش در معیارها نیست. این نسخه باعث شد که عامل‌های قدیمی، ابزارهای کدنویسی کامل و خطوط لوله ارزیابی مبتنی بر روبریک واقعاً در محیط عملیاتی کار کنند. معیارها چند امتیاز تغییر کردند. رسیدهای حمل و نقل تغییرات زیادی داشتند.

این یک بررسی کاربردی برای سازندگان هوش مصنوعی است. آنچه ۴.۷ واقعاً تغییر داده است، چه چیزی باید اکنون متفاوت ساخته شود، نمونه‌های واقعی محصول که در حال حاضر در خانواده جدید عرضه می‌شوند، و فهرستی صادقانه از اینکه Claude نسخه ۴.۷ هنوز در چه مواردی به GPT-5.5 و Gemini ۳ بازنده است.

نسخه ۴.۷ نوار تولید را بازنشانی کرد.

Claude نسخه ۴.۷ اولین نسل Anthropic است که در آن هر نوع مدل در خانواده برای کار عامل‌ها در محیط عملیاتی قابل اجرا است. Opus 4.7 استدلال‌کننده سنگین است. Sonnet 4.7 محرک روزانه است. هایکو ۴.۷ سطح توان عملیاتی است. هر سه با همان پنجره زمینه ۱ میلیون، همان سطح استفاده از ابزار و همان اصول اولیه ذخیره‌سازی عرضه می‌شوند.

داستان زیر سر و صدای راه‌اندازی، فروپاشی سطح است. در سال ۲۰۲۴، سازندگان مجبور بودند بین هوشمندی و سرعت یکی را انتخاب کنند. در سال ۲۰۲۶ در ۴.۷، سازندگان بین هوشمندی، سریع‌تری و بلادرنگ بودن یکی را انتخاب می‌کنند و همه آنها سطح محصول یکسانی دارند. این مزیتی است که آنچه ساخته می‌شود را تغییر می‌دهد.

قابلیت اطمینان عامل از مرز دو ساعت عبور کرد

بزرگترین مزیت ۴.۷ در یک معیار نیست. این پایداری بلندمدت است که به یک عامل Opus ۴.۷ اجازه می‌دهد یک کار واقعی را به مدت دو تا چهار ساعت بدون رانش زمینه اجرا کند. در ۴.۶، عامل‌ها از مرز نود دقیقه عبور کردند و شروع به فراموش کردن تصمیمات قبلی، تکرار مراحل تکمیل شده و از دست دادن بی‌سروصدا فایل‌هایی که ویرایش کرده بودند، کردند. در ۴.۷، آن حالت خرابی به طور معناداری از بین رفته است.

ریل تایم‌لاین وکسل در کف استودیو با مکعب‌های پنج‌گانه‌ی گلیفِ مامور که از چپ به راست قدم برمی‌دارند، برچسب تک‌کلمه ای AGENT که روی ریل حک شده است
ریل تایم‌لاین وکسل در کف استودیو با مکعب‌های پنج‌گانه‌ی گلیفِ مامور که از چپ به راست قدم برمی‌دارند، برچسب تک‌کلمه ای AGENT که روی ریل حک شده است

Anthropic اعداد داخلی را در مورد تیم Devin که وظایف کدنویسی خودکار ده ساعته را با Opus 4.7 که متن را از ابتدا تا انتها نگه می‌دارد، اجرا می‌کنند، منتشر کرد. منحنی قابلیت اطمینان مانند نسخه ۴.۶ فرو نمی‌ریزد. همین تغییر واحد دلیل تفاوت IDEهای عامل و محصولات کدنویسی مستقل در نسخه ۴.۷ است.

پنجره متن ۱ میلیون در سراسر خانواده

هر نوع ۴.۷ به صورت استاندارد با یک پنجره متن توکن ۱ میلیون عرضه می‌شود. Opus 4.7، Sonnet 4.7 و Haiku 4.7 همگی سطح یکسانی دارند. انتشار در کل خانواده بیش از عدد اصلی اهمیت دارد، زیرا به این معنی است که یک عامل توان عملیاتی Haiku 4.7 می‌تواند همان مخزن یا مجموعه سند را مانند یک استدلال‌کننده Opus 4.7 نگه دارد.

در عمل، این همان چیزی است که ویرایشگرهای کد کامل کد و عامل‌های مبتنی بر سند را که دوازده ماه پیش کار نمی‌کردند، باز می‌کند. یک پنجره ۱ میلیونی تقریباً هفتاد و پنج هزار خط از TypeScript یا چهار کتاب کامل را در خود جای می‌دهد، و افزایش کارایی پنجره زمینه در نسخه ۴.۷ به این معنی است که مدل در واقع از آنچه در آن وجود دارد استفاده می‌کند به جای اینکه بیشتر به چند هزار توکن آخر توجه کند.

استفاده از کامپیوتر به طور کلی در دسترس و سریع‌تر است

استفاده از کامپیوتر در نسخه ۴.۷ از نسخه بتا خارج شد. کاهش تأخیر، احساسی است که سازندگان قطعات دارند. حلقه عمل، از گرفتن اسکرین‌شات تا کلیک بعدی، تقریباً دو برابر سریع‌تر از پیش‌نمایش ۴.۶ است، که همان چیزی است که استفاده از کامپیوتر را از یک نسخه نمایشی به سطح محصول منتقل می‌کند.

شکل حمل و نقل هنوز محدود است. اتوماسیون مرورگر، پر کردن فرم، استخراج داده‌های ساختاریافته از برنامه‌های رندر شده و جریان‌های QA مواردی هستند که استفاده از کامپیوتر در آنها دوام می‌آورد. این یک جایگزین دسکتاپ نیست و ابزار مناسبی برای تعاملات بلادرنگ با فرکانس بالا نیست. در شکل مناسب، کار می‌کند.

استفاده از ابزار و حالت‌های JSON که از بین نمی‌روند

استفاده از ابزار ساختاریافته در نسخه ۴.۷ به محدوده بالای نود درصد قابلیت اطمینان در طرح‌های تو در تو می‌رسد. حالت JSON بالاخره تحت همزمانی بالا قرار می‌گیرد. در نسخه ۴.۶، سازندگان عامل‌های تولید، فراخوانی‌های ابزار را در حلقه‌های تلاش مجدد و اعتبارسنج‌های طرح قرار می‌دادند، زیرا مدل گاهی اوقات JSON ناقص تولید می‌کرد یا یک فیلد مورد نیاز را از قلم می‌انداخت. در نسخه ۴.۷، پوشش‌ها اغلب اوقات می‌توانند از کار بیفتند.

این مقدار کم به نظر می‌رسد. اما اینطور نیست. قابلیت اطمینان استفاده از ابزار، کف هر محصول عامل است. هر درصد خروجی ناقص، درصدی از اشکالات قابل مشاهده توسط مشتری است و نسخه ۴.۷ اولین نسلی است که کف آن به اندازه‌ای بالا است که سازندگان می‌توانند معماری پیرامون آن را متوقف کنند.

لایه‌های ذخیره‌سازی سریع، اقتصاد واحد را تغییر دادند

ذخیره‌سازی سریع در نسخه ۴.۷، یک لایه ذخیره‌سازی یک ساعته را به بالای لایه پنج دقیقه‌ای موجود اضافه کرد. قیمت خواندن حافظه پنهان تقریباً سی درصد کاهش یافت. این تغییری است که Claude را به یک پایگاه رقابتی از نظر هزینه برای نمایندگان با حجم بالا تبدیل کرد.

صفحه زمینه وکسل عریض که نیمه پایینی کف استودیو را با لایه‌های وکسل روی هم چیده شده و یک فیگور کوچک خواننده وکسل پوشانده است، برچسب تک کلمه‌ای CONTEXT روی سطح جلویی حک شده است.
صفحه زمینه وکسل عریض که نیمه پایینی کف استودیو را با لایه‌های وکسل روی هم چیده شده و یک فیگور کوچک خواننده وکسل پوشانده است، برچسب تک کلمه‌ای CONTEXT روی سطح جلویی حک شده است.

محاسبه دقیق است. نماینده‌ای که یک اعلان سیستمی ۲۰۰ هزار توکن را بارگذاری می‌کند و ده تعامل را در هر جلسه اجرا می‌کند، برای پرداخت کامل قیمت ورودی در هر نوبت استفاده می‌شود. با لایه کش یک ساعته، همان نماینده در هر نوبت پس از نوبت اول، قیمت‌های خواندن کش شده را پرداخت می‌کند. برای یک نماینده پشتیبانی مشتری یا یک ربات بررسی کد در مقیاس بزرگ، این امر Claude را از قیمت بالا به قیمت قابل مقایسه با GPT-5.5 در حجم کار واقعی تبدیل می‌کند.

Sonnet و Haiku برای کار با توان عملیاتی به اندازه کافی سریع شدند

Sonnet 4.7 تقریباً چهل درصد سریع‌تر از ۴.۶ با کیفیت کامل است. Haiku 4.7 در قلمرو زمان واقعی است. لایه Haiku اکنون توکن‌های اولیه را به اندازه کافی سریع برای چت استریم، نمایندگان صوتی و تهیه پیش‌نویس سند زنده ارائه می‌دهد، در حالی که ۴.۶ Haiku فقط کمی کند بود.

این همان چیزی است که آنها را برای بارهای کاری با توان عملیاتی بالا مناسب می‌کرد. گرانولا خط لوله رونویسی و ساختاردهی جلسات خود را به Haiku 4.7 منتقل کرد. تکمیل تب Cursor روی Sonnet 4.7 اجرا می‌شود. هر دو گزینه‌ای هستند که دوازده ماه پیش با تأخیر قابل قبول کار نمی‌کردند.

قابلیت بین Opus، Sonnet و Haiku تقسیم شده است

سه نوع مدل، سه خط تولید مجزا. انتخاب ردیف اشتباه رایج‌ترین اشتباه سازنده Claude در سال 2026 است.

نوعبهترین برایتأخیرشکل هزینهمراقب باشید برای
Opus 4.7عوامل بلندمدت، رتبه‌بندی سخت، برنامه‌ریزی، تنظیم ابزار پیچیدهکندترین، اولین توکن چند ثانیه‌ایبالاترین ورودی و خروجی، کمک حافظه پنهانهزینه‌های بیش از حد در وظایفی که Sonnet حل می‌کرد
Sonnet 4.7عامل‌های روزانه، ویرایش کد، اصلاح چند فایلی، استخراج ساختاریافتهتوکن اول میانی، زیر دوم در حافظه نهان گرممیانی، لایه بارکشبا دست کم گرفتن آن، Sonnet 4.7 بیشترین کار تولید را انجام می‌دهد

قاعده کلی. Opus برای مرحله استدلال سخت، Sonnet برای بدنه حلقه عامل، Haiku برای سطح فرکانس بالا. ارزان‌ترین پشته تولید در Claude یک روتر لایه‌ای است، نه یک استقرار تک مدلی.

چهار چیزی که اکنون می‌توانید بسازید که در سال 2025 کار نمی‌کردند

عامل‌های طولانی مدت، ویرایشگرهای کد کامل، خطوط لوله ارزیابی مبتنی بر روبریک و محصولات کاربردی کامپیوتر که ارسال می‌شوند. چهار الگویی که برای عرضه به 4.7 نیاز داشتند.

اول. عامل‌های طولانی‌مدت. یک عامل Opus 4.7 می‌تواند یک وظیفه واقعی را به مدت دو تا چهار ساعت بدون از دست دادن رشته اجرا کند. در نسخه ۴.۶، سقف عملی چهل دقیقه بود. شکل محصولاتی که این ویژگی ارائه می‌دهد، شامل تحقیقات مستقل، اتوماسیون فرآیند کسب‌وکار چند مرحله‌ای و کارهای بررسی کد شبانه است که قبل از آماده‌سازی به پایان می‌رسند.

دوم. ویرایشگرهای کد هوش مصنوعی که یک پایگاه کد کامل را در اختیار دارند. با ۱ میلیون زمینه در سراسر خانواده و پایداری بلندمدت، یک ویرایشگر می‌تواند به جای بازیابی مداوم قطعه کدها، کل یک مخزن را برای یک جلسه در حافظه کاری نگه دارد. این یک تغییر گام برای اصلاح فایل‌های بین فایلی و تغییرات معماری است.

سوم. خطوط لوله ارزیابی که در برابر روبریک‌ها در دسته امتیاز می‌گیرند. API دسته‌ای به علاوه افزایش قابلیت اطمینان به این معنی است که یک تیم می‌تواند ده هزار خروجی را در برابر یک روبریک پانزده معیاری در یک کار امتیاز دهد، نمرات ساختاریافته را دریافت کند و آن را به عنوان یک آزمون رگرسیون در هر تغییر سریع اجرا کند.

چهارم. محصولاتی که از کامپیوتر استفاده می‌کنند و ارسال می‌شوند. کاهش تأخیر و نقطه عطف GA، استفاده از کامپیوتر را از یک اسباب‌بازی بتا به یک سطح واقعی برای اتوماسیون مرورگر، استخراج ساختاریافته و جریان‌های QA تبدیل کرد.

شبکه دو در دو وکسل از پایه‌ها روی کف استودیو با اشیاء وکسل کوچک در حالت سیلوئت، برچسب‌های تک کلمه‌ای، کد عامل، ارزیابی، استفاده
شبکه دو در دو وکسل از پایه‌ها روی کف استودیو با اشیاء وکسل کوچک در حالت سیلوئت، برچسب‌های تک کلمه‌ای، کد عامل، ارزیابی، استفاده

آیا می‌خواهید بدون از دست دادن یک چهارم برای بازنویسی مدل، روی Claude 4.7 کمک بسازید؟ استخدام ⟦برند ۰⟧. ClaudeBrainy مهارت‌ها را برای خانواده 4.7 به همراه کتابخانه‌های سریع که لایه مدل را به درستی دریافت می‌کنند، ارائه می‌دهد و AppBrainy محصولات کامل را برای تیم‌هایی که می‌خواهند ویژگی‌های هوش مصنوعی آنها از روز اول روی خانواده جدید اجرا شود، ارائه می‌دهد.

نمونه‌های واقعی محصول که روی 4.7 ارائه می‌شوند

Cursor در Sonnet 4.7 قابل مشاهده‌ترین نمونه است. تکمیل تب، Composer و حالت Agent همگی روی Sonnet جدید اجرا می‌شوند و افزایش سرعت واقعی است. توسعه‌دهندگان بومی IDE که گردش‌های کاری مقایسه ویرایشگرهای کد هوش مصنوعی را اجرا می‌کنند، تفاوت را در یک جلسه احساس می‌کنند.

گرانولا در هایکو ۴.۷، رونویسی جلسات را با استخراج ساختاریافته نت‌ها در لحظه انجام می‌دهد. وقتی هایکو به اندازه کافی سریع شد تا جایگزین مجموعه‌ای از مدل‌های تخصصی کوچک‌تر شود، خط هزینه از پریمیوم به کامپیوتیشن منتقل شد.

هوش مصنوعی Linear برای مراحل سخت رتبه‌بندی و اولویت‌بندی، Opus 4.7 را فراخوانی می‌کند. اولویت‌بندی مسائل، برنامه‌ریزی اسپرینت و تحلیل وابستگی به Opus منتقل می‌شود، در حالی که کارهای روزمره روی Sonnet باقی می‌ماند. این مسیریابی لایه‌ای الگویی است که اکثر تیم‌های تولید روی آن همگرا هستند.

Devin روی خانواده کامل اجرا می‌شود. وظایف کدنویسی بلندمدت به Opus 4.7 متکی هستند. بدنه حلقه عامل روی Sonnet 4.7 اجرا می‌شود. فراخوانی‌ها و جستجوی سریع ابزار به Haiku 4.7 منتقل می‌شود. نتیجه، یک عامل کدنویسی مستقل ده ساعته است که هزینه هر وظیفه آن کمتر از استقرار ۴.۶ است که نیمی از زمان را صرف می‌کرد.

جایی که Claude 4.7 هنوز هم شکست می‌خورد

Claude 4.7 یک برد کامل نیست. فهرست صادقانه نقاط ضعف چیزی است که هر سازنده‌ای قبل از قفل کردن یک مدل به آن نیاز دارد.

خروجی چندوجهی. Claude 4.7 تصاویر را به خوبی می‌خواند و PDFها را به طور تمیز می‌خواند، اما تصاویر، صدا یا ویدئو تولید نمی‌کند. برای محصولاتی که به یک مدل واحد برای خواندن و تولید در بین روش‌ها نیاز دارند، پاسخ Claude نیست.

سرعت خام در اوج Opus. Opus 4.7 سریع‌تر از Opus 4.6 است، اما در عمق استدلال کامل، هنوز کندتر از پیکربندی با توان عملیاتی بالای GPT-5.5 است. برای بارهای کاری که به استدلال سخت سریع در مقیاس بزرگ نیاز دارند، محاسبات گاهی اوقات به OpenAI می‌رسد.

داده‌های بلادرنگ و زنده. Claude هیچ جستجوی شخص اول، ابزار داده زنده و حالت صدای بومی در سطح بلوغ مشابه سایرین ندارد. سازندگانی که محصولات داده زنده را عرضه می‌کنند، به یک لایه جستجو متصل می‌شوند یا مدلی را با یک لایه جستجو داخلی انتخاب می‌کنند.

تولید تصویر. نه یک مسیر Claude. پایان داستان.

کدام مسیرها هنوز به GPT-5.5 یا Gemini 3 می‌روند

GPT-5.5 هنوز در خروجی چندوجهی خام، به ویژه تولید تصویر و صدای بلادرنگ، برنده است. برای محصولاتی که کاربر انتظار دارد یک مدل به عنوان رفتارهای درجه یک ترسیم، صحبت و گوش دهد، GPT-5.5 انتخاب تمیزتری است.

Gemini 3 در دسترسی به داده‌های بومی گوگل، درک ویدیو در مقیاس بزرگ و اتصال چندوجهی در سطح فضای کاری برنده است. برای محصولاتی که در Google Docs، Sheets یا Drive تعبیه شده‌اند، Gemini 3 از نظر ساختاری ارزان‌تر است. پنجره زمینه دو میلیون توکنی Gemini 3 همچنین از نظر اندازه خام برای کارهای اسناد بسیار طولانی، از Claude جلوتر است.

در حال حاضر، این تقسیم‌بندی ساختاری است. بر اساس شکل کار انتخاب کنید، نه بر اساس بازاریابی. یک محصول هوش مصنوعی جدی در سال 2026 معمولاً حداقل از دو خانواده مدل عبور می‌کند.

سوالات متداول

Claude 4.7 چیست؟

Claude 4.7 نسل مدل Anthropic است که در اوایل سال 2026 در سه نوع Opus 4.7، Sonnet 4.7 و Haiku 4.7 عرضه شد. دستاوردهای اصلی عبارتند از پایداری عامل بلندمدت پس از دو ساعت، استاندارد پنجره زمینه ۱ میلیون در سراسر خانواده، استفاده عمومی از کامپیوتر، بهبود سطح ذخیره‌سازی سریع و جهش واقعی سرعت در Sonnet و Haiku.

Claude 4.7 چه تفاوتی با ۴.۶ دارد؟

چهار تغییر بزرگ. عامل‌های بلندمدت به جای چهل دقیقه، دو تا چهار ساعت منسجم می‌مانند. پنجره زمینه ۱ میلیون اکنون به جای یک ویژگی فقط مختص Opus، در هر نوع استاندارد است. استفاده از کامپیوتر از نسخه بتا خارج شد و حلقه عمل تقریباً دو برابر سریع‌تر است. ذخیره‌سازی سریع یک سطح یک ساعته اضافه کرد و قیمت‌های خواندن را کاهش داد، که Claude را برای عامل‌های با حجم بالا به قلمرو رقابتی از نظر هزینه منتقل کرد.

کدام مدل Claude 4.7 را باید استفاده کنم؟

Opus 4.7 برای استدلال دقیق، برنامه‌ریزی و عامل‌های بلندمدت. Sonnet 4.7 برای درایور روزانه، ویرایش کد و بیشتر کارهای حلقه عامل. Haiku 4.7 برای توان عملیاتی بالا، صدا، چت بلادرنگ و طبقه‌بندی. ارزان‌ترین پشته تولید، یک روتر چندلایه است که از هر سه استفاده می‌کند، نه یک استقرار تک مدل.

آیا Claude 4.7 بهتر از GPT-5.5 است؟

شکل‌های مختلف بهتر. Claude 4.7 در قابلیت اطمینان عامل، کار با کد، استفاده از ابزار ساختاریافته و پایداری بلندمدت برنده است. GPT-5.5 در خروجی چندوجهی، تولید تصویر، صدای بلادرنگ و توان عملیاتی خام در اوج استدلال برنده است. اکثر محصولات هوش مصنوعی تولیدی در سال 2026 به جای انتخاب یکی، از هر دو خانواده استفاده می‌کنند.

آیا Claude 4.7 دارای پنجره زمینه 1 میلیون است؟

بله. هر سه نوع ۴.۷ به صورت استاندارد با یک پنجره زمینه ۱ میلیون توکن عرضه می‌شوند و مدل در واقع از کل پنجره با حفظ معنادار استفاده می‌کند، نه اینکه توجه خود را به چند هزار توکن آخر معطوف کند.

تغییر Claude ۴.۷ در واقع قفل را باز می‌کند

Claude ۴.۷ اولین نسلی است که در آن لایه مدل دیگر گلوگاه نیست. این تغییر، محصولاتی را که ارزش ساخت دارند تغییر می‌دهد. عامل کدنویسی مستقلی که روی ۴.۶ کار نمی‌کند، روی ۴.۷ عرضه می‌شود. خط لوله ارزیابی کامل کدبیس که یک نسخه آزمایشی تحقیقاتی بود، به یک تست رگرسیون تبدیل می‌شود. محصول استفاده از کامپیوتر که یک ویدیوی Loom بود، به یک سطح پرداخت تبدیل می‌شود.

اکثر تیم‌ها هنوز هر نسخه از مدل را به عنوان یک بهبود افزایشی برای همان محصولات در نظر می‌گیرند. تیم‌هایی که در سال ۲۰۲۶ پیشی می‌گیرند، تیم‌هایی هستند که می‌پرسند کدام محصولات فقط در طبقه جدید قابل اجرا هستند و آنها را قبل از عرضه نسل بعدی عرضه می‌کنند. این کل بازی ۴.۷ است.

اگر تیم شما در حال توسعه بر اساس Claude است و گفتگو در مورد نمرات معیار متوقف شده است، مشکل از خود گفتگو است. گونه‌ای را انتخاب کنید که با کار مطابقت دارد، به جای انتقال قابلیت‌های قدیمی، بر اساس قابلیت‌های جدید بسازید و اجازه دهید رسیدهای حمل و نقل، دلیل را مشخص کنند.

اگر می‌خواهید در ساخت بر اساس Claude 4.7 بدون از دست دادن یک چهارم برای بازنویسی مدل، کمک بگیرید، استخدام ⟦برند ۰⟧. ClaudeBrainy بسته‌های مهارت و کتابخانه‌های سریع تنظیم شده برای خانواده 4.7 را ارسال می‌کند. AppBrainy نسخه‌های کامل محصول را برای تیم‌هایی که می‌خواهند ویژگی‌های الگوهای رابط کاربری عامل و هوش مصنوعی آنها از روز اول روی خانواده جدید اجرا شود، ارسال می‌کند.

Want help building on Claude 4.7 without losing a quarter to model rewrites? Brainy ships ClaudeBrainy as a Skill pack and prompt library tuned for the 4.7 family, plus AppBrainy for teams that want full product builds running on the new model layer.

Get Started

More from Brainy Papers

Keep reading