در معماریهای مبتنی بر Agent، افزایش توانایی سیستم معمولاً با اضافهکردن دستورالعملهای بیشتر، ابزارهای جدید و نمونههای متنوع به context همراه میشود. این روند در ابتدا باعث بهبود عملکرد میشود، اما با گذشت زمان یک نقطه شکست ایجاد میکند؛ جایی که سیستم دیگر قادر به حفظ انسجام رفتاری نیست و تصمیمگیریهای آن دچار ناپایداری میشود. این وضعیت در ادبیات جدید به عنوان context rot شناخته میشود؛ شرایطی که در آن رشد context به جای افزایش توانایی، باعث کاهش دقت و افزایش خطا میشود.
در چنین شرایطی مسئله اصلی دیگر «افزودن اطلاعات بیشتر» نیست، بلکه «کنترل نحوه دسترسی به اطلاعات» است. همین تغییر زاویه نگاه باعث شکلگیری مفهوم agent skills شده است. در این رویکرد، دانش و قابلیتها بهجای قرار گرفتن مستقیم در system prompt، در قالب واحدهای مستقل سازماندهی میشوند.
هر skill یک ساختار ساده اما هدفمند دارد. این ساختار معمولاً در قالب یک پوشه تعریف میشود که درون آن یک فایل مرکزی با نام skill.md قرار دارد. این فایل شامل تعریف رفتار، منطق اجرا و شرایط فعالسازی skill است. در کنار آن، فایلهای کمکی مانند اسکریپتها، منابع و دادههای پشتیبان نیز میتوانند وجود داشته باشند. نکته مهم در این معماری این است که همه قابلیتها از ابتدا وارد context نمیشوند.
به جای بارگذاری کامل اطلاعات، از رویکردی به نام progressive disclosure استفاده میشود. در این روش، تنها بخش بسیار کوچکی از metadata هر skill در ابتدای اجرای Agent در context قرار میگیرد. این مقدار معمولاً بسیار محدود است و نقش آن صرفاً معرفی قابلیتهاست. زمانی که یک task با یک skill خاص تطابق پیدا میکند، جزئیات کامل آن skill به صورت on-demand وارد جریان اجرا میشود. این طراحی باعث میشود امکان مدیریت دهها یا حتی صدها skill بدون فشار بر context window فراهم شود.
این ساختار به صورت مستقیم با مسئله دیگری نیز مرتبط است: نحوه تعامل Agent با چندین قابلیت همزمان بدون ایجاد پیچیدگی رفتاری. در مدلهای سنتی، افزایش قابلیتها معمولاً منجر به ایجاد معماریهای چند-Agent میشود. اما در مدل skill-based، یک Agent واحد میتواند مجموعهای از رفتارهای تخصصی را از طریق skillها مدیریت کند. این موضوع باعث کاهش پیچیدگی ساختاری و سادهتر شدن فرآیند نگهداری سیستم میشود.
در سطح اجرا، یکی از چالشهای اصلی زمانی ظاهر میشود که Agent باید یک فرآیند چندمرحلهای را طی کند. اگر تمام تاریخچه اجرا در context باقی بماند، هر مرحله باعث افزایش بار اطلاعاتی و کاهش کیفیت تصمیمگیری میشود. برای حل این مسئله، از ساختارهای گرافی مانند DAG-based orchestration استفاده میشود. در این مدل، هر مرحله اجرا به عنوان یک node مستقل عمل میکند و تنها اطلاعات ضروری به مرحله بعد منتقل میشود. به جای انتقال کامل دادهها، از reference یا pointer استفاده میشود تا context سبک باقی بماند.
این طراحی باعث میشود state به جای اینکه در prompt انباشته شود، در یک لایه جداگانه مدیریت شود. نتیجه این تغییر، افزایش قابلیت trace کردن رفتار سیستم و سادهتر شدن فرآیند debugging است. همچنین هر مرحله میتواند با یک capability profile جدید اجرا شود، بدون اینکه وابستگی به state قبلی باعث ایجاد اختلال شود.
در کنار این ساختار، مفهوم دیگری نیز مطرح میشود: امکان یادگیری از اجراهای موفق. در این حالت، Agent میتواند بر اساس traceهای موفق، skillهای جدید تولید یا skillهای موجود را بهینهسازی کند. این سطح از رفتار که به آن meta skills اشاره میشود، نشاندهنده حرکت سیستم از یک ساختار ایستا به یک سیستم خودتکاملیابنده است. با این حال، این فرایند همچنان نیازمند کنترل انسانی است، زیرا بهینهسازی خودکار ممکن است به معیارهای اشتباه منجر شود.
در سطح معماری، یکی از نکات کلیدی این است که skillها نباید به عنوان بخشی از حافظه بلندمدت در نظر گرفته شوند. حافظه در این سیستمها بیشتر نقش ثبت وقایع را دارد، در حالی که skillها نقش تعریف رفتار فعلی سیستم را ایفا میکنند. این تفکیک باعث جلوگیری از ایجاد تناقض میان نسخههای مختلف رفتار میشود. زمانی که یک skill بهروزرسانی میشود، سیستم باید بهصورت شفاف بین نسخه جدید و دادههای تاریخی تمایز قائل شود تا از ترکیب ناخواسته رفتارهای قدیمی و جدید جلوگیری شود.
در طراحی عملی این سیستمها، یکی از اصول مهم این است که هر skill تنها زمانی فعال شود که واقعاً با task در حال اجرا تطابق داشته باشد. این تطابق بر اساس metadata سبک انجام میشود، نه بر اساس بارگذاری کامل محتوا. این ویژگی باعث میشود سیستم بتواند تعداد زیادی skill را مدیریت کند بدون اینکه دچار کاهش کارایی شود.
در نهایت، این معماری نشان میدهد که توسعه Agentهای مدرن دیگر صرفاً مسئله افزایش توان مدل نیست، بلکه مسئله اصلی در طراحی نحوه سازماندهی دانش، کنترل جریان اطلاعات و مدیریت چرخه عمر قابلیتها است. مسیر حرکت از context سنگین به skill-based architecture، نقطه تغییر اساسی در نحوه طراحی سیستمهای هوشمند محسوب میشود.
بازدیدها: 0

طراح و توسعه دهنده نرم افزار