در معماری‌های مبتنی بر Agent، افزایش توانایی سیستم معمولاً با اضافه‌کردن دستورالعمل‌های بیشتر، ابزارهای جدید و نمونه‌های متنوع به context همراه می‌شود. این روند در ابتدا باعث بهبود عملکرد می‌شود، اما با گذشت زمان یک نقطه شکست ایجاد می‌کند؛ جایی که سیستم دیگر قادر به حفظ انسجام رفتاری نیست و تصمیم‌گیری‌های آن دچار ناپایداری می‌شود. این وضعیت در ادبیات جدید به عنوان context rot شناخته می‌شود؛ شرایطی که در آن رشد context به جای افزایش توانایی، باعث کاهش دقت و افزایش خطا می‌شود.

در چنین شرایطی مسئله اصلی دیگر «افزودن اطلاعات بیشتر» نیست، بلکه «کنترل نحوه دسترسی به اطلاعات» است. همین تغییر زاویه نگاه باعث شکل‌گیری مفهوم agent skills شده است. در این رویکرد، دانش و قابلیت‌ها به‌جای قرار گرفتن مستقیم در system prompt، در قالب واحدهای مستقل سازمان‌دهی می‌شوند.

هر skill یک ساختار ساده اما هدفمند دارد. این ساختار معمولاً در قالب یک پوشه تعریف می‌شود که درون آن یک فایل مرکزی با نام skill.md قرار دارد. این فایل شامل تعریف رفتار، منطق اجرا و شرایط فعال‌سازی skill است. در کنار آن، فایل‌های کمکی مانند اسکریپت‌ها، منابع و داده‌های پشتیبان نیز می‌توانند وجود داشته باشند. نکته مهم در این معماری این است که همه قابلیت‌ها از ابتدا وارد context نمی‌شوند.

به جای بارگذاری کامل اطلاعات، از رویکردی به نام progressive disclosure استفاده می‌شود. در این روش، تنها بخش بسیار کوچکی از metadata هر skill در ابتدای اجرای Agent در context قرار می‌گیرد. این مقدار معمولاً بسیار محدود است و نقش آن صرفاً معرفی قابلیت‌هاست. زمانی که یک task با یک skill خاص تطابق پیدا می‌کند، جزئیات کامل آن skill به صورت on-demand وارد جریان اجرا می‌شود. این طراحی باعث می‌شود امکان مدیریت ده‌ها یا حتی صدها skill بدون فشار بر context window فراهم شود.

این ساختار به صورت مستقیم با مسئله دیگری نیز مرتبط است: نحوه تعامل Agent با چندین قابلیت هم‌زمان بدون ایجاد پیچیدگی رفتاری. در مدل‌های سنتی، افزایش قابلیت‌ها معمولاً منجر به ایجاد معماری‌های چند-Agent می‌شود. اما در مدل skill-based، یک Agent واحد می‌تواند مجموعه‌ای از رفتارهای تخصصی را از طریق skillها مدیریت کند. این موضوع باعث کاهش پیچیدگی ساختاری و ساده‌تر شدن فرآیند نگهداری سیستم می‌شود.

در سطح اجرا، یکی از چالش‌های اصلی زمانی ظاهر می‌شود که Agent باید یک فرآیند چندمرحله‌ای را طی کند. اگر تمام تاریخچه اجرا در context باقی بماند، هر مرحله باعث افزایش بار اطلاعاتی و کاهش کیفیت تصمیم‌گیری می‌شود. برای حل این مسئله، از ساختارهای گرافی مانند DAG-based orchestration استفاده می‌شود. در این مدل، هر مرحله اجرا به عنوان یک node مستقل عمل می‌کند و تنها اطلاعات ضروری به مرحله بعد منتقل می‌شود. به جای انتقال کامل داده‌ها، از reference یا pointer استفاده می‌شود تا context سبک باقی بماند.

این طراحی باعث می‌شود state به جای اینکه در prompt انباشته شود، در یک لایه جداگانه مدیریت شود. نتیجه این تغییر، افزایش قابلیت trace کردن رفتار سیستم و ساده‌تر شدن فرآیند debugging است. همچنین هر مرحله می‌تواند با یک capability profile جدید اجرا شود، بدون اینکه وابستگی به state قبلی باعث ایجاد اختلال شود.

در کنار این ساختار، مفهوم دیگری نیز مطرح می‌شود: امکان یادگیری از اجراهای موفق. در این حالت، Agent می‌تواند بر اساس traceهای موفق، skillهای جدید تولید یا skillهای موجود را بهینه‌سازی کند. این سطح از رفتار که به آن meta skills اشاره می‌شود، نشان‌دهنده حرکت سیستم از یک ساختار ایستا به یک سیستم خودتکامل‌یابنده است. با این حال، این فرایند همچنان نیازمند کنترل انسانی است، زیرا بهینه‌سازی خودکار ممکن است به معیارهای اشتباه منجر شود.

در سطح معماری، یکی از نکات کلیدی این است که skillها نباید به عنوان بخشی از حافظه بلندمدت در نظر گرفته شوند. حافظه در این سیستم‌ها بیشتر نقش ثبت وقایع را دارد، در حالی که skillها نقش تعریف رفتار فعلی سیستم را ایفا می‌کنند. این تفکیک باعث جلوگیری از ایجاد تناقض میان نسخه‌های مختلف رفتار می‌شود. زمانی که یک skill به‌روزرسانی می‌شود، سیستم باید به‌صورت شفاف بین نسخه جدید و داده‌های تاریخی تمایز قائل شود تا از ترکیب ناخواسته رفتارهای قدیمی و جدید جلوگیری شود.

در طراحی عملی این سیستم‌ها، یکی از اصول مهم این است که هر skill تنها زمانی فعال شود که واقعاً با task در حال اجرا تطابق داشته باشد. این تطابق بر اساس metadata سبک انجام می‌شود، نه بر اساس بارگذاری کامل محتوا. این ویژگی باعث می‌شود سیستم بتواند تعداد زیادی skill را مدیریت کند بدون اینکه دچار کاهش کارایی شود.

در نهایت، این معماری نشان می‌دهد که توسعه Agentهای مدرن دیگر صرفاً مسئله افزایش توان مدل نیست، بلکه مسئله اصلی در طراحی نحوه سازمان‌دهی دانش، کنترل جریان اطلاعات و مدیریت چرخه عمر قابلیت‌ها است. مسیر حرکت از context سنگین به skill-based architecture، نقطه تغییر اساسی در نحوه طراحی سیستم‌های هوشمند محسوب می‌شود.

https://t.me/AIDeveloperNotes

بازدیدها: 0

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

5 + هجده =