الگوريتمي خود يادگير براي رهگيري هدف متحرک توسط گروهي از عامل هاي هوشمند

    —         —    

ارتباط با ما     —     لیست پایان‌نامه‌ها

... دانلود ...

بخشی از متن الگوريتمي خود يادگير براي رهگيري هدف متحرک توسط گروهي از عامل هاي هوشمند :




نام کنفرانس یا همایش : هشتمين کنفرانس ملي فرماندهي و کنترل ايران (C4I)

تعداد صفحات :10

چکیده مقاله:

همکاری گرهی از عامل ها به منظور تامین یک هدف مشترک و ماکزیمم سازی منفعت جمعی مسئله ای بسیار پر کاربرد و مورد توجه می باشد در این مقاله مسئله رهگیری یک هدف متحرک توسط گروهی از عامل های خود مختار در یک فضای پیوسته مورد توجه قرار می گیرد.ترکیبی از یادگیری Qو کنترل فازی به عنوان پایه و اساس روش ارائه شده برای همکاری بین عامل ها در تعقیب هدف متحرک مطرح گردیده است مزیت اصلی یادگیری تقویتی آن است که سیستم با تعامل مستقیم با محیط و بدون در اختیار داشتن داده های آموزشی فبلی یادگیری را انجام می هدهد همچنین استفاده از روش کنترل فازی که زیر مجموعه ای از روشهای کنترل هوشمتد می باشند به دلیل کارایی فراوان در کنترل عامل های هوشمند در زمانی که مدل محیط بسیار پیجیده و یا در دسترس نیست در سالهای اخیر بسیار مورد توجه قرار گرفته است اشگال اصلی الگریتم یادگیری Q به منظور مدل سازی مسئله رهگیری در فضای پیوسته آن است که در این فضا تعداد حالات و اعمال پیش روی هر عامل بسیار زیاد می باشند لذا الگوریتم یادگیری Q ارائه شده توسط آقای واتکینز کارا نمی باشد.

لینک کمکی