پایان نامه بررسی سيستم‌های چند عامله با استفاده از تئوری بازی‌ها


دانشگاه آزاد اسلامی

واحد تهران جنوب

دانشکده فنی و مهندسی

سمینار براي دریافت درجه کارشناسی ارشد”M.Sc”

مهندسی برق – کنترل

عنوان:

بررسی سيستم‌های چند عامله با استفاده از تئوری بازی‌ها

چكيده

در اين رساله، روش مناسبي جهت محاسبه نقطه تعادل نش در الگوريتم‌هاي يادگيري تقويتي چندعاملي با تعداد زياد عامل‌ها مطرح شده‌است، كه قادراست با ادغام محاسبات مربوط به نقطه تعادل نش و ايجاد مصالحه بين اكتشاف- استخراج، محاسبات را به صورت بهينه كاهش دهند. تركيب يادگيري تقويتي تك- عاملي و تئوري بازي ايده اصلي اكثر روشهاي يادگيري چندعاملي است. اين روش‌ها سعي دارند تا كل فرآيند يادگيري را به تعدادي متناهي از حالت‌هاي تصميم‌گيري چندعاملي با خاصيت ماركوف تقسيم كرده و با انتخاب نقطه تعادل نش در هر كدام از اين مراحل به تدبير بهينه براي هر عامل همگرا شوند. بنابراين محاسبه نقطه تعادل نش مسئله مهمي است كه در حال حاضر مشكلاتي شامل پيچيدگي محاسبات در روشهاي شناخته شده محاسبه نقطه تعادل نش، چندگانگي نقطه تعادل نش، و مختلط بودن نقطه تعادل نش باعث شده كه اكثر روشهاي پيشنهادي يادگيري تقويتي چندعاملي جايگاه مناسبي در حل مسائل دنياي واقعي پيدا نكنند. ناگفته نماند كه تقريباً تمام روشهاي يادگيري تقويتي چندعاملي مطرح شده، مبتني بر روشهاي off-policy بوده‌اند كه نيازي به در نظر گرفتن مسئله رويه انتخاب عمل و اكتشاف در اثبات همگرايي ندارند. بنابراين در رويه‌هاي اجرايي پيشنهاد داده‌اند كه ابتدا نقطه تعادل نش محاسبه شده و سپس با روش ϵ-greedy مصالحه بين اكتشاف و استخراج برقرار شود.

محاسبه نقطه تعادل ϵ-نش در بازي‌هاي نرمال در اين رساله به صورت يك مسئله مينيمم‌سازي تعريف شده كه جواب آن توسط الگوريتم‌هاي ژنتيك بدست آمده‌است. علاوه بر كاهش پيچيدگي روش محاسبه نقطه تعادل نش، با اضافه كردن جمله مناسب در محاسبه تابع برازندگي، هر عامل قادر است نقطه تعادل نش پارتو را محاسبه كند كه مسئله چندگانگي نقاط تعادل نش را نيز مرتفع مي‌سازد.

برای دانلود متن کامل پایان نامه اینجا کلیک کنید