شماره ركورد كنفرانس :
4214
عنوان مقاله :
حل مسئله بهينه سازي براي انتخاب متغيرهاي مهم در دادههاي با بعد بالا
پديدآورندگان :
كاظمي محمد دانشگاه صنعتي شاهرود , شاهسوني داود دانشگاه صنعتي شاهرود , آرشي محمد دانشگاه صنعتي شاهرود
كليدواژه :
الگوريتم مختصات نزولي , انتخاب متغيرهاي مهم , بهينه سازي , داده هاي با بعد بالا.
عنوان كنفرانس :
دهمين كنفرانس بين المللي تحقيق در عمليات
چكيده فارسي :
پيشبيني متغير پاسخ به كمك چندين متغير توضيحي همواره مورد توجه محققين است. هدف ساختن مدلي است كه متغير پاسخ را به متغيرهاي توضيحي مرتبط كند. وقتي تعداد متغيرهاي توضيحي مدل زياد باشد، تفسير مدل مشكلتر و هزينه محاسبات افزايش مي يابد. لذا، شناسايي متغيرهاي توضيحي مؤثر بر پاسخ بسيار مهم است. در دادههاي با بعد بالا مانند دادههاي پزشكي و ژنتيكي كه تعداد متغيرهاي مهم زياد است، انتخاب اين متغيرها معمولاً با استفاده از يك روش بهينهسازي درجه دوم مانند مينيمم كردن مجموع مربعات خطا تحت يك شرط محدودكننده انجام مي شود. با استفاده از روش لاگرانژ، ميتوان اين مسئله را بهصورت يك تابع هدف جريمهشده در نظر گرفت. حل اين مسئله مينمم سازي مستلزم استفاده از روش هاي بهينهسازي است. در اين مقاله، فرض مي كنيم رابطه بين متغيرهاي توضيحي و متغير پاسخ بهصورت جمعي ناپارامتري است و براي انتخاب متغيرهاي مهم، توابع جريمه مختلف را در نظر مي گيريم. حل اين مسئله بهينهسازي به وسيله الگوريتم مختصات نزولي گروهي انجام مي شود. در پايان، عملكرد اين الگوريتم را تحت انواع توابع جريمه، براي متغيرهاي گروهي، با يك مثال شبيهسازي بررسي مي كنيم.