شماره ركورد كنفرانس :
5435
عنوان مقاله :
بررسي روشهاي متوازنسازي دادهها در تشخيص ناهنجارشناسي در دادههاي مكاني–زماني به كمك مدلهاي يادگيري گروهي
عنوان به زبان ديگر :
Investigating Data Balancing Methods in Anomaly Detection of Spatio-Temporal Data using Ensemble Models
پديدآورندگان :
رضائيان كوچصفهان فاطمه fatemerezaeian2976@gmail.com دانشگاه علم و صنعت ايران , رحماني حسين h_rahmani@iust.ac.ir دانشگاه علم و صنعت ايران , باقري آسيه asieh.bagheri@gmail.com دانشگاه شهيد بهشتي , يادگار محمد مهدي m_yadegar@comp.iust.ac.ir دانشگاه علم و صنعت ايران , سلطانزاده پري ناز parisoltan77@gmail.com دانشگاه علم و صنعت ايران
كليدواژه :
داده هاي مكاني-زماني , تشخيص ناهنجاري , تحليل رفتار راننده , متوازنسازي داده , يادگيري گروهي
عنوان كنفرانس :
نهمين همايش ملي مطالعات و تحقيقات نوين در حوزه علوم كامپيوتر، برق و مكانيك ايران
چكيده فارسي :
امروزه با پيشرفت سريع روشهاي موقعيتيابي، دادههاي مكاني-زماني به طور گستردهاي در دسترس قرار گرفتهاند. از اين رو، استخراج دانش ارزشمند از اين دادهها براي بسياري از برنامههاي كاربردي در دنياي واقعي حائز اهميت است. از جمله دادههاي مكاني-زماني ميتوان به رويداد، خط سير، نقاط مرجع، دادههاي شطرنجي و ويدئو اشاره كرد. با توجه به انواع اين دادهها، قالب دادهها مي تواند به صورت نقطه، دنباله، گراف، ماتريس دو بعدي يا تنسور سه بعدي باشد. يكي از كاربردهاي ناهنجارشناسي در دادههاي مكاني-زماني تحليل رفتار رانندگان است. به طور كلي تشخيص ناهنجاري در دادههاي مكاني-زماني و تحليل آنها ميتواند باعث كشف دانش ارزشمند دربارهي افراد، گروهها و وقايع مختلف شود. از طرفي تعداد، حجم و دقت دادههاي مكاني-زماني به سرعت در حال افزايش است. به همين علت اين ناهنجارشناسي در زمينههاي مختلف حائز اهميت است. در اين مقاله، قصد داريم با استفاده از مجموعه دادههاي تاكسيهاي سبز نيويورك سال 2022 و با كمك مدلهاي يادگيري گروهي به شناسايي روشي مناسبتر در شناخت ناهنجاري در دادههاي مكاني-زماني بپردازيم. به منظور ارزيابي روش پيشنهادي از معيارهاي ارزيابي رايج و ماتريس سردرگمي استفاده شده است. مدل پيشنهادي ما توانسته است به حدود 20 درصد بهبود در معيار يادآوري نسبت به حالت پايه دست پيدا كند.