پديد آورندگان :
مسلم، بهزاد دانشگاه آزاد اسلامي واحد علوم و تحقيقات تهران - دانشكده فني و مهندسي - گروه مهندسي صنايع , سقايي، عباس دانشگاه آزاد اسلامي واحد علوم و تحقيقات تهران - دانشكده فني و مهندسي - گروه مهندسي صنايع , موحدي سبحاني، فرزاد دانشگاه آزاد اسلامي واحد علوم و تحقيقات تهران - دانشكده فني و مهندسي - گروه مهندسي صنايع
چكيده فارسي :
هدف اصلي اين پژوهش شناسايي عوامل كليدي و بررسي الگوريتم هاي مختلف داده كاوي در تصادفات ترافيكي در ايران، بخصوص در جاده هاي برون شهري است. تصادفات ترافيكي برون شهري يكي از منابع اصلي جهت تجزيه و تحليل و بررسي شدت حوادث رانندگي و علل موثر برآنها است. در ادامه مجموعه قوانيني كه مي تواند در شناسايي عوامل و تاثير آن ها در كاهش تصادفات موثر باشد استخراج خواهد شد. 5099 ركورد از داده هاي جمع آوري شده از محور تهران- قم در استان تهران مورد استفاده قرار گرفت. براي دستيابي به اهداف اين پژوهش از تكنيك هاي مختلف داده كاوي استفاده گرديد. به همين منظور از روش ارزيابي انتخاب مبتني بر همبستگي براي شناسايي عوامل موثر و انتخاب بردار ورودي استفاده گرديد. سپس 6 الگوريتم داده كاوي، بيزين ساده، لجيستيك، پرسپترون چندلايه، كلاس بندي از طريق رگرسيون، قوانين استنتاجي(پارت) و درخت تصميم گيري جي48، براي پيش بيني دقت مدل هاي مورد ارزيابي با استفاده از نرم افزار داده كاوي وكا مورد استفاده قرار گرفتند؛ همچنين از الگوريتم اپريوري به همراه دو مدل جي48 و پارت جهت استخراج قوانين استفاده شد. نتايج حاصل از استخراج قوانين نشان داد كه حضور عامل تصادف در صحنه تصادف، نوع برخورد، مانع ديد، موقعيت تصادف، شرايط سطح راه، هندسه محل تصادف و علل مستقيم بيان شده توسط پليس براي تصادف از مهم ترين عواملي بودند كه در قوانين استخراج شده از مجموعه قوانين به آن ها اشاره شده و بيشترين تعداد تكرار را داشتند. نتايج نشان دادند كه الگوريتم هاي پرسپترون و پارت بهترين عملكرد را در ميان ساير الگوريتم ها جهت پيش بيني در اختيار داشتند.
چكيده لاتين :
The main purpose of this study, Modeling, identifying key factors and investigating various data mining algorithms in traffic accidents in Iran, especially on urban roads. The following was extracted set of rules that can be effective in identifying key factors and their impact in reducing accidents. The data included 5099 records of traffic accidents on the Tehran-Qom road in Tehran during a four-year period. Each accident record consisted of 57 accidents related to accidents. In the pre-processing, the greedy search algorithm was used to find the best sub-set of factors. After the pre-processing, reduced records used. Finally, 8 characteristics, accident factor, type of collision, visual impedance, accident situation, road surface conditions, location geometry, direct causes and type of accident were investigated. To achieve the objectives of this research, seven different data mining techniques were used. 6 Data mining algorithms were used to predict and identify key factors using WEKA data mining software; These algorithms include: J48, PART, Logistic, Classification via Regression, Naïve Bayesian and Multilayer Perceptron. Also, the apriori algorithm was used to extract the rules. The results showed that Perceptron and Part algorithms had the best performance among other algorithms to predict. Algorithm Naïve Bayesian despite being in the range of acceptable has a weaker performance than other algorithms, both in model accuracy and coverage. Several of the most important factors of the set of rules were road accidents, flat and straight geometry, Lack of visibility barrier and attending the accident site.