پديد آورندگان :
قدوسي، محمد دانشگاه تربت حيدريه - دانشكده فني و مهندسي - گروه مهندسي صنايع، تربت حيدريه ، ايران , ميرسعيدي، فاطمه دانشگاه فردوسي مشهد - دانشكده فني و مهندسي - گروه مهندسي صنايع، مشهد، ايران , كوشا، حميدرضا دانشگاه فردوسي مشهد - دانشكده فني و مهندسي - گروه مهندسي صنايع، مشهد، ايران
چكيده فارسي :
پيشينه و اهداف: در حال حاضر پيشرفتهاي قابل توجهي در عرصه فناوري اطلاعات و ارتباطات در جوامع مختلف ديده ميشود. با توجه به اين پيشرفتها، دانشگاهها به عنوان يك نهاد پيشرو در عرصه علم، به سمت فرآيندهاي الكترونيكي در مسير مديريت آموزش حركت نموده اند و در محيط هاي آموزشي، پايگاههاي اطلاعاتي با حجم اطلاعات زياد وجود دارد. با تحليل اين داده هاي انبوه سيستمهاي آموزشي، ميتوان روشهايي را براي بهبود وضعيت آموزشي دانشجويان ارايه داد. داده كاوي آموزشي به دنبال كشف دانش موجود در داده هاي سيستم آموزشي بودهاست. يكي از كاربردهاي دادهكاوي آموزشي، پيشبيني عملكرد تحصيلي دانشجويان است. پيشبيني عملكرد تحصيلي دانشجويان و ارائه راهكارهاي مفيد از اهميت ويژهاي در موفقيت نظامهاي آموزشي برخوردار است و ميتواند به تصميم گيري درست مديران، جهت افزايش بازدهي سيستم آموزشي و عملكرد بهتر دانشجويان، كمك شاياني كند. هدف مقاله حاضر، شناسايي شاخصهاي مؤثر بر عملكرد تحصيلي، پيشبيني وضعيت تحصيلي دانشجويان با استفاده از تكنيكهاي دادهكاوي و در نهايت، ارائه روندي جديد براي اصلاح روش انتخاب واحد و راهكارهاي آموزشي در جهت افزايش كارايي سيستم آموزش است.
روشها: گامهاي اين پژوهش بر اساس مدل Crisp تعيين شده است. در پژوهش حاضر، پايگاه داده اي شامل 9 مجموعه داده از درسهاي تخصصي رشته مهندسي صنايع استفاده شدند. دوره تحصيلي دانشجويان در نظر گرفته شده كارشناسي بودهاست. شاخص هاي تاثيرگذار بر عملكرد دانشجويان، بر اساس تحقيقات قبلي و نظر خبرگان شناسايي شدهاست. دادههاي جمعيتشناختي و سوابق تحصيلي دانشجويان مقطع كارشناسي رشته مهندسي صنايع وارد پايگاه داده شدند. پس از پيشپردازش دادهها، 13 شاخص در نظر گرفته شد و با كمك الگوريتمهاي مختلف، مدلهاي مختلفي براي پيشبيني وضعيت تحصيلي دانشجويان در نيمسال بعدي ارائه گرديد. مدلهاي شبكه بيزي، لوجيت بوست، پارت و درخت تصميم به عنوان پركاربردترين الگوريتم هاي داده كاوي آموزشي در اين پژوهش مورد استفاده قرار گرفته و جهت بررسي عملكرد الگوريتم ها از دو شاخص صحت و سطح زير نمودار عملكرد استفاده شد. 9 پايگاه داده دروس در دو حالت دو و چند كلاسه در نظر گرفته شدند. در ادامه، مقايسهاي ميان نتايج حاصل از 4 الگوريتم مختلف صورت گرفته است.
يافتهها: با توجه به شاخص هاي بهره اطلاعات و نسبت بهره، تمامي 13 شاخص در نظر گرفته شده، به عنوان شاخصهاي مؤثر شناسايي شدند. اين شاخصها عبارتند از: معدل، كل واحدهاي گذرانده، تعداد ترمهاي مشروطي، نوع پذيرش، وضعيت تأهل، جنسيت، سال ورود به دانشگاه، سن، محل زندگي، ترم حاضر، نمره درس پيشنياز، استاد درس، تكرارد در اخذ واحد. از بين 4 مدل در نظر گرفته شده، بهترين مدل در دستهبندي و پيشبيني عملكرد آموزشي دانشجويان ، الگوريتم Logit Boost شناخته شد. اين الگوريتم، در هر دو حالت دو و چندكلاسه براساس شاخصهاي درصد صحت و سطح زير نمودار ROC عملكرد بهتري از خود نشان دادهاست.
نتيجهگيري: با توجه به عملكرد قابل قبول الگوريتم هاي داده كاوي، استفاده از اين الگوريتم ها در پيش بيني عملكرد دانشجويان مناسب است و ميتوان مدل پيشنهادي را به عنوان يك ابزار پشتيبان تصميمگيري در سيستمهاي آموزشي مورد استفاده قرار داد. در نهايت، با توجه به نتايج بهدست آمده و نظرخواهي از خبرگان دانشگاهي، فرايند انتخاب واحد، بازطراحي گرديد. فرايند ارايه شده با استفاده از دادههاي موجود در سيستمهاي آموزشي و علم دادهكاوي، دانش مفيدي به تصميم گيرندگان جهت تصميم صحيح و مناسب ارايه ميدهد. تصميمگيرندگان ميتوانند با بررسي پيش بيني هاي انجام شده توسط الگوريتم داده كاوي و كسب اطلاعات مفيد، تصميمات مناسب اخذ نمايند، تا سيستم آموزشي بازدهي بيشتري داشتهباشد.
چكيده لاتين :
Background and Objectives: Nowadays, significant advancements in information technology and communication field in different societies are seen. Given that these advancements, universities as a leading institution in the field of science, have moved towards electronic processes in the management of education and educational environments, there are databases with a large amount of information. By analyzing this massive data of educational systems, methods can be provided to improve the educational status of students. Educational data mining has sought to discover the knowledge contained in the data of the educational system. One of the applications of educational data mining is to predict students' academic performance. Predicting students' academic performance and providing useful solutions is of particular importance in the success of educational systems and can help managers make the right decisions to increase the efficiency of the educational system and better student performance. The purpose of this paper is to identify the effective indicators on academic performance, predict students' academic status using data mining techniques, and finally present a new trend for modifying unit selection and educational strategies to increase the efficiency of the education system.
Methods: steps of this research are determined according to CRISP model. In current research, Databases containing 9 datasets of specialized courses in industrial engineering were used. The students' grade was bachelor's degree. Indicators affecting student performance have been identified based on previous researches and expert opinions. Demographic data and academic records of undergraduate students are entered in database. After data preprocessing, 13 attributes are selected, different models were proposed to predict student's academic status in the next semester. Then, a comparison between the results of 4 different algorithms has been done.
Findings: All 13 attributes are identified to be effective according to information gain and gain ratio. This 13 attributes as follow: GPA, Total passed units, Number of conditional terms, Type of admission, Marital status, Gender, University admission year, Living place , Age, Current semester, Prerequisite course score, instructor of the course, Repeat the course. Between of 4 considered models, the Logit Boost algorithm is known as the best model in categorizing in two class and multi-class according to the accuracy rate and ROC.
Conclusion: Because of acceptable performance of data mining algorithms, the use of these algorithms in predicting student performance is appropriate and the proposed model can be used as a support tool for decision making in educational systems. Finally, according to the obtained results and the opinion of academic experts, the unit selection process was redesigned. The proposed model can be used as a decision support tool in educational systems. Finally, due to the results obtained and the opinions of the academic experts, the process of unit selection was redesigned. The presented process uses the available data in educational systems and data mining science, provides useful knowledge to decision-makers to make the right and appropriate decision. Decision makers can make appropriate decisions by examining the predictions made by the data mining algorithm and obtaining useful information, in order to make the educational system more efficient