شماره ركورد :
970583
عنوان مقاله :
تخمين مقادير آنومال به كمك تركيب مناسبي از روش جدايش فواصل ماهالانوبيس و سه روش‌ پركاربرد داده‌كاوي ؛ مطالعه موردي : پركام
عنوان به زبان ديگر :
Estimation of Anomalous Values by Using an Appropriate Combination between Mahalanobis Distances and Three Widely Used Data Mining Methods; Case Study: Parkam
پديد آورندگان :
قنادپور، سعيد , هزارخاني، اردشير دانشگاه صنعتي اميركبير - دانشكده مهندسي معدن و متالورژي , رودپيما، ترانه
تعداد صفحه :
13
از صفحه :
45
تا صفحه :
57
كليدواژه :
تخمين مقادير آنومال , فواصل ماهالانوبيس , داده كاوي , پركام
چكيده فارسي :
در مطالعه پيش رو به منظور كاهش خطا و ريسك در راستاي صرف هزينه، زمان، انرژي و نيز دستيابي به پيشگوئي‌هايي به مراتب ارزنده‌تر، به بررسي تركيب روش‌هاي داده‌كاوي و جدايش آنومالي پرداخته مي‌شود. اهميت تشخيص مقادير آنومال از زمينه بر هيچ يك پوشيده نيست، به اين منظور روش‌هاي متعددي ابداع گشته است كه از آن جمله مي‌توان به روش جدايش فواصل ماهالانوبيس اشاره كرد كه روشي مؤثر و چند متغيره در جدايش مقادير آنومال از زمينه محسوب مي‌شود. از طرفي، پيش‌بيني ابزاري قدرتمند در فرآيند برنامه‌ريزي در هر فعاليتي هست، پس به كارگيري روش‌هاي داده‌كاوي در جهت يافتن الگو و روابط نهفته در دل داده‌ها، نياز ما را در اين زمينه مرتفع مي‌سازد. لذا در مطالعه حاضر، به بررسي عملكرد تركيب روش جدايش فوق با سه روش داده‌كاوي K-نزديك‌ترين همسايه، طبقه‌بند ساده بيز و درخت تصميم‌گيري پرداخته مي‌شود. به‌اين‌ترتيب كه پس از جدايش مقادير آنومال مس و موليبدن در مورد 377 نمونه حاصله از عمليات نمونه‌برداري سطحي در محدوده پركام به كمك روش فواصل ماهالانوبيس، به منظور پيش‌بيني اين مقادير براي هر نمونه تصادفي، سه روش داده‌كاوي مذكور، مورد استفاده قرار مي‌گيرند. در نهايت نيز جهت بررسي شبكه‌هاي طراحي شده، نمونه‌هاي آموزشي به عنوان داده‌هاي تست در اختيار شبكه‌هاي مذكور قرار گرفته‌اند. نتايج حاصله نشان مي‌دهند كه روش درخت تصميم‌گيري به مراتب قوي‌تر ظاهر شده، زيرا در شبكه طراحي شده توسط اين روش، تنها دو نمونه از بين 377 نمونه، اشتباهاً شناسايي شده‌اند كه نشان دهنده دقت بالاي شبكه طراحي شده است. يعني مقدار خطاي Resubstitution گزارش شده براي اين شبكه برابر با 0/0053 هست. لازم به ذكر است كه تعداد نمونه‌هاي به اشتباه پيش‌بيني شده براي دو روش KNN و بيز به ترتيب برابر با 9 و 23 و به تبع، مقدار خطاي محاسبه شده براي آنها نيز به ترتيب برابر با 0/0239 و 0/061 گزارش شده‌اند. به اين ترتيب با توجه به ميزان خطاي به مراتب قابل‌قبول‌تر براي شبكه طراحي شده توسط تركيب روش درخت تصميم‌گيري و فواصل ماهالانوبيس، تركيب مذكور به عنوان روشي قابل اطمينان و سودمند جهت رسيدن به صحيح‌ترين پيشگوئي‌ها به تصميم گيران اين صنعت معرفي شده است.
چكيده لاتين :
Summary Importance of detecting anomalous values from background is undeniable; so many different methods have been developed. On the other hand, prediction is a powerful tool in the process of each task’s planning. Using data mining methods for finding patterns between data can answer this requirement. Due to the necessity of high processing accuracy, the performance of a separation method has been evaluated. This performance is combined with three data mining methods. Finally we introduced the best combination (Mahalanobis Distance and Decision Tree) with the most accurate predictions. In order to reduce error and risk to save costs, time, energy and access to the more valuable predictions, in following paper we have studied Mahalanobis Distances to separate anomalous values and combined the results with three methods: K–Nearest Neighbor (KNN), Naïve Bayes Classifier and Decision Tree (DT) then achieved to the best combination with the least error rate. Introduction Mahalanobis distances method was used to assess prospective areas of Parkam district based on the two variables (Cu and Mo grade) and anomalous values have been defined based on the grades of copper and molybdenum. Then the three mentioned algorithms were trained by 4 parameter data grades of copper and molybdenum, coordinates of each samples (X and Y) and the results of our separation method as well, finally predictive equations were achieved in order to inform about other random samples. The best combination could be useful to predict with high accuracy in each plan. Methodology and Approaches Mahalanobis distances method is an effective multivariate method on separation of anomalous values from background. Various data mining methods have been developed to classify data. Three most important and common methods are K–Nearest Neighbor, Naïve Bayes Classifier and Decision Tree; They can be used to find features that can distinguish different classes from each other. Results and Conclusions After separation of anomalous values by applying Mahalanobis distances, combined models have been produced. Then actual data have been seen as the test ones to evaluate the accuracy of predictions. At last, based on the resubstitution rate, that is 0.0053, for designed system via Decision Tree technique and anticipating only 2 out of 377 numbers of samples as the background samples instead of anomalous ones, this method was recognized as the more pragmatic approach than KNN and Naïve Bayes approaches producing 0.0239 and 0.061 error rate and predicting 9 and 23 numbers of anomalous values as the background samples respectively. According to the much more acceptable error rate for designed network by combination of Mahalanobis Distances and Decision Tree methods, we can introduce that as a much more reliable and useful method in order to achieve the most accurate predictions to the decision makers in the industry.
سال انتشار :
1396
عنوان نشريه :
روش هاي تحليلي و عددي در مهندسي معدن
فايل PDF :
3673679
عنوان نشريه :
روش هاي تحليلي و عددي در مهندسي معدن
لينک به اين مدرک :
بازگشت