شماره ركورد :
1080991
عنوان مقاله :
ارائه يك روش جديد براي تخمين مقادير گمشده در مجموعه داده
عنوان به زبان ديگر :
A New Algorithm to Predict Missing Values in Datasets
پديد آورندگان :
ضياءالديني، سليمه دانشگاه كرمان , ابارقي، مينا دانشگاه كرمان
تعداد صفحه :
8
از صفحه :
155
تا صفحه :
162
كليدواژه :
داده كاوي , داده گمشده , الگوريتم C4.5 , مجموعه داده , درخت تصميم
چكيده فارسي :
اغلب مجموعه داده هاي مربوط به داده كاوي و ماشين يادگيري داراي داده هايي با مقادير Missing Values يا داده گمشده مي باشند. چگونگي برخورد با داده گمشده و نيز ارائه راهكارهايي مبتني بر تخمين مقدار مربوط به داده گمشده، منجر به بروز يك مسئله بسيار مهم در زمينه داده كاوي و ماشين يادگيري شده است. در بين الگوريتم هاي داده كاوي، الگوريتم C4.5، به دليل كارآيي، استفاده در كاربردهاي مختلف داده كاوي و نيز توانايي در كار كردن و تخمين مقدار داده گمشده در مجموعه داده ها، به طور مكرر مورد استفاده قرار گرفته است. پژوهشگران و محققان روش ها و الگوهاي متعددي جهت برخورد با مقادير داده گمشده و تخمين مقدار آن در مجموعه داده هاي الگوريتم C4.5 ارائه داده اند كه هر يك از روش ها به نحوي موجب افزايش دقت درخت تصميم و در نتيجه توليد يك درخت تصميم موثر و كاراتر شده است. لذا در مقاله حاضر ابتدا به بررسي و مرور روش ها و راهكارهاي ارائه شده پيشين و سپس به ارائه روش پيشنهادي با عنوان روش جابجايي خصوصيت ها جهت تخمين مقادير گمشده در مجموعه داده پرداخته خواهد شد و سپس در پايان به مقايسه و ارزيابي دقت حاصل شده روش پيشنهادي با روش هاي حذف و ميانگين خواهيم پرداخت.
چكيده لاتين :
Most Datasets related to data mining and machine learning contain data with missing values. How to deal with missing values and to provide solutions based on estimating missing values lead to a very important issue in the field of machine learning and data mining. Among data mining algorithm, the C4.5 algorithm has been used repeatedly because of performance being used in various applications and also ability in working and estimating missing values in data sets. Researchers have presented various methods for deal with missing values and estimating it’s amount in a C4.5 data sets which any of their method causes an increase in accuracy of decision tree and there for produce a more effective and efficient decision. In this paper, for estimating missing values in data sets, at the first, we review the previous methods then the proposed approach as a displacement properties method and in the end the accuracy of proposed methods for deletion and average will be comparing.
سال انتشار :
1397
عنوان نشريه :
مدل سازي در مهندسي
فايل PDF :
7672042
عنوان نشريه :
مدل سازي در مهندسي
لينک به اين مدرک :
بازگشت