شماره ركورد :
1318029
عنوان مقاله :
ارائه روشي براي حل مشكل داده‌هاي گم شده، پرت و نويزي به‌منظور بهبود عملكرد تعامل انسان و اطلاعات
پديد آورندگان :
مازوچي ، مجتبي پژوهشگاه ارتباطات و فناوري اطلاعات , ربيعي ، ليلا پژوهشگاه ارتباطات و فناوري اطلاعات , مرادي ، محمد پژوهشگاه ارتباطات و فناوري اطلاعات
از صفحه :
13
تا صفحه :
25
كليدواژه :
داده‌هاي نويزي , داده‌هاي پرت , داده‌هاي گم شده , هموارسازي , روش پياله‌اي , مدل رگرسيون
چكيده فارسي :
زمينه و هدف: خطا در جمع‌آوري داده‌ها و عدم توجه به داده‌هايي كه در پروسه جمع‌آوري به هر دليل دچار نويز شده‌اند باعث ايجاد اشكال در تحليل‌هاي مبتني بر داده و به‌تبع آن، تصميم‌سازي‌هاي اشتباه مي‌گردد؛ لذا رفع مشكل داده‌هاي گم شده و يا نويزي، قبل از انجام مراحل پردازش و تحليل داراي اهميت حياتي در سامانه‌هاي تحليلي است. هدف اين مقاله، ارائه روشي به‌منظور شناسايي داده‌هاي نويزي، پرت و داده‌هاي گم شده و ارائه راهكاري مناسب براي هموارسازي اين داده‌ها است. روش پژوهش: اين پژوهش بر مبناي هدف، از نوع كاربردي است. به‌منظور تحليل داده‌ها از تكنيك‌هاي داده‌كاوي شامل هموارسازي پياله‌اي و مدل رگرسيون به‌منظور شناسايي و جاگذاري داده‌هاي پرت و نويزي استفاده شده است. نتايج: نتايج آزمايش‌هاي انجام شده در محيط واقعي مربوط به داده‌هاي شبكه‌هاي اجتماعي، نشان‌دهنده عملكرد مناسب روش پيشنهادي است. همچنين نشان‌داده‌شده است كه روش پيشنهادي داراي دقت بالاتري در مقايسه با روش‌هاي هموارسازي پياله‌اي، ميانگين و رگرسيون خطي است. به‌طوري‌كه براي داده‌هاي مربوط به بخش توئيت، ميانگين مربعات خطاي به‌دست‌آمده براي روش پيشنهادي برابر ۰٫۰۴، روش هموارسازي پياله‌اي برابر ۰٫۳۸، روش رگرسيون خطي برابر ۰٫۰۵ و روش جايگزيني با ميانگين برابر ۰٫۰۶ بوده است. نتيجه‌گيري: روش ارائه شده در اين مقاله، مي‌تواند در ابتدا از طريق يك‌سوم و دوسوم نرمال، داده‌هاي پرت را شناسايي كند و سپس با مدل رگرسيون خطي به جايگزيني داده‌هاي پرت بپردازد كه در نتيجه سبب بهبود عملكرد استفاده و پردازش اطلاعات و بهبود تعامل انسان و اطلاعات خواهد شد.
عنوان نشريه :
تعامل انسان و اطلاعات
عنوان نشريه :
تعامل انسان و اطلاعات
لينک به اين مدرک :
بازگشت