عنوان مقاله :
ارائه روشي براي حل مشكل دادههاي گم شده، پرت و نويزي بهمنظور بهبود عملكرد تعامل انسان و اطلاعات
پديد آورندگان :
مازوچي ، مجتبي پژوهشگاه ارتباطات و فناوري اطلاعات , ربيعي ، ليلا پژوهشگاه ارتباطات و فناوري اطلاعات , مرادي ، محمد پژوهشگاه ارتباطات و فناوري اطلاعات
كليدواژه :
دادههاي نويزي , دادههاي پرت , دادههاي گم شده , هموارسازي , روش پيالهاي , مدل رگرسيون
چكيده فارسي :
زمينه و هدف: خطا در جمعآوري دادهها و عدم توجه به دادههايي كه در پروسه جمعآوري به هر دليل دچار نويز شدهاند باعث ايجاد اشكال در تحليلهاي مبتني بر داده و بهتبع آن، تصميمسازيهاي اشتباه ميگردد؛ لذا رفع مشكل دادههاي گم شده و يا نويزي، قبل از انجام مراحل پردازش و تحليل داراي اهميت حياتي در سامانههاي تحليلي است. هدف اين مقاله، ارائه روشي بهمنظور شناسايي دادههاي نويزي، پرت و دادههاي گم شده و ارائه راهكاري مناسب براي هموارسازي اين دادهها است. روش پژوهش: اين پژوهش بر مبناي هدف، از نوع كاربردي است. بهمنظور تحليل دادهها از تكنيكهاي دادهكاوي شامل هموارسازي پيالهاي و مدل رگرسيون بهمنظور شناسايي و جاگذاري دادههاي پرت و نويزي استفاده شده است. نتايج: نتايج آزمايشهاي انجام شده در محيط واقعي مربوط به دادههاي شبكههاي اجتماعي، نشاندهنده عملكرد مناسب روش پيشنهادي است. همچنين نشاندادهشده است كه روش پيشنهادي داراي دقت بالاتري در مقايسه با روشهاي هموارسازي پيالهاي، ميانگين و رگرسيون خطي است. بهطوريكه براي دادههاي مربوط به بخش توئيت، ميانگين مربعات خطاي بهدستآمده براي روش پيشنهادي برابر ۰٫۰۴، روش هموارسازي پيالهاي برابر ۰٫۳۸، روش رگرسيون خطي برابر ۰٫۰۵ و روش جايگزيني با ميانگين برابر ۰٫۰۶ بوده است. نتيجهگيري: روش ارائه شده در اين مقاله، ميتواند در ابتدا از طريق يكسوم و دوسوم نرمال، دادههاي پرت را شناسايي كند و سپس با مدل رگرسيون خطي به جايگزيني دادههاي پرت بپردازد كه در نتيجه سبب بهبود عملكرد استفاده و پردازش اطلاعات و بهبود تعامل انسان و اطلاعات خواهد شد.
عنوان نشريه :
تعامل انسان و اطلاعات
عنوان نشريه :
تعامل انسان و اطلاعات