شماره ركورد كنفرانس :
3926
عنوان مقاله :
تصحيح خودكار دادهها مبتني بر روشي تركيبي
پديدآورندگان :
عطاييان مهدي m.ataeyan@srttu.edu دانشجو كارشناسي ارشد، دانشكده مهندسي كامپيوتر، دانشگاه تربيت دبير شهيد رجايي , دانشپور نگين ndaneshpour@srttu.edu استاديار، دانشكده مهندسي كامپيوتر، دانشگاه تربيت دبير شهيد رجايي
كليدواژه :
تشخيص خطا , تصحيح خودكار , طبقه بند بيز , - k نزديكترين همسايه.
عنوان كنفرانس :
بيست و چهارمين كنفرانس مهندسي برق ايران
چكيده فارسي :
صحت دادهها به عنوان يكي از مهمترين ابعاد كيفيت دادهها بهشمار ميآيد. تصحيح دادهها از دو فرايند تشخيص خطا و تصحيح - خطاي شناساييشده، تشكيلشدهاست. راهكارهاي متعددي براي تصحيح ارائهشده، كه برخي از اين راهكارها خودكار و برخي ديگر متعامل هستند. راهكارهاي تصحيح متعامل با كاربر، با توجه به حجم بالاي منابع دادهاي، روشهاي مناسبي نميباشد و لذا براي تصحيح دادهها نياز به يك راهكار خودكار وجوددارد. در اين مقاله راهكاري خودكار براي تصحيح خطا مبتني بر يك روش تركيبي از طبقهبندي بيز و k نزديكترين همسايگي ارائهشدهاست. در اين روش فرضشده، كه ركوردهاي حاوي خطا تشخيصدادهشدهاند، اما اينكه خطا در كدام فيلد رخدادهاست، مشخص نميباشد. لذا روش پيشنهادي از دو فرايند تشخيص فيلد خطادار و تصحيح آن تشكيلشدهاست. اين روش توانايي تشخيص خطا را در انواع دادهاي مختلف دارا ميباشد.آزمايشات نشانميدهد كه به طور متوسط اين روش ميتواند 68 % خطاهاي موجود در دادهها را شناسايي و تصحيح نمايد. همچنين روش پيشنهادي با يك روش تصحيح خطا مبتني بر وابستگي تابعي، كه همانند راهكار پيشنهادي روشي خودكار براي تشخيص خطاست مورد مقايسه قرارگرفتهاست. نتايج نشانميدهد كه روشپيشنهادي به طور متوسط 01 % عملكرد بهتري در تصحيح خطا داشتهاست.