شماره ركورد كنفرانس :
3974
عنوان مقاله :
ارائه يك روش جديد انتخاب ويژگي در مسئله تاييد هويت نويسنده
پديدآورندگان :
آريا سارا Sara.aria@gmail.com دانشجوي كارشناسي ارشد مهندسي نرم افزار، موسسه غيرانتفاعي آپادانا، شيراز , شمسي نژاد بابكي پيروز P.shamsinejad@sutech.ac.ir استاديار دانشكده مهندسي كامپيوتر و فناوري اطلاعات، دانشگاه صنعتي شيراز , جعفري علي ali.jafari.mailbox@gmail.com كارشناس ارشد مهندسي نرم افزار
تعداد صفحه :
6
كليدواژه :
انتخاب ويژگي , تاييد هويت نويسنده , تكنيكStylometry.
سال انتشار :
1396
عنوان كنفرانس :
ششمين كنفرانس ملي ايده هاي نو در مهندسي برق
زبان مدرك :
فارسي
چكيده فارسي :
تاييد هويت نويسنده به بررسي نويسنده يك متن خاص، با داشتن نمونه هاي نوشتاري از آن نويسنده مي پردازد؛ كه اين كار مي تواند از طريق تكنيكهاي stylometry انجام پذيرد. بيشتر مطالعات انجام شده با استفاده از stylometry يا بر روي مجموعه كوچكي از نويسندگان تمركز دارند و يا اينكه بر روي متنهاي طولاني اعمال مي شوند در حالي كه در شرايطي كه stylometry استفاده مي شود (مثل جرم يابي متن ديجيتال)، متنها كوتاه با ساختار ضعيف هستند. از اين رو در اين مقاله مسئله تاييد هويت نويسنده در مجموعه بزرگي از نويسندگان شامل 101 نفر و بر روي پيامهاي كوتاه آنلاين بررسي شده است. بدين منظور ويژگيهاي سبكي شامل ويژگيهاي واژگاني و نحوي از متن نويسنده هدف، استخراج شده و سپس براي كاهش تعداد زياد ويژگيها و انتخاب موثرترين ويژگيها، روش هاي مختلف انتخاب ويژگي مورد بررسي قرار گرفت و از ماشين بردار پشتيبان (SVM) نيز براي طبقه بندي استفاده شد. ارزيابي روش پيشنهادي بر روي مجموعه ايميلهاي انرون، نشان مي دهد كه با استفاده از روش انتخاب ويژگي correlation در پيامهاي كوتاه آنلاين (500 كاراكتري) مي توان براي افراد مختلف به طور ميانگين ميزان دقت 1/97%، و ميزان معيار Recall وF-measure ، 95/96% را به دست آورد.
كشور :
ايران
لينک به اين مدرک :
بازگشت