شماره ركورد كنفرانس :
5520
عنوان مقاله :
شناسايي جملات حاوي كلمات توهينآميز با استفاده از الگوريتمهاي يادگيري ماشين در سرويسهاي ابري آمازون
پديدآورندگان :
خانهعنقا اميرعلي amiralikhanehanqa@ut.ac.ir كارشناسي مهندسي كامپيوتر، دانشگاه تهران , موحدي زهرا zmovahedi@ut.ac.ir استاديار ، گروه مهندسي كامپيوتر، دانشكده مهندسي دانشكدگان فارابي دانشگاه تهران
كليدواژه :
شناسايي كلمات ناهنجار , يادگيري ماشين , پردازش زبان طبيعي , سرويسهاي ابري آمازون
عنوان كنفرانس :
نخستين كنفرانس ملي فضاي سايبر
چكيده فارسي :
با گسترش فضاي مجازي، نظارت بر اين فضا در جهت حفظ ارزشهاي جامعه امري ضروري است. مسئلهي استفاده از جملات توهينآميز، زورگوييهاي اينترنتي و استفاده از كلمات مخالف با هنجارهاي فرهنگي ميبايست مورد بررسي و نظارت قرار گرفته و از بروز و نشر آن جلوگيري شود. در اين مقاله، راهكاري مبتني بر پردازش زبان طبيعي ارائه ميشود تا بتوانيم در زبان فارسي جملات حاوي كلمات توهينآميز را به كمك يادگيري ماشين پردازش كنيم. روش انجام كار به كمك سرويسهاي مختلف ابري آمازون اجرا شده است. نتايج نشان ميدهد كه در مقايسه با روشهاي سنتي، سرويسهاي آمازون موجب تسريع عمليات يادگيري ماشين ميشوند و توانايي ارائه درصد بالايي از دقت و همچنين پيشپردازش و پردازش سريع دادهها و استقرار ماشين را دارا مي باشند.