مرکز منطقه ای اطلاع رساني علوم و فناوري - شناسايي جملات حاوي كلمات توهين‌آميز با استفاده از الگوريتم‌هاي يادگيري ماشين در سرويس‌هاي ابري آمازون

شماره ركورد كنفرانس :

5520

عنوان مقاله :

شناسايي جملات حاوي كلمات توهين‌آميز با استفاده از الگوريتم‌هاي يادگيري ماشين در سرويس‌هاي ابري آمازون

پديدآورندگان :

خانه‌عنقا اميرعلي amiralikhanehanqa@ut.ac.ir كارشناسي مهندسي كامپيوتر، دانشگاه تهران , موحدي زهرا zmovahedi@ut.ac.ir استاديار ، گروه مهندسي كامپيوتر، دانشكده مهندسي دانشكدگان فارابي دانشگاه تهران

تعداد صفحه :

كليدواژه :

شناسايي كلمات ناهنجار , يادگيري ماشين , پردازش زبان طبيعي , سرويس‌هاي ابري آمازون

سال انتشار :

1401

عنوان كنفرانس :

نخستين كنفرانس ملي فضاي سايبر

زبان مدرك :

فارسي

چكيده فارسي :

با گسترش فضاي مجازي، نظارت بر اين فضا در جهت حفظ ارزش‌هاي جامعه امري ضروري است. مسئله‌ي استفاده از جملات توهين‌آميز، زورگويي‌هاي اينترنتي و استفاده از كلمات مخالف با هنجار‌هاي فرهنگي مي‌بايست مورد بررسي و نظارت قرار گرفته و از بروز و نشر آن جلوگيري شود. در اين مقاله، راهكاري مبتني بر پردازش زبان طبيعي ارائه مي‌شود تا بتوانيم در زبان فارسي جملات حاوي كلمات توهين‌‌آميز را به كمك يادگيري ماشين پردازش كنيم. روش انجام كار به كمك سرويس‌هاي مختلف ابري آمازون اجرا شده است. نتايج نشان مي‌دهد كه در مقايسه با روش‌هاي سنتي، سرويس‌هاي آمازون موجب تسريع عمليات يادگيري ماشين مي‌شوند و توانايي ارائه درصد بالايي از دقت و همچنين پيش‌پردازش و پردازش سريع داده‌ها و استقرار ماشين را دارا مي باشند.

كشور :

ايران

لينک به اين مدرک :

https://search.isc.ac/dl/search/defaultta.aspx?DTC=36&DC=365987