شماره ركورد كنفرانس :
4330
عنوان مقاله :
پيكره پيامكهاي فارسي: يك منبع داده براي پردازش هوشمند پيامكهاي فارسي
پديدآورندگان :
رحمانيان محسن rahmanian@jahromu.ac.ir دانشگاه جهرم , عرفانمنش اميد O.erfanmanesh@gmail.com دانشگاه جهرم
كليدواژه :
هرزپيامك , يادگيري ماشين , پيكرهي فارسي , هوشمصنوعي
عنوان كنفرانس :
هفدهمين كنفررانس ملي سيستم هاي فازي، پانزدهمين كنفرانس ملي سيستم هاي هوشمند و ششمين كنگره ملي مشترك سيستم هاي فازي و هوشمند ايران
چكيده فارسي :
دريافت پيامكهاي ناخواسته يا هرزپيامكها توسط كاربران در حجم بالا يكي از مشكلاتي است كه در كنار همهي مزيتهاي تكنولوژي تلفن همراه، ميتواند نارضايتي كاربران را در پي داشته باشد. بيشتر اپراتورهاي تلفن همراه براي مديريت هرزپيامكها راهكارهايي را ارائه ميدهند؛ اما اغلب اين روشها به فيلترشدن همهي پيامكهاي تبليغاتي با شمارههايي مشخص محدود ميشوند. در متون علمي راههاي گوناگوني براي فيلتركردن هرزپيامكها ارائه شده است كه در اغلب موارد روشهاي مبتني بر تحليل آماري بهترين كاراييها را داشتهاند. روشهاي تحليل آماري براي فيلتركردن هرزپيامكها به مجموعهي مناسبي از دادههاي متني نيازمند ميباشد. پيكرههاي استانداردي كه در اغلب مقالات علمي مورد استفاده قرار گرفتهاند به زبان انگليسي ميباشد. در تحقيقاتي كه توسط مؤلفين انجام شد، مجموعهاي مناسب و استاندارد از پيامكهاي فارسي كه بصورت عمومي در دسترس باشد بدست نيامد. لذا در اين پروژه اولين ويرايش از پيكرهي پيامكهاي فارسي به نام PSMS ارائه شده است و كارائي آن توسط چند الگوريتم معروف پردازش پيامكها، مورد ارزيابي قرار گرفته است. نتايج آزمايشات نشان ميدهد كه ميتوان با ضريب اطمينان بالا از اين پيكره براي توسعهي روشهاي هوشمند فيلتر هرزپيامكها استفاده نمود.