شماره ركورد كنفرانس :
4162
عنوان مقاله :
طبقه بندي حروف صدادار زبان فارسي با استفاده از ماشين بردار پشتيبان
پديدآورندگان :
فتح الهي زهرا zahra.fatholahi@gmail.com دانشجوي كارشناسي ارشد مهندسي نرمافزار، دانشگاه آزاد اسلامي واحد خرم آباد ؛ () , جودكي صبا s.joodaki@yahoo.com استاديار گروه مهندسي كامپيوتر، دانشگاه آزاد اسلامي واحد خرم آباد ؛
()
كليدواژه :
لب خواني , واج هاي مصوت , تبديل موجك , طبقهبند SVM , دقت تشخيص
عنوان كنفرانس :
اولين همايش ملي كامپيوتر، فناوري اطلاعات و كاربردهاي هوش مصنوعي
چكيده فارسي :
بازشناسي تصويري گفتار براي كمك به افرادي كه دچار آسيب در سيستم صوتي شده اند، در سالهاي اخير مورد توجه محققين قرار گرفته است. در اين مقاله روشي براي تشخيص واج هاي مصوت()ـَــِــُ) و /آ/، /اي/، / او/) زبان فارسي توسط پردازش تصوير ارائه مي شود. روش پيشنهادي بدين صورت است كه پس از استخراج ناحيه لب از تصاوير چهره توسط يك روش ابتكاري (استفاده از شدت روشنايي و تقارن هاي طبيعي موجود در آن)، براي استخراج ويژگيهاي لب از تابع موجك دو بعدي گسسته(DWT) و سپس محاسبه هيستوگرام ضرايب موجك بدست آمده، استفاده شده است و در نهايت توسط طبقه بند SVM به تشخيص واج هاي مصوت پرداخته مي شود. نتايج بدست آمده نشان ميدهد كه روش استخراج ويژگي و طبقهبند پيشنهادي مي تواند تاثير چشمگيري در بهبود عملكرد سيستم تشخيص داشته باشد، به طوري كه با انتخاب كرنل گوسين براي طبقه بند SVM و انتخاب تعداد ستون هاي هيستوگرام 60 تايي و انتخاب تابع موجك از نوع باي ارتگنال با جزييات قطري در مرحله استخراج ويژگي، دقت تشخيص آن به 10/ 84 رسيد اين در حالي است كه نتيجه آزمايش ساير طبقهبندها بر روي ديتاست انتخابي، براي طبقه بند نزديكترين همسايه(KNN) برابر 18/ 72، براي شبكه عصبي (ANN) برابر 24/ 62 و براي طبقهبند درخت تصميم (DT) برابر 12/ 60 ميباشد.