شماره ركورد كنفرانس :
3928
عنوان مقاله :
استخراج ويژگي ها از سيگنال گفتار فارسي جهت شناسايي احساس
پديدآورندگان :
پروين نيا الهام parvinnia@iaushiraz.ac.ir گروه مهندسي كامپيوتر، واحد شيراز، دانشگاه آزاد اسلامي، شيراز، ايران، عضو هيات علمي دانشگاه آزاد اسلامي، , پوروحيد مژده mpoorvahid@yahoo.com گروه مهندسي كامپيوتر، واحد شيراز، دانشگاه آزاد اسلامي، شيراز، ايران، دانشجوي دكتري ،
كليدواژه :
بازشناسي احساس , پردازش گفتار , تشخيص خوشحالي و عصبانيت , ضرايب LPC , شبكه عصبي.
عنوان كنفرانس :
نخستين همايش ملي توسعه پژوهش در كامپيوتر و فناوري اطلاعات
چكيده فارسي :
برقراري ارتباط كلامي بين انسان و ماشين و همچنين درك احساسات انساني از سوي ماشين و ارائهي واكنش مناسب به آن نيازمند درك صحبت و احساسات گوينده است كه در اين راستا تحقيق در زمينهي تشخيص احساس در سيگنال گفتار ضرورت مييابد. در اين مقاله، تلاش براي طراحي و پياده سازي سيستمي جهت تعيين و تشخيص احساس عصبانيت و خوشحالي در سيگنال گفتارفارسي گزارش داده شده است. تحقيقاتي در زمينه بازشناسي بعضي احساسات در اكثر زبان ها انجام شده اما به دليل مشكل بودن ايجاد پايگاه دادهي گفتاري، باعث شده تاكنون تحقيقات كمي براي بازشناسايي احساس درگفتار فارسي انجام شود. در اين مقاله با توجه به عدم وجود پايگاه داده مناسب به زبان فارسي براي تشخيص احساسات، در ابتدا، يك پايگاه داده براي حالات خوشحالي و عصبانيت و خنثي(بدون هرگونه احساسي) به زبان فارسي، شامل 720 جمله ايجاد گرديد. سپس خصوصيات فركانسي سيگنال هاي گفتاري بدست آمده از تبديل فوريه مانند ماكزيمم، مينيمم، ميانه و ميانگين و همچنين ضرايب LPC استخراج شد. سپس، شبكهي عصبي MLP براي تشخيص احساس خوشحالي و عصبانيت به كارگرفته شد كه دقت متوسط 74 /87% به دست آمد.