شماره ركورد كنفرانس :
4398
عنوان مقاله :
عملكرد الگوريتم هاي رگرسيون در بازشناسي احساس از طريق گفتار در فضاي پيوسته احساس
پديدآورندگان :
فاتح زري zari_fateh@yahoo.com دانشگاه آزاد اسلامي، واحد الكترونيكي، گروه فني و مهندسي، تهران، ايران , خيرانديش محمد mkh_student@yahoo.com دانشگاه آزاد اسلامي، واحد الكترونيكي، گروه فني و مهندسي، تهران، ايران
كليدواژه :
بازشناسي احساس از طريق گفتار , فضاي پيوسته احساس , ويژگي هاي عروضي و طيفي , رگرسيون خطي , رگرسيون بردار پشتيبان , رگرسيون فرايند گوسي.
عنوان كنفرانس :
سومين كنگره بين المللي فن آوري، ارتباطات و دانش (ICTCK2016)
چكيده فارسي :
بازشناسي احساس از طريق گفتار، موضوعي ميان رشتهاي در حوزهي روانشناسي، بازشناسي الگو و پردازش سيگنال ميباشد كه در دههي اخير، توجه بسياري از پژوهشگران را به خود جلب نموده است. در اين مقاله، پنج گروه از ويژگي هاي مهم صوتي شامل ويژگي هاي عروضي، MFCC، PLP، LPC و فرمنت ها جهت استخراج ويژگي، الگوريتم هاي كاهش ويژگي SFS و SBS ، جهت انتخاب بردار ويژگي بهينه و الگوريتم هاي رگرسيون خطي، بردار پشتيبان و فرايند گوسي به منظور تخمين مؤلفه هاي احساسي گفتار شامل برانگيختگي، تسلط و جاذبه، در فضاي پيوسته سه بعدي با استفاده از پايگاه داده ي VAM، بكار گرفته شده است. بر اساس نتايج آزمايشها، از بين پنج گروه ويژگي استفاده شده، بهترين نتايج با استفاده از ويژگي هاي عروضي حاصل شده است. اما براي تركيب ويژگي هاي مختلف، نتيجه كاملاً بستگي به الگوريتم هاي رگرسيون و كاهش ويژگي دارد. بطوريكه بهترين نتايج مربوط به تركيب همه ي ويژگي ها و با استفاده از الگوريتم رگرسيون فرايند گوسي و كاهشي ويژگي SFS مي باشد. در اين شرايط، ضريب همبستگي براي سه مؤلفه احساسي جاذبه، برانگيختگي و تسلط بترتيب برابر 43%، 74% و 74% مي باشد.