عنوان مقاله :
نوا: دادگان موسيقي سنتي ايراني براي تشخيص دستگاه و سازهاي اصيل ايراني
عنوان به زبان ديگر :
Nava: A Persian Traditional Music Database for the Dastgah and Instrument Recognition Tasks
پديد آورندگان :
باباعلي، باقر دانشگاه تهران - دانشكده رياضي، آمار و علوم كامپيوتر - پرديس علوم , گرگان محمدي، آشنا دانشگاه تهران - دانشكده رياضي، آمار و علوم كامپيوتر - پرديس علوم , فرجي ديزجي، اسماء دانشگاه تهران - دانشكده رياضي، آمار و علوم كامپيوتر - پرديس علوم
كليدواژه :
دادگان نوا , موسيقي سنتي ايراني , تشخيص دستگاه موسيقي , تشخيص ساز موسيقي , بردار هويت , ماشين بردار پشتينان
چكيده فارسي :
در دنيا پژوهشهاي بسياري در حوزه پردازش سيگنال موسيقي به منظور بازيابي محتواي موسيقي بر مبناي محتوا انجام شده است. متأسفانه پژوهشهاي انجام شده در زمينه پردازش رايانهاي موسيقي سنتي ايراني بسيار اندك است كه يكي از دلايل اصلي آن را ميتوان نبود دادگان برشمرد. در اين پژوهش، يك دادگان براي دو مسئله اساسي حوزه موسيقي سنتي ايراني، يعني تشخيص دستگاه و تشخيص ساز معرفي شده است كه از جامعيت و تنوع لازم برخوردار است و به نام "دادگان نوا" نامگذاري شده است. اين دادگان شامل صداي پنج ساز متداول سنتي ايراني در هفت دستگاه است كه توسط چهل هنرمند نواخته شده است. در ادامه براي پرداختن به دو مسئله تشخيص ساز و دستگاه، سامانهاي پيشنهاد داده شده است كه در بخش استخراج ويژگي آن از سيگنال موسيقي ورودي، ضرايب كپسترال بر مبناي مقياس مل استخراج ميشود و دنباله بردارهاي ويژگي حاصل، به كمك روش بردار هويت به يك بردار با طول ثابت تبديل ميشود. در بخش دستهبندي، بردار هويت حاصل از موسيقي ورودي به يك ماشين بردار پشتيبان داده ميشود. بهترين صحت حاصل از تشخيص ساز و دستگاه بر روي دادگان نوا به ترتيب حدود 98 و 34 درصد است كه گوياي ميزان دشواري مسأله تشخيص دستگاه در مقايسه با تشخيص ساز است.
چكيده لاتين :
Extensive research has been conducted in the field of music signal processing which targeted context-based music information retrieval. Unfortunately, research on the computer-based processing of the traditional Persian music is rare, which is due to lack of standard databases. In this paper, a database, named Nava, is introduced for two basic tasks of the traditional Persian music field, Dastgah classification and instrument recognition. In terms of instrument, Dastgah and artist, Nava has enough comprehensiveness and variety. It contains the sound of five common traditional instruments played by 40 artists in seven Dastgahs. In order to address the two mentioned basic tasks, a system is proposed which extracts a sequence of Mel frequency cepstral coefficients (MFCC) feature vectors from input music signal and then converts it to a fixed-length feature vector using i-vector technique. In the classification stage, the extracted i-vector is fed into a support vector machine classifier. The best obtained accuracy on the Nava database for the Dastgah classification and instrument recognition are about 34% and 98% respectively, which indicates the difficulty of the former in comparison with the latter.
عنوان نشريه :
پردازش سيگنال پيشرفته