عنوان مقاله :
كشف و رده بندي وقايع صوتي محيطي با استفاده از نگاشت سگمنت بر ديكشنري در نمايش تنك
عنوان به زبان ديگر :
Audio Event Detection Using the Mapping Segment on the Dictionary in Sparse Representation
پديد آورندگان :
درخشان، مراد دانشگاه صنعتي شاهرود - دانشكده مهندسي كامپيوتر و فناوري اطلاعات , مروي، حسين دانشگاه صنعتي شاهرود - دانشكده مهندسي كامپيوتر و فناوري اطلاعات
كليدواژه :
كشف و رده بندي وقايع صوتي , تجزيه نامنفي , توليد ديكشنري , بردارهاي پايه , تجزيه تنك , تابع انحراف بتا , نگاشت سگمنت , نمايش زمان - فركانس
چكيده فارسي :
در اينجا كشف و رده بندي وقايع صوتي محيطي با استفاده از نگاشت سگمنت بر ديكشنري در نمايش تنك مورد پژوهش قرار گرفته است. يكي از مشكلات رويكردهاي مبتني بر ديكشنري، نبود كنترل لازم در نحوه نگاشت سگمنتهاي ورودي بر بردارهاي پايه ديكشنري جهت شناسايي صداي موجود در سگمنت است. اين عدم كنترل، سبب تجزيه سگمنت به تعدادي از اصوات كوچك كه بخشهاي سگمنت هستند ميشود. در اينجا الگوريتمي جهت كنترل صريح نگاشت هر سگمنت بر بردارهاي پايه ديكشنري پيشنهاد شده است كه از طريق بهكارگيري تابع انحراف-بتا و كنترل تنكي تجزيه نامنفي دنبال ميشود و كل سگمنت را به عنوان يك واقعه صوتي شناسايي ميكند. در عمل با كنترل ميزان تنكي، هر سگمنت با مجموع چند بردار پايه تقريب زده ميشود بهطوري كه كل سگمنت يكجا شناسايي شود. اين الگوريتم در مراحل تست جهت شناسايي صداهاي محيط اداري بكار رفته و نتايج به دست آمده گوياي رشد نرخ شناسايي صداها ميباشد كه تاييدي بر مؤثر بودن روش پيشنهادي است.
چكيده لاتين :
Audio event detection (AED) is addressed by using a segment mapping on the NMF dictionary in the sparse representation. One problem with dictionary methods is the lack of controls in the decomposition process of the input signal, so the process yields some unstructured sound pieces that are not the valid audio events. We proposed an algorithm which uses sparsity constraint and beta-divergence to decompose the input segments into the predefined dictionary atoms instead. Here, the sparsity control in each segment decomposes it into a linear combination of basis vectors thereby the segment is approximated into a hypothetical audio event. This method is applied to the recognition of variety live official sound events and has promising results.
عنوان نشريه :
مهندسي برق دانشگاه تبريز
عنوان نشريه :
مهندسي برق دانشگاه تبريز