شماره ركورد كنفرانس :
3704
عنوان مقاله :
طراحي و پياده سازي يك الگوريتم ساده با توجه به ماكزيمم فركانس صوتي واژگان فارسي جهت كنترل گفتاري ربات مبتني بر اردوينو
عنوان به زبان ديگر :
Design and development of simple algorithm with respect to maximum frequency of Persian word to control the Arduino based robot
پديدآورندگان :
مشيدي اتا جهانگير moshaydi@gmail.com ازاد اسلامي واحد خميني شهر; , مراديان عقداء ابوالفضل moshaydi@gmail.com راغب اصفهاني; , عرب زاده مرتضي moshaydi@gmail.com راغب اصفهاني;
كليدواژه :
كنترل گفتار , پردازش صدا , پردازش صوت , پردازش گفتار , اردوينو , سيگنال صوتي , سيستم شنوايي
عنوان كنفرانس :
پنجمين كنفرانس بين المللي در مهندسي برق و كامپيوتر با تاكيد بر دانش بومي
چكيده فارسي :
بنا به تعريف, پردازش گفتار به فرايند تبديل سيگنالهاي صوتي بعنوان ورودي جهت سيستم هاي كنترلي توسط الگوريتمهاي كامپيوتري گفته ميشود. اهميت اين حوزه در بسياري از كاربردها نظير هوا فضا, ترجمه خودكار,تهيه متون خبري از سخنراني ها ,اتوماسيون هوشمند منازل ,بازي هاي كامپيوتري , خدمت رساني به نابينايان و افراد كم توان , گردآوري و سازماندهي منابع مختلف اطلاعاتي مانند كتاب ها و سايت هاي اينترنتي و همچنين تسهيل و تسريع در خدمات آموزشي مي باشد . اين تحقيق با هدف معرفي و ازمايش يك الگوريتم ساده جهت واژگان فارسي و پياده سازي بر روي يك ساختار ربات مبتني بر اردوينو صورت گرفته است .نكته حايز اهميت در تحقيق حاضر استفاده از سيگنالهاي صوتي به زبان فارسي مي باشد كه داراي پيشينه كمتر از دو دهه است. گرچه تلاشهايي مانند نويسا و نرم افزارهاي تبديل گفتار به متن صورت گرفته اما بر اساس جستجوي محققين محصول قابل كنترلي بر مبناي واژگان فارسي يافت نشد .از اهدافي كه در اين مقاله به آن پرداخته ميشود ايجاد واكنش هايي متناسب با بالاترين فركانس صوتي بر اساس سه واژه فارسي راست چپ و مستقيم مي باشد. دراين مقاله صدا توسط ميكروفون دريافت مي شود و توسط نرم افزار متلب با بدست آوردن ماكزيمم فركانس سيگنال دريافتي پردازش مي شود و سپس بالاترين فركانس صداي دريافتي را مشخص نموده و به برد آردوينو موجود بر روي ربات از طريق ارتباط سريال منتقل ميشودكه منجر به واكنش حركتي بر اساس تعريف اين عدد توسط ربات مي گردد. نحوه نمونه برداري كاملا آزاد از نظر نوع ميكروفن و فاصله تا آن بوده است و نتايج اين تحقيق در بررسي سه واژه چپ راست و مستقيم نشانگر كارايي الگوريتم پيشنهادي با ميزان موفقيت 73 % و 27% نا موفق در تكرار اول ودر تكرار دوم 86 % موفق و 14% نا موفق مي باشد.
چكيده لاتين :
Based on the definition, speech process is known as the audio signals Conversion process as an input for checking systems by computer algorithms. The importance of this field is for many applications such as aerospace. Automatic translation, providing news texts from lectures, home intelligent automation, Computer games. Serving the blinds and low – power people, collecting and organizing different information resources like books, websites and also facilitate and expedite in educational services. This study has done with the purpose of introducing and testing a simple algorithm for Persian vocabulary and implementation of a robot structure based on the Arduino. The important point of this study is using audio signals in Persian language which has a history less than two decades. Although some attempts such as Nevisa and speech to text conversion software has been made, but based on researcher’s investigation, there was not found a controllable product based on Persian vocabulary. Creating relevant response with the highest audio frequency based on three Persian terms, “right”, “left” and “straight” is the purpose which has considered in this article. In this article, Sound is received by the microphone and through Matlab software by getting and processing maximum received signal frequency, the higher frequency of receiving sound will be determined and transferred to the Arduino board existence on robot through serial communication which leads to a movement reaction based on the definition of this number by a robot. The way of sampling is totally free considering the kind of microphone and distance, and results of this study in the review of three words, “left”, “right” and “straight” is an indicator of the efficiency of the suggested algorithm with the success rate of 73% and 24% failure at the first repetition and with the success rate of 86% and 14% failure at the second repetition.