شماره ركورد كنفرانس :
5141
عنوان مقاله :
حفظ حريم خصوصي در سيستم بازشناسي ارقام مجزاي فارسي مبتني بر رويكرد يادگيري مشاركتي
پديدآورندگان :
فراهاني بهار b_farahani@sbu.ac.ir پژوهشكده فضاي مجازي، دانشگاه شهيد بهشتي، تهران , طبيبيان شيما sh_tabibian@sbu.ac.ir پژوهشكده فضاي مجازي، دانشگاه شهيد بهشتي، تهران , ابراهيمي حميد hami.ebrahimi@mail.sbu.ac.ir پژوهشكده فضاي مجازي، دانشگاه شهيد بهشتي، تهران
كليدواژه :
حريم خصوصي , پردازش گفتار , يادگيري ماشين , يادگيري مشاركتي , بازشناسي ارقام مجزاي فارسي
عنوان كنفرانس :
هفتمين كنفرانس پردازش سيگنال و سيستمهاي هوشمند ايران
چكيده فارسي :
يادگيري ماشين يكي از مرسومترين روشهاي هوش مصنوعي در علوم داده است و در زمينههاي مختلفي همچون بازشناسي گفتار، واژهيابي گفتار و طبقهبندي تصاوير مورداستفاده قرار ميگيرد. مهمترين چالش يادگيري ماشين در سالهاي اخير باتوجه به سياستها و قوانين به وجود آمده، حفظ حريم خصوصي دادهها است. يكي از پركاربردترين و با اهميتترين انواع دادهها در تعاملات ميان انسانها، انسان و ماشين و ماشين با ماشين، دادگان گفتاري هستند كه در اغلب موارد حفظ حريم خصوصي در آنها اهميت زيادي دارد. در اين مقاله، از روش يادگيري مشاركتي بهعنوان يكي از پركاربردترين روشهاي حفظ حريم خصوصي دادگان در يادگيري ماشين، در يك سيستم بازشناسي ارقام مجزاي فارسي استفاده شده است. سيستم مذكور ميتواند در گوشيهاي تلفن همراه به عنوان شمارهگير تلفني فارسي، خدمات تلفنبانك و ساير كاربردهايي كه حفظ حريم خصوصي در آنها اهميت زيادي دارد، استفاده شود. سيستم بازشناس ارقام مجزاي مذكور در دو حالت ا ستفاده از يادگيري مشاركتي و سنتي بر روي دادگان ارقام مجزاي فار سي CPHPD پياده سازي شده ا ست. نتايج ارزيابي حاكي از آن ا ست كه روش يادگيري مشاركتي در عين حفظ حريم خصوصي دادهها، توانسته است با دقت 59 / 99 % دادگان گفتاري را تشخيص دهد. اين ميزان دقت بسيار نزديك به حالتي است كه از سيستم بازشناسي گفتار سنتي استفاده شده و حريم خصوصي دادهها نقض شده است. همچنين، نتايج ارزيابي حاكي از آن است كه بازشناسي گفتار ارقام مجزاي فارسي مبتي بر شبكههاي عصبي پيچشي در حالت يادگيري مشاركتي، نسبت به ساير رويكردهاي سيستم بازشناسي گفتار ارقام مجزاي فارسي در حالت سنتي، بهصورت چشمگيري ) 7% نسبت به متوسط عملكرد رويكردهاي سيستم بازشناسي ارقام مجزا در حالت سنتي( بهتر عمل كرده است.