شماره ركورد كنفرانس :
3752
عنوان مقاله :
يك مدل بازنمايي برداري واژگان براي ترجمه‌ي ماشيني انگليسي به فارسي با استفاده از يادگيري ژرف
پديدآورندگان :
افسر ليلا afsar931@atu.ac.ir دانشجو، علوم رياضي و رايانه، دانشگاه علامه طباطبايي، تهران , كتان‌فروش سيد علي a_katanforosh@sbu.ac.ir استاديار، گروه علوم كامپيوتر، دانشگاه شهيد بهشتي، تهران , اصغري اسكوئي محمدرضا oskoei@atu.ac.ir استاديار، علوم رياضي و رايانه، دانشگاه علامه طباطبايي، تهران
تعداد صفحه :
6
كليدواژه :
بازنمايي برداري واژگان , Word2Vec , ترجمه‌ي ماشيني عصبي , يادگيري عميق , پردازش زبان طبيعي
سال انتشار :
1395
عنوان كنفرانس :
اولين كنفرانس بين المللي مهندسي و علوم كامپيوتر
زبان مدرك :
فارسي
چكيده فارسي :
يادگيري عميق رويكرد جديدي در زمينه‌ي يادگيري ماشين است. يادگيري عميق ديدگاه نويني براي ترجمه‌ي ماشيني فراهم كرده است. اين ديدگاه به ترجمه‌ي ماشيني عصبي معروف است. آموزش يكپارچه‌ي اين سيستم‌ها براي ترجمه‌ي ماشيني انگليسي به فارسي، نياز به پيكره‌ي متني موازي بزرگ دارد. متاسفانه در زبان فارسي چنين پيكره‌ي متني بزرگي در دسترس نيست. به‌عنوان يك راه‌حل جايگزين، داده‌ي متني بزرگ فارسي، براي بازنمايي برداري واژگان جمع‌آوري شد. براي بازنمايي برداري واژگان از روش Word2Vec استفاده شد. دو پارامترِ بُعد فضاي برداري و حجم مجموعه دادگان در بازنمايي برداري واژگان در روش Word2Vec تاثير داشتند. مجموعه تستي براي ارزيابي بازنمايي برداري واژگان با استفاده از معيار شباهت كسينوسي ارائه شد. بردارهاي به‌دست‌آمده از روش Word2Vec روي مجموعه تست تعريف‌شده براي زبان فارسي، ازلحاظ شباهت معنايي و نحوي واژگان عملكرد قابل‌توجهي به نمايش گذاشت.
كشور :
ايران
لينک به اين مدرک :
بازگشت