شماره ركورد كنفرانس :
3752
عنوان مقاله :
يك مدل بازنمايي برداري واژگان براي ترجمهي ماشيني انگليسي به فارسي با استفاده از يادگيري ژرف
پديدآورندگان :
افسر ليلا afsar931@atu.ac.ir دانشجو، علوم رياضي و رايانه، دانشگاه علامه طباطبايي، تهران , كتانفروش سيد علي a_katanforosh@sbu.ac.ir استاديار، گروه علوم كامپيوتر، دانشگاه شهيد بهشتي، تهران , اصغري اسكوئي محمدرضا oskoei@atu.ac.ir استاديار، علوم رياضي و رايانه، دانشگاه علامه طباطبايي، تهران
كليدواژه :
بازنمايي برداري واژگان , Word2Vec , ترجمهي ماشيني عصبي , يادگيري عميق , پردازش زبان طبيعي
عنوان كنفرانس :
اولين كنفرانس بين المللي مهندسي و علوم كامپيوتر
چكيده فارسي :
يادگيري عميق رويكرد جديدي در زمينهي يادگيري ماشين است. يادگيري عميق ديدگاه نويني براي ترجمهي ماشيني فراهم كرده است. اين ديدگاه به ترجمهي ماشيني عصبي معروف است. آموزش يكپارچهي اين سيستمها براي ترجمهي ماشيني انگليسي به فارسي، نياز به پيكرهي متني موازي بزرگ دارد. متاسفانه در زبان فارسي چنين پيكرهي متني بزرگي در دسترس نيست. بهعنوان يك راهحل جايگزين، دادهي متني بزرگ فارسي، براي بازنمايي برداري واژگان جمعآوري شد. براي بازنمايي برداري واژگان از روش Word2Vec استفاده شد. دو پارامترِ بُعد فضاي برداري و حجم مجموعه دادگان در بازنمايي برداري واژگان در روش Word2Vec تاثير داشتند. مجموعه تستي براي ارزيابي بازنمايي برداري واژگان با استفاده از معيار شباهت كسينوسي ارائه شد. بردارهاي بهدستآمده از روش Word2Vec روي مجموعه تست تعريفشده براي زبان فارسي، ازلحاظ شباهت معنايي و نحوي واژگان عملكرد قابلتوجهي به نمايش گذاشت.