شماره ركورد كنفرانس :
1295
عنوان مقاله :
شناسايي جملات هم ترجمه با استفاده از طبق هبند آنتروپي بيشينه
پديدآورندگان :
زاري عليمه نويسنده , صدرالديني محمدهادي نويسنده
كليدواژه :
پيكره موازي , طبقه بند آنتروپي بيشينه , همترازي در سطح كلمه
عنوان كنفرانس :
دوازدهمين كنفرانس سيستم هاي هوشمند ايران
چكيده فارسي :
منبع اصلي رويكردهاي رايج امروزي در ترجمه ماشيني، متون دوزبانه در اندازه هاي بسيار بزرگ است كه اصطلاحا پيكره موازي
خوانده مي شوند. اما اكثر زبان هاي طبيعي با كمبود پيكره هاي موازي روبه رو هستند. بنابراين تلاش براي ساخت پيكره ها ي موازي
بيش تر همچنان يك ضرورت مهم در حوزه ترجمه ماشيني محسوب مي شود. شناسايي جملات ه م ترجمه كه جملات موازي نيز
خوانده مي شوند، ركن مشترك در اكثر تلاش ها براي ساخت خودكار پيكره هاي موازي است. ما در اينجا از طبقه بند آنتروپي بيشينه
جهت شناسايي جملات هم ترجمه استفاده مي كنيم. همچنين براي اين طبقه بند از ويژگي هاي عمومي جمله و ويژگي ها ي مبتن ي بر
انجام Giza++ همترازي در سطح كلمه بين دو جمله استفاده مي كنيم. همترازي در سطح كلمه جملات با استفاده از ابزار متن باز
مي شود. اين ويژگي ها به تفكيك شرح داده مي شوند و تأثيري كه بر نتيجه طبقه بند مي گذارند، بررسي مي شود. نتايج ارزيابي نشان
مي دهد كه طبقه بند آنتروپي بيشينه طراحي شده مي تواند با دقت بالايي جملات را به جملات موازي و جملات غير موازي طبقه بند ي
كند.
شماره مدرك كنفرانس :
2807375