شماره ركورد :
1399272
عنوان مقاله :
تصحيح خودكار غلط‌هاي املايي در متون سونوگرافي فارسي با استفاده از شبكه‌هاي عصبي
پديد آورندگان :
دشتي ، محمدصادق دانشگاه آزاد اسلامي واحد كرمان - دانشكده علوم پايه , خطيبي بردسيري ، عميد دانشگاه آزاد اسلامي واحد كرمان - دانشكده علوم پايه - گروه مهندسي كامپيوتر , جعفري شهباززاده ، مهدي دانشگاه آزاد اسلامي واحد كرمان - دانشكده فني و مهندسي - گروه مهندسي برق
از صفحه :
19
تا صفحه :
31
كليدواژه :
تصحيح خطا , جاي‌گذاري عصبي , شبكه‌هاي عصبي , متون سونوگرافي , پردازش زبان فارسي
چكيده فارسي :
زمينه و هدف: گزارش‌هاي پزشكي و پرونده‌هاي الكترونيك سلامت براي تشخيص و درمان بيماران و تحقيقات پزشكي اهميت فراوان دارند. تصحيح غلط‌هاي املايي موجود در متون پزشكي براي اطمينان از تفسير صحيح اطلاعات امري ضروري است. اين پژوهش براي تصحيح خودكار متون پزشكي زبان فارسي به كمك شبكه‌هاي عصبي انجام پذيرفته است.روش بررسي: در اين پژوهش كه در سال ۱۴۰۲ انجام شد، مدل كامپيوتري جديدي مبتني بر شبكه‌هاي عصبي مصنوعي و تكنيك جاي‌گذاري دوگانه با استفاده از زبان برنامه‌نويسي پايتون  در محيط ويندوز توسعه يافت. مدل جاي‌گذاري دوگانه كلمات به طور خاص براي تصحيح املا در حوزه متون سونوگرافي فارسي تنظيم شد. مدل پيشنهادي، از تكنيك‌هاي متنوعي براي تشخيص خودكار خطا، از جمله تطابق با فرهنگ واژگان ومحاسبه ميزان مشابهت متني استفاده مي‌كند. همچنين براي انتخاب خودكار مناسب‌ترين كلمه جايگزين با غلط‌هاي املايي، از ويژگي‌هاي خاصي همچون فاصله ويرايش(Edit-Distance)، همراه با امتياز مشابهت استفاده شده است. داده‌هاي آموزش و آزمايش مدل جاري، بخشي از مجموعه متون كلينيك سونوگرافي بيمارستان امام خميني تهران است.يافته‌ها: مدل پيشنهادي بر اساس شبكه‌هاي عصبي مصنوعي توسعه يافته و از يك معماري جديد جاي‌گذاري دوگانه كلمات جهت انتخاب بهترين كلمات كانديد، به منظور جايگزيني با غلط‌هاي املايي و معنايي بهره مي‌برد. مطابق بررسي انجام شده بر روي متون سونوگرافي فارسي، دقت مدل پيشنهادي بر حسب معيار-F(F-Measure) در تشخيص و تصحيح خودكار خطاهاي معنايي به ترتيب برابر با ۹۰/۵% و ۹۰% مي‌باشد. به علاوه، دقت ۹۰/۸% در زمينه تصحيح خطاهاي شكلي كسب گرديد.نتيجه‌گيري: مطابق نتايج ارزيابي، روش پيشنهادي مي‌تواند به طور مؤثر طيف گسترده‌اي از خطاهاي شكلي و معنايي، از جمله جايگزيني، جابه‌جايي، درج و حذف را در متون پزشكي مديريت كند. استفاده و ادغام معيار فاصله ويرايش با امتياز مشابهت متني مستخرج از مدل جاي‌گذاري دوگانه به‌طور قابل‌توجهي دقت تصحيح غلط‌هاي املايي را در متون سونوگرافي فارسي افزايش داده كه اين امر متضمن صحت بيش‌تر محتواي اين گونه اسناد خواهد بود. به باور نويسندگان، مدل پيشنهادي، پيشرفت قابل‌توجهي در زمينه‌ي تشخيص و تصحيح غلط‌هاي املايي براي متون سونوگرافي زبان فارسي است.
عنوان نشريه :
پياورد سلامت
عنوان نشريه :
پياورد سلامت
لينک به اين مدرک :
بازگشت