عنوان مقاله :
تصحيح خودكار غلطهاي املايي در متون سونوگرافي فارسي با استفاده از شبكههاي عصبي
پديد آورندگان :
دشتي ، محمدصادق دانشگاه آزاد اسلامي واحد كرمان - دانشكده علوم پايه , خطيبي بردسيري ، عميد دانشگاه آزاد اسلامي واحد كرمان - دانشكده علوم پايه - گروه مهندسي كامپيوتر , جعفري شهباززاده ، مهدي دانشگاه آزاد اسلامي واحد كرمان - دانشكده فني و مهندسي - گروه مهندسي برق
كليدواژه :
تصحيح خطا , جايگذاري عصبي , شبكههاي عصبي , متون سونوگرافي , پردازش زبان فارسي
چكيده فارسي :
زمينه و هدف: گزارشهاي پزشكي و پروندههاي الكترونيك سلامت براي تشخيص و درمان بيماران و تحقيقات پزشكي اهميت فراوان دارند. تصحيح غلطهاي املايي موجود در متون پزشكي براي اطمينان از تفسير صحيح اطلاعات امري ضروري است. اين پژوهش براي تصحيح خودكار متون پزشكي زبان فارسي به كمك شبكههاي عصبي انجام پذيرفته است.روش بررسي: در اين پژوهش كه در سال ۱۴۰۲ انجام شد، مدل كامپيوتري جديدي مبتني بر شبكههاي عصبي مصنوعي و تكنيك جايگذاري دوگانه با استفاده از زبان برنامهنويسي پايتون در محيط ويندوز توسعه يافت. مدل جايگذاري دوگانه كلمات به طور خاص براي تصحيح املا در حوزه متون سونوگرافي فارسي تنظيم شد. مدل پيشنهادي، از تكنيكهاي متنوعي براي تشخيص خودكار خطا، از جمله تطابق با فرهنگ واژگان ومحاسبه ميزان مشابهت متني استفاده ميكند. همچنين براي انتخاب خودكار مناسبترين كلمه جايگزين با غلطهاي املايي، از ويژگيهاي خاصي همچون فاصله ويرايش(Edit-Distance)، همراه با امتياز مشابهت استفاده شده است. دادههاي آموزش و آزمايش مدل جاري، بخشي از مجموعه متون كلينيك سونوگرافي بيمارستان امام خميني تهران است.يافتهها: مدل پيشنهادي بر اساس شبكههاي عصبي مصنوعي توسعه يافته و از يك معماري جديد جايگذاري دوگانه كلمات جهت انتخاب بهترين كلمات كانديد، به منظور جايگزيني با غلطهاي املايي و معنايي بهره ميبرد. مطابق بررسي انجام شده بر روي متون سونوگرافي فارسي، دقت مدل پيشنهادي بر حسب معيار-F(F-Measure) در تشخيص و تصحيح خودكار خطاهاي معنايي به ترتيب برابر با ۹۰/۵% و ۹۰% ميباشد. به علاوه، دقت ۹۰/۸% در زمينه تصحيح خطاهاي شكلي كسب گرديد.نتيجهگيري: مطابق نتايج ارزيابي، روش پيشنهادي ميتواند به طور مؤثر طيف گستردهاي از خطاهاي شكلي و معنايي، از جمله جايگزيني، جابهجايي، درج و حذف را در متون پزشكي مديريت كند. استفاده و ادغام معيار فاصله ويرايش با امتياز مشابهت متني مستخرج از مدل جايگذاري دوگانه بهطور قابلتوجهي دقت تصحيح غلطهاي املايي را در متون سونوگرافي فارسي افزايش داده كه اين امر متضمن صحت بيشتر محتواي اين گونه اسناد خواهد بود. به باور نويسندگان، مدل پيشنهادي، پيشرفت قابلتوجهي در زمينهي تشخيص و تصحيح غلطهاي املايي براي متون سونوگرافي زبان فارسي است.
عنوان نشريه :
پياورد سلامت
عنوان نشريه :
پياورد سلامت