پديد آورندگان :
كامل قاليباف، آزاده نويسنده PhD Candidate, Medical Informatics, Department of Medical Informatics, Mashhad University of Medical Sciences, Mashhad, Iran , , خادم ثامني، فرزانه نويسنده Assistant Professor, Pathologist, School of Medicine, Zahedan Brunch, Islamic Azad University, Iran , , جنگي، مجيد نويسنده PhD Candidate, Medical Informatics, Department of Medical Informatics, Mashhad University of Medical Sciences, Mashhad, Iran , , مظاهري حبيبي، محمدرضا نويسنده PhD Candidate, Medical Informatics, Department of Medical Informatics, Mashhad University of Medical Sciences, Mashhad, Iran , , اطميناني، كبري نويسنده Assistant Professor, Medical Informatics, Department of Medical Informatics, Mashhad University of Medical Sciences, Mashhad, ,
كليدواژه :
بيماري سلياك , سيستم پشتيبان تصميم باليني , درخت تصميم , روش Delphi , متنكاوي
چكيده فارسي :
مقدمه: گزارش پاتولوژي به صورت متن باز تهيه ميشود و شامل شبكهاي از روابط بين مفاهيم پزشكي است كه پزشك از آن براي استدلال و تشخيص استفاده ميكند. اين مطالعه با هدف، طراحي و ارزيابي مدلي جهت استخراج خودكار اين مفاهيم و تبديل آن به فرم ساختار يافته و قابل تحليل توسط كامپيوتر انجام شد.
روش بررسي: تحقيق حاضر از نوع كاربردي و اجرايي بود و بر روي 258 گزارش پاتولوژي با تشخيص بيماري سلياك كه به صورت تصادفي از دو آزمايشگاه پاتوبيولوژي جمعآوري شد، صورت گرفت. سيستم پيشنهاد شده شامل سه فاز اصلي بود. فاز اول به طراحي يك فرم استاندارد و ساختارمند براي گزارش بيوپسي بيماري سلياك با استفاده از روش Delphi ارتباط داشت. در فاز دوم با به كارگيري ابزارهاي متنكاوي ارايه شده توسط مركز زبانشناسي دانشگاه استنفورد و برنامه واسط طراحي شده به منظور تفسير قطعات معنايي، اطلاعات مورد نظر از متن گزارش استخراج و در قالب فرم استاندارد ذخيره گرديد. در فاز سوم، كلاس Marsh مربوط به هر گزارش با استفاده از الگوريتم يادگيري درخت تصميم 48J، به صورت خودكار تعيين شد.
يافتهها: عملكرد سيستم در فاز استخراج اطلاعات و انتساب مقادير به فيلدهاي فرم استاندارد، صحت 76 درصدي را نشان داد. صحت سيستم در تعيين خودكار طبقهبندي Marsh بر اساس خروجي مرحله قبل، 62 درصد به دست آمد كه در صورت ارايه دادههاي تصحيح شده و بدون خطا، صحت الگوريتم دستهبندي تا 84 درصد افزايش مييابد.
نتيجهگيري: در مطالعه حاضر با طراحي و پيادهسازي مدلي براي ساختارمند كردن گزارشهاي پاتولوژي بيماري سلياك، علاوه بر تسهيل و تسريع در ورود و بازيابي اطلاعات و افزايش خوانايي گزارش، امكان پردازش كامپيوتري دادهها و پيدا كردن روابط و الگوها نيز ميسر گرديد.
واژه هاي كليدي:متنكاوي؛ بيماري سلياك؛ سيستم پشتيبان تصميم باليني؛ روش Delphi؛ درخت تصميم
چكيده لاتين :
Abstract Introduction: Pathology reports generally use an unstructured text format and contain a complex web of relations between medical concepts. In order to enable computers to understand and analyze the reports’ free text, we aimed to convert these concepts and their relations into a structured format. Methods: The training, validation, and evaluation of this implementation study was based on a corpus of 258 pathology reports with a positive diagnosis of celiac disease randomly selected from among the records of 2 pathology laboratories. Our proposed system consisted of 3 phases of standardization of celiac disease pathology reports using Delphi technique with 3 experts, information extraction from free text reports with text mining techniques using Stanford Parser, and automatic classification of celiac disease stages in marsh system using decision tree classifier J48 algorithm. Results: We were successful in extracting information from free text pathology reports and assigning each piece of information to the associated pre-defined fields in standardized template form with an accuracy of 76%. After determining marsh stage for each report in the third phase, our system showed an average overall accuracy of 62%. Evaluation of the third phase as an independent system with manually corrected, gold-standard input achieved an accuracy of greater than 84%. Conclusion: The benefits of standardized synoptic pathology reporting include enhanced completeness and improved consistency, avoidance of confusion and error, and facilitation of the faster and safer transmission of critical pathological data in comparison with narrative reports. Keywords: Text Mining; Celiac disease; Decision Support Systems, Clinical; Delphi Technique; Decision Trees