عنوان مقاله :
روش شناسي پيوند داده بر اساس الگوريتم احتمالاتي: يك مقاله مروري
عنوان به زبان ديگر :
Probabilistic record linkage methodology: a review article
پديد آورندگان :
ايوبي، عرفان دانشگاه علوم پزشكي زابل - دانشكده پزشكي , منصوري، كاميار دانشگاه علوم پزشكي كردستان - دانشكده پزشكي , گل ماهي، محمد دانشگاه علوم پزشكي تهران - مركز تحقيقات سرطان , رمضان خاني، عذرا دانشگاه علوم پزشكي شهيد بهشتي - پژوهشكده علوم غدد درون ريز و متابوليسم , موسوي جراحي، عليرضا دانشگاه علوم پزشكي شهيد بهشتي - دانشكده پزشكي - گروه پزشكي اجتماعي
كليدواژه :
پيوند داده , رويكرد احتمالاتي , ثبت سرطان , ثبت مرگ
چكيده فارسي :
امروزه با پيشرفت تكنولوژي و توسعه پژوهش در كشور، شاهد شكل گرفتن بانك هاي اطلاعاتي بزرگ و ارزشمند هستيم. لازمه رديابي اطلاعاتافراد در اين مجموعه هاي گرانبها، بكارگيري روشهاي جديد واكاوي داده هاي مرتبط ميباشد. با اين روشها اطلاعات بسيار مفيدي را ميتوان درباره تشخيص، سبب شناختي و پيش آگهي پيامدهاي مختلف بدون انجام مطالعات پرهزينه فراهم كرد. گوناگوني در جمع آوري و تعاريف فيلد هاي حاوي داده هاي سلامت در بانكهاي اطلاعاتي مختلف، نياز به آشنايي با روش شناسي پيوند داده ها را بيشتر ميكند. هدف از اين مقاله مروري، آشنايي با روششناسي پيوند داده ها براساس روشهاي احتمالاتي ميباشد. تعريف پيوند داده در دو روش قطعي و احتمالاتي ارائه خواهد شود و در ادامه مباني روش شناختي پيوند داده احتمالاتي مانند ارزيابي كيفيت داده ها، ارزيابي همسان بودن ركوردها و محاسبه وزن همسان بودن ركوردها از دو بانك اطلاعاتي به همراه تعيين سطح تصميم گيري براي همسان بودن آنها بحث خواهد شد. در قالب يك مثال عملي روش شناسي پيوند داده احتمالاتي با استفاده از داده هاي بانك اطلاعات ثبت سرطان و مرگ و مير نشان خواهد داده شد.
چكيده لاتين :
Research development and information technology progress lead to generate big dataset with valuable information. In health research, with tracing people from different dataset like registries can provide valuable information about prognosis, prediction, discrimination, detection or etiology for many outcomes without establishing costly studies. Extracting the knowledge from this potential information is applied using advanced methods such as data linkage or record linkage with deterministic or probabilistic algorithm. However, probabilistic linkage is computationally complex and not well understood by many researchers who may wish to apply it in their work. Therefore, the purposes of this review article is to introduce probabilistic record linkage methodology such as quality and standardization of dataset, determining the matching records from different dataset, calculating the matching weights and discrimination matched from unmatched record using a cut point. In follow, with a practical example the probabilistic record linkage methodology is introduced by cancer registry and mortality dataset.
عنوان نشريه :
فصلنامه دانشگاه علوم پزشكي و خدمات بهداشتي درماني سبزوار
عنوان نشريه :
فصلنامه دانشگاه علوم پزشكي و خدمات بهداشتي درماني سبزوار