Author/Authors :
حاجي مقصودي، سعيده نويسنده دانشجوي دكتري، مركز همكار سازمان جهاني بهداشت و مركز منطقهاي آموزش نظام مراقبت HIV، پژوهشكده آيندهپژوهي در سلامت، دانشگاه علوم پزشكي كرمان، كرمان، ايران Haji-Maghsoudi , Saiedeh , حقدوست، علي اكبر نويسنده استاد، مركز همكار سازمان جهاني بهداشت و مركز منطقهاي آموزش نظام مراقبت HIV، پژوهشكده آيندهپژوهي در سلامت، دانشگاه علوم پزشكي كرمان، كرمان، ايران Haghdoost , Ali Akbar , بانشي، محمد رضا نويسنده دانشيار، مركز تحقيقات مدلسازي در سلامت، پژوهشكده آيندهپژوهي در سلامت، دانشگاه علوم پزشكي كرمان، كرمان، ايران Baneshi , Mohammad Reza
Abstract :
چكيده
مقدمه: زندانيان در مقايسه با جمعيت عمومي بيشتر در معرض خطر بيماريهاي مسري قرار دارند و تزريق مواد يكي از روشهاي اصلي انتقال ويروس HIV (Human immunodeficiency virus) به ويژه در ايران ميباشد. تعيين عوامل تاثيرگذار بر تزريق مواد در زندانيان به عنوان يك گروه در معرض خطر از اهميت خاصي برخوردار است. دادههاي ناكامل (گمشده) چالشي است كه به طور معمول در مجموعه دادههاي كشوري وجود دارد. در اين مقاله فرايند ساخت مدل با حضور دادههاي گمشده ارزيابي گرديد.
روشها: در مطالعه حاضر، دادههاي كامل 2720 زنداني در يك مجموعه داده مورد استفاده قرار گرفت. مدل رگرسيون لجستيك روي دادههاي كامل به عنوان مدل اصلي در نظر گرفته شد. سپس براي ايجاد داده گمشده در مجموعه داده كامل، به تصادف 20 و 50 درصد دادهها حذف و دادههاي گمشده با روش انتساب چندگانه، ده مرتبه برآورد گرديد و قاعده Rubin براي انتخاب متغير و تركيب نتايج مجموعه دادههاي برآورد شده به كار گرفته شد. در روشهاي 1S، 2S و 3S متغيرهايي كه در حداقل يك متغير، پنج متغير و همه ده مجموعه داده معنيدار بودند، به عنوان داوطلب حضور در مدل انتخاب شدند. همچنين دو روش وزني هم براي انتخاب متغير به كار برده شد.
يافتهها: سن شروع مصرف مواد، سابقه مصرف مواد قبل از زنداني شدن، مجرد بودن و طول دوره زنداني بودن ارتباط معنيداري با تزريق مواد در زندانيان داشت. همه روشهاي انتخاب متغير، معنيداري اين متغيرها را نشان داد.
نتيجهگيري: نتايج نشان داد كه روشهاي سادهتري نيز در مقايسه با روش Rubin براي انتخاب متغير وجود دارد؛ يعني در مرحله اول با يك نگاه كلي نسبت به متغيرهاي معنيدار در مجموعه دادههاي برآورد شده ميتوان متغيرهايي را كه داوطلب حضور در مدل با بيش از يك متغير پيشبين هستند، انتخاب نمود.
Abstract :
Abstract
Background: Prisoners, compared to the general population, are at greater risk of infection. Drug injection is the main route of human immunodeficiency virus (HIV) transmission, in particular in Iran. What would be of interest is to determine variables that govern drug injection among prisoners. However, one of the issues that challenge model building is incomplete national data sets. In this paper, we addressed the process of model development when missing data exist.
Methods: Complete data on 2720 prisoners was available. A logistic regression model was fitted and served as gold standard. We then randomly omitted 20%, and 50% of data. Missing date were imputed 10 times, applying multiple imputation by chained equations (MICE). Rubin’s rule (RR) was applied to select candidate variables and to combine the results across imputed data sets. In S1, S2, and S3 methods, variables retained significant in one, five, and ten imputed data sets and were candidate for the multifactorial model. Two weighting approaches were also applied.
Findings: Age of onset of drug use, recent use of drug before imprisonment, being single, and length of imprisonment were significantly associated with drug injection among prisoners. All variable selection schemes were able to detect significance of these variables.
Conclusion: We have seen that the performances of easier variable selection methods were comparable with RR. This indicates that the screening step can be used to select candidate variables for the multifactorial model.