عنوان مقاله :
تأثير مستندسازي نژادگان و معماريهاي مختلف ژنگاني بر عملكرد روشهاي جنگل تصادفي و بيز آستانهاي A در پيشبيني ژنگاني
عنوان به زبان ديگر :
Impact of genotype imputation and different genomic architectures on the performance of random forest and threshold Bayes A methods for genomic prediction
پديد آورندگان :
نادري، يوسف دانشگاه آزاد اسلامي واحد آستارا
كليدواژه :
درستي مستندسازي , نبود تعادل پيوستگي , ميزان نژادگان ازدسترفته , همانندسازي , AUROC
چكيده فارسي :
انتخاب ژنگاني (ژنومي) با بهرهگيري از مستندسازي (ايمپيوتيشن) ميتواند نقش مهمي در افزايش بهرهوري اقتصادي و پيشرفت ژنتيكي صفات آستانهاي ايفا كند. هدف اين تحقيق بررسي درستي مستندسازي و تأثير آن در سطح زير منحني مشخصۀ عملكرد (AUROC) ارزيابي ژنگاني روشهاي بيز آستانهاي A(TBA) و جنگل تصادفي (RF) در ويژگيهاي آستانهاي با معماريهاي مختلف ژنگاني است. دادههاي ژنگاني براي سطوح متفاوت وراثتپذيري (0/1 و 0/3)، سطوح مختلف (LD 0/135 و 0/295) و شمار متفاوت جايگاه هاي ويژگيهاي كمي (108 و 1080) روي كروموزم 27 كروموزم همانندسازي شدند. براي همانندسازي شرايط واقعي براي هر پيشفرض (سناريو)، از بين 54 هزار نشانگر همانندسازيشده بهطور تصادفي اقدام به حذف 50 درصد و 90 درصد نشانگرها كرده و در مرحلۀ بعد با مستندسازي اقدام به پيشبيني نژادگان (ژنوتيپ) نشانگرها كرده و درستي مستندسازي ارزيابي شد. در گام آخر، نژادگانهاي اصلي و مستندشده با استفاده از روش TBA و RF براي ارزيابي AUROC استفاده شدند. با افزايش سطح LD و كاهش ميزان حذف نشانگرها، درستي مستندسازي بهبود يافت. ميانگين AUROC پيشفرضهاي همانندسازيشده براي جنگل تصادفي و TBA به ترتيب 0/64 و 0/66 بود. استفاده از نژادگانهاي مستندشده با ميزان حذف 50 درصد و 90 درصد، به ترتيب AUROC را به ميزان 0/013 و 0/02 براي RF و 0/018 و 0/026 براي TBA كاهش داد. بهرغم AUROC بالاي روش بيز آستانهاي A در پيشفرضهاي مختلف، روش جنگل تصادفي عملكرد بهتري در شمار بالاي QTL نشان داد. بهطوركلي استفاده از نژادگانهاي مستندشده (k5) ميتواند راهكار مهمي براي كاهش هزينههاي ارزيابي ژنگاني باشد.
چكيده لاتين :
Genomic selection using imputed genotypes can have an important role in increasing economic efficiency and the genetic
improvement of the threshold traits. The objective of this study was to: investigate the accuracy of imputation and to
evaluate its effect on area under receiver operating characteristic (AUROC) of threshold BayesA (TBA) and random forest
(RF) algorithms for discrete traits with different genomic architectures. Genomic data were simulated to reflect variations in
heritability (0.30 and 0.10), number of QTL (108 and 1080) and linkage disequilibrium (low and high) for 27 chromosomes.
To simulate a condition close to reality, we randomly masked markers with 50% and 90% missing rate for each scenario;
afterwards, missing genotypes were imputed and imputation accuracy was estimated. In the last step, to evaluate the
AUROC of TBA and RF, original or imputed genotypes were used. The accuracy of imputation was improved with
increasing level of LD and decreased missing rate. The total average of AUROC values were 0.64 and 0.66 when using RF
and TBA, respectively. Comparing to original genotypes, using imputed genotypes with 50% and 90% missing rate
decreased the average AUROC about 0.013 and 0.02 for RF and 0.0018 and 0.026 for TBA, respectively. Despite the higher
AUROC of TBA at different scenarios, RF showed a better performance in large number QTL. Generally, genomic
prediction based on imputed genotypes (5K) can be implemented to reduce of the cost of a genomic evaluation.
عنوان نشريه :
علوم دامي ايران
عنوان نشريه :
علوم دامي ايران