عنوان مقاله :
ايجاد درخت ژني با استفاده از واگرايي كولبك-ليبلر روي ژنهاي موثر بر توليد شير در گاو شيري
عنوان به زبان ديگر :
Gene tree construction using Kullback-Leibler divergence on milk governing genes in dairy cattle
پديد آورندگان :
دهقان زاده، هوشنگ دانشگاه گيلان - دانشكده علوم كشاورزي - گروه علوم دامي , حسيني، ضياء الدين دانشگاه گيلان - دانشكده علوم كشاورزي - گروه علوم دامي , قادري زفرهيي، مصطفي دانشگاه ياسوج - دانشكده علوم كشاورزي - گروه علوم دامي , توكلي، حسن دانشگاه گيلان - دانشكده فني - گروه مهندسي برق , اسماعيل خانيان، سعيد سازمان تحقيقات آموزش و ترويج كشاورزي - موسسه تحقيقات علوم دامي كشور، كرج
كليدواژه :
تئوري اطلاعات , خوشه بندي ژن , گاو شيري , واگرايي كولبكليبلر
چكيده فارسي :
نظريه اطلاعات، شاخه اي از رياضيات است كه با مهندسي ارتباطات، زيست شناسي و پزشكي همپوشاني دارد. هدف از بررسي حاضر ارائه روشي جهت خوشه بندي تعدادي از ژنهاي موثر روي توليد شير در گاو شيري با استفاده از الگوريتمي متكي بر واگرايي كولبك - ليبلر بود. در اين پژوهش بعد از استخراج توالي DNA ژن و اگزونهاي موثر بر توليد شير در گاو شيري، فراسنجه آنتروپي در مراتب يك تا چهار براي هر ژن و اگزونهاي هر ژن محاسبه شد. جهت استخراج فاصله ميان ژنها از يكديگر، از واگرايي كولبك - ليبلر در سه روش مختلف استفاده شد. روشهاي اول و دوم مبتني بر هم ترازي ولي روش سوم غير مبتني بر هم ترازي و بر پايه آنتروپي نسبي ژنها بود. نتايج هر سه روش واگرايي كولبك - ليبلر روي توالي DNA ژنها و اگزونها با استفاده از هفت روش معمولSingle ،Complete ،Average ،Weighted ، Centroid، Medianو KMeans خوشهبندي شدند. تجميع نتايج هر خوشهبندي كه با الگوريتم AdaBoost انجام شد، و خود نوعي درخت ژني را تداعي كرد، نشان داد كه روش سوم، خوشهبندي معقولي را از نظر زيستي براي مجموعهاي از ژنها حاصل نمود چرا كه با نتايج حاشيه نويسي ژنومي ژنهاي حاصل از GeneMANIA مطابقت داشت. اين اعتقاد وجود دارد كه روش ارائه شده براي ايجاد درخت ژني ميتواند با ساير روشهاي متكي بر توالي DNA ژنها جهت خوشه بندي مجموعهاي از ژنها، رقابت نمايد و لذا ميتواند در گروهبندي ژنهاي ساير گونهها نيز بكار رود.
چكيده لاتين :
Information theory is a branch of mathematics that overlaps with communications, biology. The aim of the
current study was to provide a method for clustering a number of Milk Governing Genes in Dairy Cattle using
an algorithm based on Kullback-Leibler divergence. In this study, after retrieving gene and exon DNA
sequences affecting milk yield in dairy cattle, the entropy in orders one to four was calculated. In order to
extract gene distances, Kullback-Leibler divergence over three different methods was calculated. The first and
second methods were based on the genes alignment but the third method was based on non-alignment and the
relative entropy of the genes. The results of each method of Kullback-Leibler divergence over DNA and exon
sequences were entered as input into 7 general clustering algorithms: Single, Complete, Average, Weighted,
Centroid, Median and K-Means. Integrated result of each clustering algorithm due to AdaBoost algorithm,
which implied as gene tree, indicated that the third method was based on the relative entropy of the genes,
biologically grouped set of genes as it was proved by their gene annotation using GeneMANIA. We believe that
the proposed method might be used with other DNA based clustering competitive methods and therefore, it can
be used to group set of genes in other species.
عنوان نشريه :
تحقيقات توليدات دامي
عنوان نشريه :
تحقيقات توليدات دامي