عنوان مقاله :
خوشه بندي تعدادي از ژن هاي موثر در توليد شير با استفاده از تئوري اطلاعات و اطلاعات متقابل
عنوان به زبان ديگر :
Clustering of a Number of Genes Affecting in Milk Production using Information Theory and Mutual Information
پديد آورندگان :
دهقان زاده، هوشنگ سازمان تحقيقات، آموزش و ترويج كشاورزي رشت - مركز تحقيقات و آموزش كشاورزي و منابع طبيعي گيلان - بخش تحقيقات علوم دامي , ميرحسيني، ضياء الدين دانشگاه گيلان - دانشكده كشاورزي - گروه علوم دامي , قادري زفرهيي، مصطفي دانشگاه ياسوج - دانشكده كشاورزي - گروه علوم دامي , توكلي، حسن دانشگاه گيلان - دانشكده فني - گروه مهندسي برق , اسماعيل خانيان، سعيد سازمان تحقيقات، آموزش و ترويج كشاورزي كرج - موسسه تحقيقات علوم دامي كشور
كليدواژه :
گاو شيري , خوشهبندي ژن , تئوري اطلاعات , اطلاعات متقابل , آنتروپي
چكيده فارسي :
نظريه اطلاعات، شاخهاي از رياضيات است. از تئوري اطلاعات در تجزيه و تحليل هاي ژنتيكي و بيوانفورماتيكي استفاده گرديده و ميتوان از آن در آناليزهاي مربوط به ساختارها و تواليهاي زيستي نيز استفاده نمود. در اين پژوهش بعد از استخراج توالي DNA ژن و اگزونهاي موثر بر توليد شير در گاو شيري، فراسنجه آنتروپي در مراتب يك الي چهار براي هر ژن و اگزونهاي هر ژن محاسبه شد. براي استخراج تشابه ميان ژنها از يكديگر، از اطلاعات متقابل بين ژن ها استفاده شد. نتايج با استفاده از هفت روش معمول خوشهبندي شدند. با توجه به تعدد نتايج، جهت افرايش دقت و تجميع نتايج حاصل، از الگوريتم آدابوست استفاده گرديد. در پايان جهت تاييد نتايج حاصل از آدابوست و پيش بيني عملكرد ژنها و ارتباط بين آنها، با مراجعه به تارگاه GeneMANIA نتايج بر اساس حاشيه نويسي ژنومي آنها مورد بررسي و مقايسه قرار گرفت. تجميع نتايج هر خوشهبندي كه با الگوريتم آدابوست انجام شد و خود نوعي درخت ژني را تداعي مي كند، نشان داد كه روش پيشنهادي براي خوشهبندي مجموعهاي از ژنها، از نظر زيستي جواب معقولي را حاصل ميكند چرا كه با نتايج حاشيه نويسي ژنومي ژنهاي حاصل در تارگاه GeneMANIA مطابقت داشت. اعتقاد بر اين است كه روش ارائه شده براي ايجاد درخت ژني با ساير روشهاي متكي به توالي DNA براي خوشه بندي مجموعهاي از ژنها، ميتواند رقابت نمايد و لذا ميتواند در گروهبندي ژنهاي ساير گونهها نيز به كار رود.
چكيده لاتين :
Information theory is a branch of mathematics. Information theory is used in genetic and bioinformatics analyses and can be used for many analyses related to the biological structures and sequences. Bio-computational grouping of genes facilitates genetic analysis, sequencing and structural-based analyses. In this study, after retrieving gene and exon DNA sequences affecting milk yield in dairy cattle, the entropy in orders one to four for each gene and eta exons was calculated. In order to extract gene distances, mutual information method was calculated. The results of mutual information of DNA and exon sequences were entered as input into 7 general clustering algorithms. In order to aggregate the results of clustering, AdaBoost algorithm was used. Finally, the results of AdaBoost algorithm were investigated by GeneMANIA prediction server to explore the results from gene annotation point of view. Integrated result of each clustering algorithm due to AdaBoost algorithm, which implied as gene tree, indicated that proposed method biologically grouped set of genes as it was proved by their gene annotation using GeneMANI. We believe that the proposed method might be used with other DNA based clustering competitive methods and therefore, it can be used to group set of genes in other species.
عنوان نشريه :
پژوهشهاي توليدات دامي
عنوان نشريه :
پژوهشهاي توليدات دامي