عنوان مقاله :
خوشهبندي دادههاي بيان ژني و كاربرد آن در تحليل افتراق انواع سرطان خون
عنوان به زبان ديگر :
Gene expression data clustering and it’s application in differential analysis of leukemia
پديد آورندگان :
واحدي، محسن دانشگاه علوم پزشكي شهيد بهشتي - مركز تحقيقات بيماري هاي گوارش و كبد , علوي مجد، حميد دانشگاه علوم پزشكي شهيد بهشتي - دانشكده پيرايزشكي , محرابي، يدا... دانشگاه علوم پزشكي شهيد بهشتي - دانشكده بهداشت , نقوي ،بهار دانشگاه علوم پزشكي شهيد بهشتي- دانشكده پرستاري
كليدواژه :
بيوانفورماتيك , ريزآرايهDNA , بيان ژن , خوشه بندي , سرطان خون
چكيده فارسي :
سابقه و هدف: يكي از شاخههاي مهم بيوانفورماتيك فناوري ريزآرايه DNA است كه امكان بررسي بيان هزاران ژن را به طور همزمان در حداقل زمان ممكن ميسازد كه در سالهاي اخير موجب توليد حجم انبوهي از دادههاي بيان ژني شده است. تحليل آماري اين دادهها شامل نرمال سازي، خوشه بندي، طبقه بندي و ... از جمله روشهاي مورد استفاده در تحليل اين نوع دادهها است. مواد و روشها: در اين مقاله دادههاي بيان ژني سرطان خون گلوب و همكاران (1999) كه بر اساس روش آرايه اليگونوكلئوتيد توليد شده و از طريق اينترنت در اختيار عموم قرار دارد، با استفاده از روشهاي آماري مقياسبندي چند بعدي، خوشهبندي سلسله مراتبي و غير سلسله مراتبي مورد تجزيه و تحليل قرار گرفته است. مجموعه دادهها شامل 20 بيمار مبتلا به سرطان خون لنفوئيدي حاد (ALL) و 14 بيمار مبتلا به سرطان خون ميلوئيدي حاد (AML) است. در هر دو روش خوشهبندي، دادهها به دو خوشه تقسيم شدند. روشهاي مختلف خوشهبندي با توجه به گروهبندي واقعي نمونهها (ALL،AML) مورد مقايسه قرار گرفتند. نرم افزار R براي تحليل دادهها استفاده شد. يافتهها: ويژگي روش خوشهبندي سلسله مراتبي تقسيمي در تشخيص افراد ALL، 75 درصد و حساسيت آن 92 درصد بدست آمد، ويژگي روش افراز كردن اطراف ميدوئيد در تشخيص افراد ALL، 90 درصد و حساسيت آن 93 درصد بدست آمد كه نشاندهنده عملكرد خوب اين دو روش است. يكي از نمونهها كه بر اساس يافتههاي باليني در گروه AML قرار دارد طبق نتايج تمام روشهاي خوشهبندي مورد استفاده در گروه ALL قرار گرفت كه از نظر باليني ميتواند قابل توجه باشد. نتيجهگيري: با توجه به انطباق قابل توجه نتايج خوشهبندي با گروهبندي واقعي دادهها، ميتوان از اين روشهاي آماري در مواردي كه اطلاع دقيقي از گروهبندي واقعي دادهها در دست نيست، استفاده كرد. به علاوه نتايج خوشهبندي ممكن است زيرگروههايي از نمونهها را به نحوي متمايز كند كه براي انطباق آن با يافتههاي باليني، پژوهشهاي آزمايشگاهي يا باليني جديدي لازم باشد.
چكيده لاتين :
Introduction: DNA microarray technique is one of the most important categories in bioinformatics, which allows the possibility of monitoring thousands of expressed genes has been resulted in creating giant data bases of gene expression data, recently. Statistical analysis of such databases included normalization, clustering, classification and etc. Materials and Methods: Golub et al (1999) collected data bases of leukemia based on the method of oligonucleotide. The data is on the internet. In this paper, we analyzed gene expression data. It was clustered by several methods including multi-dimensional scaling, hierarchical and non-hierarchical clustering. Data set included 20 Acute Lymphoblastic Leukemia (ALL) patients and 14 Acute Myeloid Leukemia (AML) patients. The results of tow methods of clustering were compared with regard to real grouping (ALL & AML). R software was used for data analysis. Results: Specificity and sensitivity of divisive hierarchical clustering in diagnosing of ALL patients were 75% and 92%, respectively. Specificity and sensitivity of partitioning around medoids in diagnosing of ALL patients were 90% and 93%, respectively. These results showed a well accomplishment of both methods of clustering. It is considerable that, due to clustering methods results, one of the samples was placed in ALL groups, which was in AML group in clinical test. Conclusion: With regard to concordance of the results with real grouping of data, therefore we can use these methods in the cases where we don't have accurate information of real grouping of data. Moreover, Results of clustering might distinct subgroups of data in such a way that would be necessary for concordance with clinical outcomes, laboratory results and so on.