عنوان مقاله :
كاربرد خوشه بندي فازي در تحليل پروتئين هاي مرتبط با سرطان هاي مري، معده و كلون بر اساس تشابهات تفسير هستي شناسي ژني
عنوان به زبان ديگر :
Application of fuzzy clustering in analysis of included proteins in esophagus, stomach and colon cancers based on similarity of Gene Ontology annotation
پديد آورندگان :
زرنگارنيا، يلدا دانشگاه علوم پزشكي شهيد بهشتي - شعبه بين الملل , علوي مجد، حميد دانشگاه علوم پزشكي شهيد بهشتي - دانشكده پيراپزشكي - گروه آمار زيستي , رضايي طاويراني، مصطفي دانشگاه علوم پزشكي شهيد بهشتي - دانشكده پيراپزشكي - گروه آمار زيستي , خادم معبودي ، علي اكبر دانشگاه علوم پزشكي شهيد بهشتي- دانشكده پيراپزشكي، گروه آمار زيستي , خير، نصيبه دانشگاه غير انتفاعي خاتم
كليدواژه :
بيوانفورماتيك , تفسير هستي شناسي ژني , خوشه بندي فازي , سرطان دستگاه گوارش
چكيده فارسي :
سابقه و هدف: بهدليل ايجاد حجم عظيمي از دادههاي پروتئوميكي و نياز به روشهاي جديد تحليل نتايج آزمايشگاهي، تحليل جمعي پروتئينها ميتواند علاوه بر صرف زمان كمتر ما را در شناسايي الگوهاي جديد در مجموعه دادهها ياري كند. تحليل خوشهاي به عنوان يك روش آماري مطلوب، ابزاري است كه ميتواند در تحليل اينگونه دادهها مورد استفاده قرار گيرد. هدف از اين پژوهش ارزيابي كارايي روش خوشهبندي فازي در شناسايي الگوهاي جديد در مجموعه پروتئينهاي مرتبط با سرطانهاي دستگاه گوارش بوده است.
مواد و روش ها: در اين پژوهش پروتئينهاي شناسايي شده مرتبط با سرطانهاي مري، معده و كلون مورد تحليل خوشهبندي فازي قرار گرفتهاند. بر اساس هر يك از ابعاد هستيشناسي ژني ( Gene Ontology ) شامل فرآيند بيولوژيكي، جايگاه سلولي و كاركرد مولكولي، به طور جداگانه روش خوشهبندي فازي اجرا گرديد و نتايج حاصله با هم مقايسه شدند.
يافته ها: پس از خوشهبندي فازي پروتئينها، مقدار شاخص غير فازي بر اساس فرآيند بيولوژيكي، جايگاه سلولي و كاركرد ملكولي به ترتيب 41/0، 55/0 و 35/0 به دست آمد كه مخصوصاً در مورد خوشهبندي بر اساس كاركرد ملكولي نشاندهنده مناسبت روش خوشهبندي فازي بوده است. با وجود چشمگير نبودن عرض سايه نماي كل خوشهبنديهاي حاصل، اكثر پروتئينها در هر خوشه داراي اشتراكات بيولوژيكي قابل توجه شدند. با بكارگيري نرمافزار Term Enrichment و تعيين عبارتهاي غني شده آماري در مجموعه كل دادهها و در خوشهها مشخص شد كه روش خوشهبندي فازي به خوبي توانسته است الگوهاي تفسير جديدي را در مجموعه دادهها آشكار سازد.
نتيجه گيري: با بررسي نتايج حاصل از خوشهبندي فازي مشخص شد كه اين روش ميتواند در جهت تحليل بهتر و انعطافپذيرتر پروتئينها مورد استفاده قرار گيرد. روش خوشهبندي فازي، پروتئينهايي را كه داراي تشابهات بيشتري بودهاند با احتمال بيشتري در كنار هم قرار داده است، لذا ميتوان از اين روش در حالتهايي كه مشخصههاي برخي از پروتئينها مجهول ميباشد، استفاده نمود. همچنين مشخص شد پروتئينهايي كه بر اساس تشابهات مولفه سلولي در كنار هم قرار ميگيرند داراي تشابهات بيولوژيكي و عملكردي نيز هستند كه اين مساله بايد مورد بررسيهاي بيشتر قرار گيرد.
چكيده لاتين :
Introduction: Because of producing large amount of proteomics data and requiring new procedures
for analyzing them, collective analysis of proteins can help us in identifying new annotation patterns in
dataset. Furthermore, this type of analysis is a time- consuming process too. Cluster analysis, as a suitable
statistic procedure, can be used for analyzing these datasets. This paper's objective was evaluating the
efficiency of fuzzy clustering method in recognizing new patterns within proteins which are related to
gastric cancers.
Materials and Methods: Fuzzy clustering procedure has been used to analyze the identified included
proteins in esophagus, stomach and colon cancers. Proteins were clustered based on three aspects of Gene
Ontology (GO) and results were compared.
Results: Fuzzy clustering was implemented and non-fuzziness indexes based on biological process,
cellular component and molecular function were obtained equal to 0.41, 0.55 and 0.35, respectively.
Obtained index based on molecular function showed the efficiency of fuzzy clustering method. Despite of
non-substantial silhouette widths for the entire dataset, most of the proteins in each cluster had
remarkable biological communions. Using Term Enrichment software to determine statistically enriched
GO terms in the entire dataset and clusters, it was cleared that the fuzzy clustering has revealed novel
annotation patterns within dataset that would not have been identified otherwise.
Conclusion: Considering fuzzy clustering outputs, the efficiency of this method for better and flexible
proteins analysis was cleared. As fuzzy clustering method has placed proteins, that have more similarities,
with high probabilities together. Therefore, it can be used for the situations that some of proteins have
unknown characteristics. Furthermore it seems that the proteins clustered via their cellular component
similarities, have also biological and functional similarities which this requires more investigations.