Title of article :
Signal processing approaches as novel tools for the clustering of N-acetyl-b-D-glucosaminidases
Author/Authors :
Mamarabadi، Mojtaba نويسنده Department of Plant Protection, Faculty of Agriculture, Ferdowsi University of Mashhad, P.O. Box 1163, Mashhad, I.R. Iran and Faculty of Agriculture, , , Tokhmechi، Behzad نويسنده School of Mining, Petroleum and Geophysics Engineering, Shahrood University of Technology, P.O. Box 316, Shahrood, I.R. Iran ,
Issue Information :
فصلنامه با شماره پیاپی 0 سال 2012
Pages :
9
From page :
175
To page :
183
Abstract :
خوشه بندي پروتيين ها و آنزيم ها امروزه بعنوان يكي از مباحث مهم در علم بيوانفورماتيك مطرح مي باشد. در حال حاضر تعداد كثيري از ژن هاي مختلف كُد كننده آنزيم هاي كيتيناز در موجودات مختلف كشف و توالي آن ها مشخص گرديده است. تعداد اين ژن ها رو به تزايد است و رده بندي هاي مختلفي با توجه به الگوريتم هاي مختلف رياضي جهت خوشه بندي اين آنزيم ها ارايه گرديده است كه اغلب مبهم و ناكافي هستند. در اين پژوهش ابتدا داده توالي هاي آمينواسيدي كيتينازهاي مختلف موجود در بانك اطلاعاتي NCBI عددي (digitize) گرديدند. مقادير عددي شده به انرژي سيگنال نرماليزه (normalize) و سپس با استفاده از تبديل موجك (Wavelet) با موجك مادر bior 5.5 در سطح اول به باندهاي فركانسي تقريب (a1) و جزييات (d1) تجزيه شده و ضرايب مربوطه بازيافت گرديدند. همبستگي دوطرفه توالي-هاي عددي شده آمينواسيدي و ضرايب a1 و d1 محاسبه گرديدند. بيشترين مقدار همبستگي به عنوان شاخص مشابهت گزينش و كلادوگرام-هاي درختي مربوطه ترسيم گرديدند. نتاج حاصل از اين پژوهش نشان داد كه اولاً با اين رويكرد كلادوگرام هاي درختي مطلوب و معتبري را مي توان توليد نمود و ثانياً كلادوگرام درختي حاصله از ضرايب d1 جدايش به مراتب بهتري از مقادير عددي شده توالي هاي آمينواسيدي و ضرايب a1 ارايه مي نمايد. نكته مهم تر اين كه كلادوگرام درختي حاصل از ضرايب d1 در اين رويكرد نسبت به كلادوگرام هاي درختي كلاسيك اصلاح شده و معتبرتر مي باشند.
Abstract :
Nowadays, the clustering of proteins and enzymes in particular, are one of the most popular topics in bioinformatics. Increasing number of chitinase genes from different organisms and their sequences have been identified. So far, various mathematical algorithms for the clustering of chitinase genes have been used but most of them seem to be confusing and sometimes insufficient. In the present study, as a first step, different amino acids participating in panoply of chitinases, as a model protein, obtained from the NCBI GenBank, were digitized. Digitized data were normalized to the signal energy. Normalized data decomposed using mother wavelet bior 5.5 to approximation (a1) and details (d1), at the first level. Corresponded coefficients have been obtained and cross correlation between normalized, a1 and d1 coefficients of amino acid sequences were calculated. Maximum correlation was selected as similarity index and corresponded cladogram trees were made. The results of this study showed that more optimal and reliable cladogram tree can be produced and better discrimination observed from d1 coefficients compared to normalized sequences and opposed to a1 coefficients. Using suggested approach, the cladogram tree made from d1 coefficients not only had more validity but also the drawback of the classic cladogram tree has been improved.
Journal title :
Iranian Journal of Biotechnology (IJB)
Serial Year :
2012
Journal title :
Iranian Journal of Biotechnology (IJB)
Record number :
681347
Link To Document :
بازگشت