عنوان مقاله :
فشرده سازي سيگنال هاي ژنوم با كمك حسگري فشرده و كاربرد آن در مقايسه دنباله هاي ژني
عنوان به زبان ديگر :
Genomic Signals Compression by Compressed Sensing and Its Application in Sequences Comparison
پديد آورندگان :
طوماري، محمود دانشگاه زنجان - دانشكده مهندسي - گروه برق و كامپيوتر، زنجان، ايران , جباري، سپيده دانشگاه زنجان - دانشكده مهندسي - گروه برق و كامپيوتر، زنجان، ايران
كليدواژه :
توالي ژن , فشرده سازي , حسگري فشرده , پردازش سيگنال ژنوم , يادگيري بيزين , درختچه فيلوژنتيك
چكيده فارسي :
تحليل توالي هاي ژني نقطه شروع درك عملكرد ارگانيسم هاي بيولوژيكي است. در سالهاي اخير، هزينه هاي توالي برداري ژن به شدت كاهش
يافته است و مقدار زيادي از داده هاي ژنومي درحال توليد هستند. ازطرفي، هزينه حافظه ذخيره سازي، پردازش و انتقال اين داده ها درحال افزايش
است. پردازش اين حجم عظيم اطلاعات بيشتر توسط روش هاي كاراكتر مبنا صورت مي گيرد كه زمان بر است. ظرفيت هاي بالقوّه فراواني براي مقابله
با اين چالش ها در حوزه پردازش سيگنال وجود دارد. بنابراين، نگاه سيگنالي به دنباله هاي ژني، پردازش سيگنال ژنوم و فشرده سازي آن مي تواند مفيد
واقع شود. فشرده سازي سيگنال ها هزينه براي آناليز، فضاي حافظه براي ذخيره سازي، پهناي باند براي مبادله و زمان مورد نياز براي تحليل را كاهش
مي دهد. در اين مقاله ابتدا دنباله هاي ژني كاراكتري به صورت سيگنالي بيان شدند. سپس، سيگنال هاي ژنومي حاصل توسط روش حسگري فشرده
مبتني بر يادگيري بيزين فشرده سازي شدند. توانايي روش در بازسازي سيگنال هاي فشرده شده با استفاده از معيارهاي PRD و NMSE مورد بررسي
قرار گرفت. سپس به منظور مقايسه و بررسي مشابهت دنباله ها، درختچه فيلوژنتيك از روي سيگنال هاي فشرده شده با نرخ 75 % رسم شد. نتايج نشان
دادندكه مقايسه دنباله ها با روش سيگنال مبنا با صرف زمان بسيار كمتر 1/2853 ثانيه در مقايسه با روش كاراكتر مبنا با زمان 126 ثانيه صورت مي گيرد.
چكيده لاتين :
The analysis of gene sequences is fundamentally important for exploring biological functions. Recently, the cost of gene sequencing has dropped sharply, thereby resulting in the production of considerable genomic data. However, the costs of saving, processing, and transferring these data are rising. At present, processing this massive volume of information is done by character based method which is highly time - consuming. Alternative methods challenge these problems in the realm of signal processing. Accordingly, the signal outlook to the genome, signal processing of the genome and compression of the genome are presently hot issues which are practically in demand. Compression reduces the cost, memory space, bandwidth for exchange, and the time required for analysis. In this study, the character genes were firstly represented as signals. Then, these genomic signals were compressed by compressed sensing. Consequently, they were reconstructed by bayesian learning method. Adopted criteria for reconstruction were PRD and NMSE, respectively. Then, signals were selected with a compression rate of 75% for comparison. Meanwhile, the same cluster analysis was run with character based method. The results indicated that the time needed for signal based method was considerably lower than the character based method.
عنوان نشريه :
مهندسي برق دانشگاه تبريز