شماره ركورد كنفرانس :
4379
عنوان مقاله :
بهبود كارايي انديس گذاري باروز-ويلر براي همترازسازي تواليهاي خوانش كوتاه با انتخاب زيرمجموعهاي از ماتريس پسوند
پديدآورندگان :
شريفي ربابه sharifi_r14@msc.guilan.ac.ir گروه مهندسي كامپيوتر، دانشكدهي مهندسي، دانشگاه گيلان , شاه بهرامي اسدا... shahbahrami@guilan.ac.ir گروه مهندسي كامپيوتر، دانشكدهي مهندسي، دانشگاه گيلان
كليدواژه :
انديس گذاري ژنوم , تبديل باروز-ويلر , بهبود كارايي انديس گذاري , جستجوي دقيق توالي , همترازسازي توالي.
عنوان كنفرانس :
هشتمين كنفرانس فناوري اطلاعات و دانش
چكيده فارسي :
همترازسازي تواليها يكي از وظايف مهم در بيوانفورماتيك است. الگوريتمهاي همترازسازي تواليها در دو دستهي كلي مبتني بر برنامه نويسي پويا و الگوريتمهاي ابتكاري قرار ميگيرند. در الگوريتمهاي نوع دوم، انديس گذاري ژنومها يك مرحلهي پيش نياز مهم است. تبديل باروز-ويلر يك روش انديس گذاري پركاربرد است كه علاوه بر مصرف حافظهي كم، ساختار مناسبي براي جستجوي سريع و دقيق در تواليها فراهم ميكند. اين انديس در سه مرحله ساخته ميشود؛ ساختن ماتريس پسوند، مرتب سازي پسوندها و ساختن دادههاي كمكي مربوط به انديس. بررسيها نشان ميدهد كه مرحلهي مرتب سازي پسوندها داراي بيشترين زمان اجرا است بطوريكه براي يك توالي به طول 25600 نماد، بيش از 3 ساعت طول ميكشد. در اين مقاله يك روش براي بهبود زمان انديس گذاري باروز-ويلر با استفاده از تغييري كوچك در مرتب سازي ماتريس پسوندها معرفي شده كه بر اساس ويژگيهاي الگوريتم جستجوي دقيق عقبگرد پيشنهاد شده است. اين الگوريتم جستجو يكي از الگوريتمهاي ابزار همترازسازي باروز-ويلر است كه براي جستجوي تواليهاي خوانش كوتاه توليد شده توسط فناوريهاي تعيين توالي جديد (حداكثر 100 نماد)، در ژنومها به كار ميرود. ايدهي اصلي، كاهش اندازهي مسئلهي مرتب سازي با انتخاب پيشوندي از تمام سطرهاي ماتريس پسوند بر اساس نيازهاي الگوريتم جستجوي دقيق عقبگرد است؛ به طوريكه، در درستي الگوريتم جستجو تأثير منفي نداشته باشد. نتايج حاصل از اجراي الگوريتم نشان ميدهد كه با انتخاب طول 100 براي پيشوندها، زمان انديس گذاري يك توالي 25600 نمادي از حدود 4/3 ساعت به 5/3 دقيقه كاهش مييابد. با توجه به اينكه فناوريهاي تعيين توالي جديد، خوانشهايي با طول كوتاه توليد ميكنند، ميتوان با انتخاب طول پيشوند متناسب با اين فناوريها، روش پيشنهادي را بدون از دست دادن درستي الگوريتم جستجو به كار برد.