عنوان مقاله :
بهبود استنتاج شبكههاي تنظيم بيان ژن با رويكرد تجميع دادهها
عنوان به زبان ديگر :
Improving the Inference of Gene Expression Regulatory Networks with Data Aggregation Approach
پديد آورندگان :
ناصري، عاطفه دانشگاه الزهرا (س) - دانشكده فني مهندسي - گروه مهندسي كامپيوتر، تهران , هاشمي نژاد، محمدحسين دانشگاه الزهرا (س) - دانشكده فني مهندسي - گروه مهندسي كامپيوتر، تهران , شرقي، مهران دانشگاه الزهرا (س) - دانشكده فني مهندسي - گروه مهندسي كامپيوتر، تهران
كليدواژه :
شبكه تنظيم بيان ژن , استنتاج شبكه تنظيم بيان ژن , الگوريتم انتشار , ادغام دادهها
چكيده فارسي :
مقدمه: عمدهترين موضوع بر سر راه آينده بيوانفورماتيك طراحي ابزارهايي جهت مشخص كردن عملكردها و تمامي محصولات ژنهاي يك سلول است. اين امر نياز به ادغام رشتههاي متفاوت بيولوژيكي و همچنين ابزارهاي پيچيده رياضي و آمار دارد. در اين تحقيق نشان داده شد كه ميتوان با استفاده از تكنيك هاي داده كاوي مدل هايي براي تشخيص سبك زندگي افراد از لحاظ پرخطر يا كم خطر بودن براي ابتلاء به سرطان روده بزرگ توسعه داد.
روش: در اين بررسي گذشته نگر، مجموعه دادهاي شامل 84 فرد بيمار و 225 فرد سالم، شامل 25 خصيصه جمعآوري شد. اين اطلاعات شامل بيماراني است كه تشخيص آنها مربوط به سالهاي 1385 تا سه ماهه اول 1393 ميباشد. از پركاربردترين تكنيك ها در ادبيات انفورماتيك پزشكي شامل ماشين بردار پشتيبان، بيزين ساده، درخت تصميم و نزديكترين همسايگي براي توسعه مدل ها استفاده شد.
نتايج: مدل هاي توسعه داده شده با كارايي قابل قبولي، قادر به تشخيص سبك زندگي افراد هستند. سنجه غيرتكنيكي توسعه داده شده به خوبي ميتواند ارزش واقعي تكتك پيشبيني ها، چه درست و چه نادرست را با هزينه هاي واقعي مشخص كند و يك ميزان واقعي از هزينه هاي صرفه جويي شده در نظام سلامت توسط هر مدل را نشان دهد. از ميان مدل هاي توسعه داده شده تنها دو مدل توانست معيارهاي تعيين شده جهت استفاده در دنياي واقعي را ارضا كند.
نتيجه گيري: مدل هاي توسعه داده شده نه تنها بايد از لحاظ تكنيكي ارزيابي شوند، بلكه بايد از لحاظ سنجه هاي مورد پذيرش براي حوزه پزشكي و همچنين قابليت اجرا براي حل واقعي مسئله نيز بررسي گردند.
چكيده لاتين :
Introduction: The major issue for the future of bioinformatics is the design of tools to determine the
functions and all products of single-cell genes. This requires the integration of different biological
disciplines as well as sophisticated mathematical and statistical tools. This study revealed that data
mining techniques can be used to develop models for diagnosing high-risk or low-risk lifestyles for
colorectal cancer.
Method: In this retrospective study, a dataset consisting of information relevant to 84 patients and
225 healthy individuals with 25 attributes was collected. This information was on patients diagnosed
from 2006 to the first quarter of 2014. The most widely used techniques in the medical informatics
literature including support vector machine, Naive Bayes, decision tree, and k-nearest neighbor were
used to develop the models.
Results: The developed models are able to distinguish people's lifestyles efficiently. A welldeveloped
non-technical measure can properly determine the true value of individual predictions,
whether true or false, at actual costs, and indicate a true measure of the cost savings in the health
system by each model. Among the developed models, only two models were able to meet the criteria
set for use in the real world.
Conclusion: The developed models should not only be technically evaluated, but should also be
examined in terms of metrics accepted for the medical field as well as feasibility for real problem
solving.
عنوان نشريه :
مجله انفورماتيك سلامت و زيست پزشكي