عنوان مقاله :
پردازش تصاوير پزشكي با استفاده از شبكه هاي عصبي كانولوشن عميق
عنوان به زبان ديگر :
Medical image processing using deep convolutional neural networks
پديد آورندگان :
كارساز، علي موسسه آموزش عالي خراسان - گروه مهندسي برق،كنترل، مشهد , محمديان روشن، صبورا موسسه آموزش عالي خراسان - گروه مهندسي برق،كنترل، مشهد
كليدواژه :
شبكه هاي عصبي كانولوشن , شبكه كانولوشن گوگل نت , شبكه الكس نت , شبكه سيفارنت , بانك اطلاعات تصاوير ImageNet
چكيده فارسي :
حوزه پردازش تصاوير پزشكي بازه وسيعي از كاربردها از تشخيص ديابت چشمي از روي تصاوير شبكيه چشم تا بخش بندي تصاوير MRI جهت تشخيص تومورهاي مغر انسان را در بر مي گيرد. نگرش هاي متعدد دسته بندي و خوشه بندي مبتني بر يادگيري ماشين در مقالات جهت بهبود دقت در غربالگري بيماري ها ارائه شده است. بعضي از اين روش ها مبتني بر استخراج ويژگي ها از روي تصاوير پزشكي به صورت دستي بوده و توسط متخصصين پردازش تصوير با صرف زمان و انرژي زياد، صورت مي پذيرد. در سال هاي اخير روشي جديد براي تشخيص و طبقه بندي تصاوير پزشكي بدون نياز به استخراج ويژگي ها به صورت دستي، مبتني بر شبكه هاي عصبي كانولوشن ارائه شده است. اين دسته از شبكه هاي عصبي كه مبتني بر فرآيند يادگيري عميق ارائه شده اند نسبت به شبكه هاي عصبي معمولي به علت داشتن لايه هاي كانولوشن و مخفي بيشتر در زمينه كار با ورودي هاي با ابعاد بالاتر مانند تصاوير داراي توانمندي بيشتري هستند. يك معضل جدي در آموزش يك شبكه عصبي كانولوشن با يادگيري عميق، به موضوع آموزش آنها از ابتدا باز مي گردد اين معضل ناشي از كمبود داده هاي طبقه بندي شده جهت آموزش و زمان بر بودن فرآيند آموزش تا يك همگرايي مناسب است. بنابراين يك روش متداول براي آموزش شبكه هاي عصبي كانولوشن بر روي داده هاي پزشكي، بر اساس باز تنظيم شبكه هاي از پيش آموزش يافته، مي باشد. برخي از مهمترين و نيرومندترين شبكه هاي عصبي كانولوشن كه بر روي بانك هاي اطلاعات تصاوير، نظير بانك اطلاعات تصاوير ImageNet با بيش از يك ميليون تصوير، آموزش ديده اند شامل شبكه سيفارنت (CifarNet)، الكسنت (AlexNet) و گوگلنت(GoogleNet) است. كه جهت بازتنظيم آنها در تشخيص تصاوير پزشكي با كاربردهاي خاص و با تعداد محدودي از تصاوير، مي توان بهره برد.
چكيده لاتين :
The field of medical image processing includes a wide range of applications from automated screening of diabetic retinopathy based on retinal images to MRI segmentation for tumor recognition. Various machine learning classification and clustering approaches have been studied in literature with the purpose of improving the accuracy of the screening methods. Some studies used manually feature extraction of fundus images by image processing experts. In recent years, a new approach for image classification and diagnosis without using any manual feature extraction is proposed based on convolutional neural network (CNN). The CNNs are based on deep learning concept have more convolutional and hidden layers and are more powerful envolving the high dimension inputs such as medical images. In medical imaging and diagnosis, training a deep CNN from scratch is difficult because it requires a large amount of labeled training data and the training procedure is a time consuming task to ensure proper convergence. Therefore, a very common method to train CNNs for medical diagnosis is fine-tuning a pre-trained CNN. Some of these powerful pre-trained CNNs are the GoogleNet, CifarNet and AlexNet which have been trained on the ImageNet as a a large databas