عنوان مقاله :
شناسايي چهره بااستفاده از تنطيم دقيق شبكه هاي كانولوشني عميق و رويكرد يادگيري انتقالي
عنوان به زبان ديگر :
Face recognition using fine-tuning of Deep Convolutional Neural Network and transfer learning
پديد آورندگان :
راستگو، راضيه دانشگاه سمنان , كياني، كورش دانشگاه سمنان - دانشكده مهندسي برق و كامپيوتر
كليدواژه :
يادگيري عميق , شبكه كانولوشني عميق , تنظيم دقيق , شناسايي چهره , يادگيري انتقالي , كانولوشن معكوس
چكيده فارسي :
يادگيري عميق، يكي از رويكردهاي مورد توجه در يادگيري ماشين مي باشد كه شامل معماري هاي مهمي مي باشد. شبكه كانولوشني عميق، يكي از معماري هاي مورد توجه در يادگيري عميق مي باشد كه در پردازش هاي مربوط به تصاوير ديجيتالي كاربرد فراواني پيدا كرده است. در اين پژوهش، شبكه كانولوشني Alexnet، به منظور شناسايي چهره در عكس هاي ورودي، مورد استفاده قرار گرفته است. تنظيم دقيق مدل از قبل تعليم داده شده ي Alexnet، با تبديل لايه هاي كاملا متصل به لايه هاي كانولوشني و اعمال فيلتر هاي مناسب، انجام شده است. استفاده از برش هاي مختلف عكس ورودي و نيز افزايش تعداد لايه هاي كانولوشني به منظور استخراج خصوصيت هاي با سطح بالاتر به همراه فيلترهاي مناسب در مدل هاي پيشنهادي مورد توجه قرار گرفته است. به منظور تجسم اعمال فيلترها در لايه هاي مختلف، از روش كانولوشن معكوس استفاده شده است. از دو پايگاه داده ي Caltech face و LFW به منظور نشان دادن نتايج، استفاده شده است. پس از پردازش هاي لازم بر روي پايگاه داده هاي مورد استفاده، نتايح به دست آمده از شبكه Alexnet، قبل و بعد از تنظيم دقيق، مورد بررسي قرار گرفته است. نتايج بررسي، حاكي از بهبود عملكرد شبكه، تحت عمليات انجام شده، مي باشد.
چكيده لاتين :
Deep learning is one of the most important scopes of the Machine Learning that includes some important architectures. Deep Convolutional Neural Network is one of the attractive architectures that uses in digital image processing. In this paper, we use the Alexnet model for face recognition from input images. We fine-tune the Alexnet model by converting one or two fully connected layers to convolutional layers as well as using the suitable filters. To improve the robustness of the model in coping with the situations that some parts of the input images damaged, we use five crops of the input images including five pixel areas. Furthermore, to visualize the output of each layer, we use the Deconvolution technique in our method. The output of some convolutional and activation layers has been shown. Using this technique, we obtain the Heat-map of the image. To show the results, we use the LFW and Caltech faces datasets. After pre-processing the images of datasets, we compare the results of the Alexnet model in two states: before fine-tuning and after fine-tuning. The results show the recognition accuracy improvement of the fine-tuned models on input images.
عنوان نشريه :
مدل سازي در مهندسي