عنوان مقاله :
شناسايي رويداد در ويديو با استفاده از شبكه عصبي عميق بهينه
پديد آورندگان :
زنگنه ، اميرحسين دانشگاه آزاد اسلامي واحد تهران شمال - دانشكده مهندسي برق و كامپيوتر , چمپور ، مهدي دانشگاه صنعتي قوچان - دانشكده مهندسي كامپيوتر , لايقي ، كامران دانشگاه آزاد اسلامي واحد تهران شمال - دانشكده مهندسي برق و كامپيوتر
كليدواژه :
تشخيص رويداد , رويدادهاي مهم بازي فوتبال , شبكه عصبي عميق دنسنت , يادگيري عميق , خلاصهسازي ويديو
چكيده فارسي :
يادگيري عميق به عنوان يكي از تكنيكهاي يادگيري ماشين، از پيشرفتهاي فناوري واحدهاي پردازش گرافيكي استفاده كرده و اين امر به نوبه خود استفاده گسترده از آن را فراهم آورده است. تكنيكهاي يادگيري عميق به نتايج بسيار خوبي در بسياري از مسائل مهم از جمله شناسايي و تشخيص رويداد در ويديوي ورزش فوتبال، در مقايسه با روشهاي سنتي دست يافتهاند. يكي از چالش هاي عمده استفاده از شبكههاي عصبي عميق براي مديريت و طبقه بندي تصاوير، تعداد بسيار زياد پارامترهاي قابل آموزش در اين نوع شبكهها است كه منجر به بار محاسباتي بالا و زمان طولاني براي آموزش شبكه عصبي عميق ميشود.شبكه عصبي دنسنت يكي از آخرين شبكههاي ارائه شده براي اهداف شناسايي و تشخيص اشياء هست. ما در اين مقاله از شبكه عصبي عميق دنسنت براي شناسايي و تشخيص رويدادهاي كارت زرد و قرمز، پنالتي و ضربه آزاد در ويديوي ورزش فوتبال به عنوان يك معماري پايه استفاده كردهايم. تعداد و اندازه بلوكهاي شبكه دنسنت در تعداد پارامترهاي قابل آموزش و همچنين دقت شبكه تاثير گذار است. در اين مقاله ما سعي كردهايم با ايجاد تغيير در معماري پايه شبكه عصبي عميق دنسنت با حفظ دقت، تعداد پارامترهاي قابل آموزش اين شبكه را كاهش دهيم. براي اين منظور با بررسي حالتهاي ممكن براي قرار گيري بلوكهاي با سايز مختلف شبكه دنسنت اقدام به ارائه يك معماري پيشنهادي براي شبكه عصبي عميق كردهايم. نتايج ارزيابيها، نشاندهنده كاهش تعداد پارامترهاي قابل آموزش شبكه عصبي عميق و در عين حال افزايش دقت معماري پيشنهادي براي شناسايي و تشخيص رويدادهاي مهم در ورزش فوتبال است
عنوان نشريه :
علوم رايانش و فناوري اطلاعات
عنوان نشريه :
علوم رايانش و فناوري اطلاعات