بهبود شناسایی اشیاء در شبکه‌ها‌ی عصبی کانولوشنی با بهره‌گیری از اطلاعات زمانی در توالی فریم‌های ویدئویی
Paper ID : 1030-MVIP2020
Authors:
hassan najafzade *1, سید علیرضا سیدین2
1none,none
2دانشکده مهندسی، دانشگاه فردوسی
Abstract:
شناسایی شیء یکی از زمینه‌های بینایی ماشین است که در حال حاضر به‌شدت مبتنی بر یادگیری ماشین است. در دهة گذشته، بخش عمده‌ای از یادگیری ماشین که تحت عنوان شبکه‌های عصبی عمیق نیز شناخته می‌شود با پیشرفت در توانایی محاسبات و دسترسی به داده، کاربردهای فراوانی داشته‌اند.یکی از زیرمجموعه‌های شبکه عصبی که برای وظایف مرتبط با تصویر مناسب است شبکه عصبی کانولوشنی نام دارد.این شبکه آموزش می‌بیند تا ویژگی‌های مختلف مانند لبه‌ها، گوشه‌ها و تفاوت‌های رنگ را در سراسر تصویر جستجو کند و آن‌ها را به شکل‌های پیچیده‌تر ترکیب کند. برای تشخیص شیء، سیستم باید مکان‌های اشیاء احتمالی را تخمین‌زده و طبقه‌بندی کند.شناسایی شیء با شبکه‌های کانولوشن هنوز هم به‌عنوان یک تکنولوژی در حال تکامل است، برخلاف دیگر روش‌های تشخیص که دیگر کاربرد چندانی ندارند. استفاده از اطلاعات زمانی در شبکه‌های کانولوشنی باعث افزایش دقت در طبقه‌بندی ‌می‌شود. در این مقاله با تغییر لایه‌های تماماً متصل شبکه‌های عصبی کانولوشنی و با بهره‌گیری از اطلاعات زمانی در توالی فریم‌هایی از ویدئو با استفاده از فیلتر کالمن عملکرد سیستم‌های شناسایی به‌طور قابل ملاحظه‌ای بهبود می‌یابد.با استفاده از این شبکه جدید و طبقه‌بند SVM به دقت 95.
Keywords:
بازشناسی شیء، شبکه عصبی کانولوشنی، شناسایی شی‌ء در ویدئو، فیلتر کالمن
Status : Paper Accepted (Poster Presentation)