티스토리 뷰

[업데이트 2018.09.27 14:15] 


1. 베이스 논문 

[논문 요약 40] Traffic-sign detection and classification in the wild 

(http://arclab.tistory.com/205


2. 베이스 논문을 인용한 논문 

A Real-Time Chinese Traffic Sign Detection Algorithm Based on Modified YOLOv2

(http://www.mdpi.com/1999-4893/10/4/127


3. 주요 내용 요약 

3.1. 연구 내용 파악

- 무엇에 관한 연구인가?

Computer vision분야의 object detection에 대한 연구이며, Chinese traffic sign detection 알고리즘에 대해 제안하고 있으며, real-time으로 Chinese traffic sign detection 하기 위해 YOLOv2기반의 end-to-end deep convolutional network를 제안합니다.


- 주요 내용의 순서와 전체적인 구성

Abstract -> Introduction -> Related Work -> The Chinese Traffic Sign Detection Algorithm Based on Modified YOLOv2(제안된 방법) -> Experimental Analysis -> Conclusion순으로 논문의 내용이 구성됩니다.


- Research Question

실시간으로 중국 교통 표지판 검출을 위한 방법.


3.2. 연구 내용 해석

- 중요한 문장을 통해 저자가 제시하는 주요 명제 찾기

In this paper, to achieve real-time traffic sign detection on Chinese roads, we expanded the CTSD by adding new images and transforming images. The expanded CTSD is also called Changsha University of Science and Technology Chinese traffic sign detection benchmark (CCTSDB). More importantly, we propose an end-to-end convolutional network for Chinese traffic sign detection inspired by YOLOv2 [7], which is a unified detection model without a complex processing pipeline.


본 논문에서는 실시간으로 중국 도로에서 존재하는 교통표지판 검출을 위해 CTSD 데이터셋을 기반으로 새로운 CCTSDB 데이터셋을 제안하며, YOLOv2기반으로 네트워크 구조를 변경하여 새로운 모델을 제안합니다.


- 저자의 논증을 찾고 구성해보기

본 논문에서는 기존 VOC 데이터셋과 다르게 중국 교통 표지판의 경우 검출할 교통 표지판의 크기가 전체 이미지 대비 아주 작은 비중을 차지 하고 있는 특성 가지고 있습니다. 이러한 점을 고려하여 신경망 네트워크를 디자인하였습니다. 모델 A,B,C 3가지를 제안하고 있으며, 각 모델별 연구 결과는 다음과 같습니다.


A모델: top layer에서 반복되는 convolutional layers는 Chinese traffic sign detection에 비효율적임을 발견하였습니다. 사람과 배의 차이처럼 교통표지판 3가지 카테고리의 경우 서로의 차이가 명확하기 않기 때문입니다. 따라서 반복되는 convolutional layers 개수를 top layer에서 줄이게 됩니다. 또한 입력 사이즈 및 그리드 사이즈를 CCTSDB 맞게 수정합니다. (입력 사이즈 608x608, 그리드 사이즈 19x19)


B모델: B모델의 경우 channel정보를 최대한 사용하도록 3x3 convolution 다음 위치에 1x1 convolution 추가 하였습니다. 이렇게 시도함으로써 파라메터 개수를 줄이고, 처리 속도를 향상 시킬 수 있었습니다. 결국 B모델이 가능 좋은 성능을 보여주게 됩니다.


C모델: intermediate와 top layer를 결합합니다. intermediate layer의 feature map의 경우 구체적인 정보를 포함하고, top layer의 경우 추상적인 정보를 포함합니다. 본 논문에서는 response area를 통합하기 위해 max-pooling layer로 나눈 feature map의 네 번째 및 다섯 번째 섹션을 final output map에 결합했습니다.


- 저자가 풀어낸 문제와 풀지 못한 문제 구분/저자도 알고 있는지?

본 논문에서는 CCSTDB를 개선할 계획이며, 더 높은 해상도의 이미지 및 비디오를 활용하고, small traffic sign detection에 맞게 추가로 네트워크 구조를 개선할 예정입니다.


3.3. 연구 내용 비평

- 저자의 분석이나 설명이 불완전한 부분 제시

N/A


- 논리적이지 못한 부분 제시

N/A


- 저자가 잘못 알고 있거나 알지 못하는 부분 제시

N/A


* 참고

[1] http://www.mdpi.com/1999-4893/10/4/127

댓글
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2024/05   »
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31
글 보관함