티스토리 뷰
[논문 요약39] [23] H. Li, Z. Lin, X. Shen, J. Brandt, and G. Hua. A convolutional neural network cascade for face detection. In CVPR, pages 5325–5334, 2015. 1
Arc Lab. 2018. 9. 22. 20:30[업데이트 2018.09.24 14:29]
1. 베이스 논문
[논문 요약17] Perceptual Generative Adversarial Networks for Small Object Detection
(http://arclab.tistory.com/172)
2. 레퍼런스 논문
[23] H. Li, Z. Lin, X. Shen, J. Brandt, and G. Hua. A convolutional neural network cascade for face detection. In CVPR, pages 5325–5334, 2015. 1
(http://users.eecs.northwestern.edu/~xsh835/assets/cvpr2015_cascnn.pdf)
Some efforts [4, 25, 18, 39, 23, 1] have been devoted to addressing small object detection problems.
Some others [39, 23, 1] focus on developing network variants to generate multi-scale representation which enhances high-level small-scale features with multiple lower-level features layers.
3. 주요 내용 요약
3.1 레퍼런스 논문 주요 내용
- 연구 배경
얼굴 검출은 컴퓨터 비전에서 잘 연구된 문제중 하나 입니다. 현대의 얼굴 검출기는 정면 근처의 얼굴을 쉽게 감지 할 수 있습니다. 이 분야의 최근 연구는 포즈 변경, 과장된 표현 및 극단적인 조명과 같은 여러 요인이 얼굴 모양에 큰 시각적 변화를 초래할 수 있고 얼굴 검출기의 성능을 심각하게 저하 시킬 수 있는 요소에 더 초점을 둡니다.
- 당면 과제
얼굴 검출의 경우 복잡한 배경에서 얼굴의 시각적 변형이 크거나, 검출 하려는 얼굴 위치 및 크기를 검색하는 공간이 큰 경우 검출 시간이 오래 걸릴 수 있습니다.
- 연구 당위성얼굴 탐지의 어려움은 크게 두 가지 측면에서 비롯됩니다.
1) 복잡한 배경에서 얼굴의 시각적 변형이 큰 경우.
2) 가능한 얼굴 위치 및 얼굴 크기의 큰 검색 공간.
전자의 경우에는 얼굴 검출기가 이진 분류 문제를 정확하게 처리 할 것을 요구하지만, 후자의 경우에는 검출 시간의 효율성에 중점을 둡니다.
- 연구 문제
얼굴을 검출시 빠른 검출을 어렵게 하는 요소.
- 연구 중요성
본 연구를 통해 얼굴 빠르고 정확한 검출을 필요로 하는 응용 프로그램에 활용될 수 있습니다.
- 제안된 방법
본 연구에서는 빠른 얼굴 검출을 위해 CNN cascade 모델을 제안합니다. 본 방법은 저해상도에서 입력 이미지를 평가하여 비 얼굴 영역(background)을 신속하게 제거하고, 정확한 검출을 위해 고해상도에서는 얼굴의 후보 영역을 신중하게 처리후 선정합니다. 또한 검출 속도를 향상시키고, 보다 정확한 bounding box 검출을 위해 Calibration nets 제안합니다.
- 연구 결과
제안 된 방법은 CNN의 장점을 공유하여 큰 시각적 변화에 강합니다. 공개 되어 있는 face detection benchmark FDDB 데이터셋에서 기존의 최첨단 방법들보다 성능이 우수합니다. 제안 된 검출기는 매우 빠르며, VGA 이미지에 대해 CPU에서 처리시 14FPS, GPU 사용시 100FPS의 처리 성능을 보여주었습니다.
3.2 베이스 논문에서 인용한 내용
- Small object detection의 성능 향상을 시도하였으나, Perceptual Generative Adversarial Networks for Small Object Detection 논문에서는 본 논문의 방법은 data augmentation이나 간단히 feature의 차원을 늘리는 방법으로 성능 향상을 시도하여 computational cost가 training/testing시 증가하는 단점이 있다고 이야기 하고 있습니다. 또한 low-level feature로부터 multi-scale representation을 통한 성능 향상 방법은 object detection시 한계가 있다고 말하고 있습니다.
- 아래와 같이 유사한 방법(multi-scale representation + skip pooling)이 사용되었습니다.
- Total
- Today
- Yesterday
- 2D Game
- English
- Jekyll and Hyde
- #TensorFlow
- #ELK Stack
- Mask R-CNN
- #ApacheSpark
- OST
- ate
- Sea Bottom
- Meow
- belief
- GOD
- docker
- aws #cloudfront
- #ApacheZeppelin
- Worry
- some time ago
- Ragdoll
- Physical Simulation
- Memorize
- Game Engine
- Library
- 도커
- sentence test
- Badge
- ILoop Engine
- project
- SSM
- #REST API
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |