DNN/컴퓨터 비전

7) SPP( Spatial Pyramid Pooling) Net

Return 2021. 8. 16. 13:11

RCNN의 주요 문제점 보완 

 

-RCNN 개선 방안 

2000개의 Region Proposal 이미지를 CNN을 Feature Extraction 하지말고 원본이미지만 Feature Map 생성뒤에 원본이미지의 Selective Search로 추진된 영역의 이미지만 Feature Map으로 매핑하여 별도 추출 

 

개선방안 문제점 

> CNN은 서로다른 size의 이미지를 수용하지 않는데 Flatten Fully Connection Input의 크기가 고정되어야 하기 때문 

 

서로다른 크기의 Region Proposal 이미지 개선방안 

 > 서로다른 사이즈의 Region Proposal 이미지를 SPP Net의 고정된 크기 vector로 변환하여 FC에 1D Flattened된 input 제공 

 

# SPP(  Spatial Pyramid Pooling)

 > CNN Image classification에서 서로다른 이미지 크기를 고정된 크기로 변환하는 기법

 

SPP는 spatial pyramid matching 기법에 근간을 둠 

 

# Spatial Pyramid Matching 

 > Bag of visual words 

 

매핑정보를 histogram화. 문제점 > object의 위치가 중요할때 ?

 

다음과 같이 이미지를 분할해 히스토그램화.

 

 

SPM으로 서로다른 크기의 Feature Map을 균일한 크기의 vector 표현 

 "어차피 분면으로 나누기때문에 feature map의 크기와 상관이 없다."

 

 

# Spatial Pyramid Pooling

 

# SPP Net  - Image Classification 

 

 - Object Detection 

 

- SPP Net RCNN 적용 

 

# SPP Net  / RCNN 비교