2023.08.31 작성(https://sujungeee.github.io/posts/ai-DeepLearning-yolo-2/)
※ 본 포스팅은 인프런 “YOLO 구현으로 배우는 딥러닝 논문 구현 with TensorFlow 2.0” 을 참고하여 작성하였습니다.
✅ YOLO 모델 리뷰
YOLO이미지를 한 번만 보고 바로 Object Detection 수행
- YOLO 모델의 기본 컨셉이미지를 SXS Grid Cell 로 나누고 Grid Cell 별로 B 개의 Bounding Box 를 예측
- YOLO 모델의 최종 OutputS X S X (5*B + C)
- x: grid cell 내의 x 위치(0-1 사이의 값)
- y: grid cell 내의 y 위치(0-1 사이의 값)
- w: 전체 이미지 대비의 width(0-1 사이의 값)
- h: 전체 이미지 대비의 height(0-1 사이의 값)
- confidence: 이미지 내에 Object 가 있을 것이라고 확신하는 정도(0-1 사이의 값)
- S: Grid Cell SXS
- B: Bounding Box 의 개수
- C: Class 개수
→ 각 Class 는 Softmax Regression 확신의 정도를 나타냄
- 특징
- 정확성은 낮지만
- 속도(FPS) 는 향상
Bounding Box 개수: S X S X 2 개(의 20 dimension vector)
→ Non-Maximum Suppression
→ n 개의 Bounding Box 중 가장 대표성을 띄는 일부 Bounding Box 만 남겨짐
✅ Non-Maximum Suppression(NMS)
- Non-Maximum Suppressionn 개의 Bounding Box 중 필요한 부분만 남기는 선별 과정에 관련된 알고리즘
- 동작 과정
- confidence ≤ 0.6 이하의 Bounding Box 를 제거(threshold 는 임의 지정)
- class 별로 confidence 가 가장 높은 Bounding Box 가 앞으로 오도록 전체 Bounding Box 를 내림차순 정렬
- 가장 confidence 가 높은 Bounding Box 와 나머지 Bounding Box 를 비교해서 2 개의 Bounding Box 의 IoU ≥ 0.5 라면 confidence 가 작은 Bounding Box 를 제거confidence 가 큰 Bounding Box 가 confidence 가 작은 Bounding Box 를 포함하므로 대표성을 띄는 Bounding Box 만 남겨놓기
- 제거되지 않은 Bounding Box 중에서 confidence 가 가장 높은 Bounding Box 와 나머지 Bounding Box 간에 3번 과정을 반복
- 3,4 과정을 전체 Bounding Box 에 대해서 진행
- → score 가 0 이상인 Bounding Box 만을 남겨두어 draw
- 2,5 과정을 전체 class 에 대해서 진행
- 동작 과정
⇒ 대부분의 Object Detection 알고리즘의 마지막 Processing 과정에서 사용됨
✅ 일반적인 딥러닝 논문 구성 및 논문 읽는 법
- Abstract: 논문의 전체적인 컨셉을 요약 설명
- Introduction: 논문의 아이디어 전개 방식 등에 대한 설명
- Method: 논문의 기법에 대한 설명
- Model
- Loss
- Techniques: 새롭게 도입한 기술 설명
- Experiment: 논문의 기법의 성능에 대한 평가
- SOTA: 현재 가장 좋은 성능이라고 평가 받는 모델
- e.g) 논문에서의 이 모델이 Experiment 하였을 때 SOTA 이다 → 라는 뉘앙스의 전개 방식
- Conclusion: 논문의 내용을 정리 및 향후 연구 방향 제시
⇒ 읽는 순서: Abstract, Conclusion → Introduction, Experiment → Method
'AI' 카테고리의 다른 글
| [딥러닝] Yolo 논문 해설 (1) | 2025.03.02 |
|---|---|
| [딥러닝] Object Detection (0) | 2025.03.02 |
| [딥러닝] 섹션10: 모델 성능 개선 방법 (0) | 2025.03.02 |
| [딥러닝] 섹션9: Optical Character Recognition (0) | 2025.03.02 |
| [딥러닝] 섹션6-2: CRAFT, EAST 실습 진행 (0) | 2025.03.02 |