1. YOLO cls 모델 (YOLO Classify)
목적
- 이미지 분류 (Image Classification): YOLO cls 모델은 객체를 탐지하는 대신, 이미지를 분류하는 데 사용됩니다. 입력 이미지를 받아 해당 이미지가 어떤 클래스에 속하는지 판단합니다.
특징
- 이미지 분류 전용: 바운딩 박스와 객체 위치 정보를 예측하지 않고, 전체 이미지를 단일 클래스(또는 다중 클래스)로 분류합니다.
- 전이 학습: YOLO cls 모델은 일반적으로 ImageNet 같은 대규모 데이터셋으로 사전 학습된 가중치를 사용하며, 이를 기반으로 새로운 데이터셋에 맞게 Fine-tuning 가능합니다.
- 경량화된 구조: 분류 작업에 특화된 경량 모델 구조로 설계되어, 탐지 모델보다 간단하고 빠릅니다.
주요 사용 사례
- 의료 이미지 분석: 예를 들어, X-ray 이미지가 '정상'인지 '이상'인지 분류.
- 제품 이미지 분류: 이커머스에서 제품 사진을 카테고리별로 분류.
- 감정 분류: 얼굴 이미지로 감정 상태를 분류.
2. YOLO-n 모델 (예: YOLO11n)
목적
- 객체 탐지 (Object Detection): YOLO-n 모델은 이미지 내 객체의 위치(바운딩 박스)와 클래스 정보를 동시에 탐지하는 데 사용됩니다.
특징
-
- n: Nano (최소 크기, 최소 파라미터)
- s, m, l, x: 모델 크기와 성능에 따라 점점 커지고 복잡해지는 구조.
- 실시간 성능: YOLO-n 모델은 경량화된 디자인 덕분에, 저사양 하드웨어(예: 모바일, 임베디드 시스템)에서도 실시간 객체 탐지가 가능합니다.
주요 사용 사례
- 자율주행차: 차량과 사람 탐지.
- 드론 비전: 장애물과 목표물 탐지.
- IoT 카메라: 실시간 영상 분석 및 보안 시스템.
YOLO cls | YOLO11n | |
목적 | 이미지 분류 | 객체 탐지 |
출력 | 클래스 레이블 | 바운딩 박스 좌표 + 클래스 레이블 |
구조 | 경량 분류 모델 | 경량 탐지 모델 |
주요 데이터셋 | ImageNet 등 (분류 중심 데이터셋) | MS COCO, Pascal VOC 등 (탐지 중심 데이터셋) |
응용 분야 | 사진 카테고리 분류, 감정 분류 등 | 실시간 객체 탐지, 자율주행 등 |
모델 크기 (예: YOLO11n) | 클수도 있고 작을 수도 있음 | YOLO 모델 중 가장 작은 크기 (Nano) |
전처리 차이점
cls | YOLO11n | |
입력 크기 | 고정 크기 (224x224, 256x256 등) | 고정 크기 (640x640, 416x416 등) |
레이블 형식 | 클래스 레이블만 필요 (예: [0, 1, 2]) | 클래스 + 바운딩 박스 좌표 필요 (예: [0, x, y, w, h]) |
데이터 증강 | 단순 회전, 크롭, 색상 조정 등 | 모자이크 증강, 랜덤 자르기, 이동 등 탐지 특화 증강 |
패딩 처리 | 일반적으로 사용되지 않음 | 비율 유지 패딩(Zero Padding) 추가 |
스케일링 목표 | 분류를 위한 클래스 중심 스케일링 | 탐지와 위치 예측을 위한 바운딩 박스와 레이블 정규화 |
4. 스케일링 차이점
그래프 해석
- x축 (Recall):
- 모델이 탐지해야 할 객체를 얼마나 잘 탐지했는지를 나타냅니다.
- 값이 1에 가까울수록 모델이 대부분의 객체를 탐지했다는 의미입니다.
- y축 (Precision):
- 모델이 탐지한 객체 중에서 얼마나 많은 탐지가 정확한지를 나타냅니다.
- 값이 1에 가까울수록 탐지가 정확하다는 뜻입니다.
mAP (Mean Average Precision)의 의미
- 곡선 아래의 면적 (Area Under Curve, AUC):
- mAP는 P-R 곡선 아래 면적을 나타냅니다.
- 면적이 클수록 모델의 전반적인 성능이 좋다는 뜻입니다.
- 높은 mAP는 모델이 Precision과 Recall 간의 균형을 잘 유지했다는 것을 의미합니다.