카테고리 없음

yolo-cls, yolo11 비교하기

chacha001 2024. 11. 25. 01:01

1. YOLO cls 모델 (YOLO Classify)

목적

  • 이미지 분류 (Image Classification): YOLO cls 모델은 객체를 탐지하는 대신, 이미지를 분류하는 데 사용됩니다. 입력 이미지를 받아 해당 이미지가 어떤 클래스에 속하는지 판단합니다.

특징

  • 이미지 분류 전용: 바운딩 박스와 객체 위치 정보를 예측하지 않고, 전체 이미지를 단일 클래스(또는 다중 클래스)로 분류합니다.
  • 전이 학습: YOLO cls 모델은 일반적으로 ImageNet 같은 대규모 데이터셋으로 사전 학습된 가중치를 사용하며, 이를 기반으로 새로운 데이터셋에 맞게 Fine-tuning 가능합니다.
  • 경량화된 구조: 분류 작업에 특화된 경량 모델 구조로 설계되어, 탐지 모델보다 간단하고 빠릅니다.

주요 사용 사례

  • 의료 이미지 분석: 예를 들어, X-ray 이미지가 '정상'인지 '이상'인지 분류.
  • 제품 이미지 분류: 이커머스에서 제품 사진을 카테고리별로 분류.
  • 감정 분류: 얼굴 이미지로 감정 상태를 분류.

 

 

2. YOLO-n 모델 (예: YOLO11n)

목적

  • 객체 탐지 (Object Detection): YOLO-n 모델은 이미지 내 객체의 위치(바운딩 박스)와 클래스 정보를 동시에 탐지하는 데 사용됩니다.

특징

    • n: Nano (최소 크기, 최소 파라미터)
    • s, m, l, x: 모델 크기와 성능에 따라 점점 커지고 복잡해지는 구조.
  • 실시간 성능: YOLO-n 모델은 경량화된 디자인 덕분에, 저사양 하드웨어(예: 모바일, 임베디드 시스템)에서도 실시간 객체 탐지가 가능합니다.

주요 사용 사례

  • 자율주행차: 차량과 사람 탐지.
  • 드론 비전: 장애물과 목표물 탐지.
  • IoT 카메라: 실시간 영상 분석 및 보안 시스템.

 

  YOLO cls  YOLO11n
목적 이미지 분류 객체 탐지
출력 클래스 레이블 바운딩 박스 좌표 + 클래스 레이블
구조 경량 분류 모델 경량 탐지 모델
주요 데이터셋 ImageNet 등 (분류 중심 데이터셋) MS COCO, Pascal VOC 등 (탐지 중심 데이터셋)
응용 분야 사진 카테고리 분류, 감정 분류 등 실시간 객체 탐지, 자율주행 등
모델 크기 (예: YOLO11n) 클수도 있고 작을 수도 있음 YOLO 모델 중 가장 작은 크기 (Nano)

 

 

전처리 차이점

  cls YOLO11n 
입력 크기 고정 크기 (224x224, 256x256 등) 고정 크기 (640x640, 416x416 등)
레이블 형식 클래스 레이블만 필요 (예: [0, 1, 2]) 클래스 + 바운딩 박스 좌표 필요 (예: [0, x, y, w, h])
데이터 증강 단순 회전, 크롭, 색상 조정 등 모자이크 증강, 랜덤 자르기, 이동 등 탐지 특화 증강
패딩 처리 일반적으로 사용되지 않음 비율 유지 패딩(Zero Padding) 추가
스케일링 목표 분류를 위한 클래스 중심 스케일링 탐지와 위치 예측을 위한 바운딩 박스와 레이블 정규화

4. 스케일링 차이점

 

 

그래프 해석

 

 

  • x축 (Recall):
    • 모델이 탐지해야 할 객체를 얼마나 잘 탐지했는지를 나타냅니다.
    • 값이 1에 가까울수록 모델이 대부분의 객체를 탐지했다는 의미입니다.
  • y축 (Precision):
    • 모델이 탐지한 객체 중에서 얼마나 많은 탐지가 정확한지를 나타냅니다.
    • 값이 1에 가까울수록 탐지가 정확하다는 뜻입니다.

mAP (Mean Average Precision)의 의미

  • 곡선 아래의 면적 (Area Under Curve, AUC):
    • mAP는 P-R 곡선 아래 면적을 나타냅니다.
    • 면적이 클수록 모델의 전반적인 성능이 좋다는 뜻입니다.
    • 높은 mAP는 모델이 Precision과 Recall 간의 균형을 잘 유지했다는 것을 의미합니다.