데이터 다듬기/데이터 다듬기

데이터프레임 메소드 정리2

chacha001 2024. 9. 24. 01:03

 

저번에 1편에 이어 더 해야겠다!!!

 

정렬

 

- 인덱스를 기준으로 정렬하는 방법과 특정 열을 기준으로 정렬하는 방법이 있다.

  • sort_values() 메서드로 특정 열을 기준으로 정렬합니다.
  • ascending 옵션을 설정해 오름차순, 내림차순을 설정할 수 있습니다.
    • ascending=True: 오름차순 정렬(기본값)
    • ascending=False: 내림차순 정렬

 

 

# 단일 열 정렬
tip.sort_values(by='total_bill', ascending=False)

# 복합 열 정렬
tip.sort_values(by=['total_bill', 'tip'], ascending=[False, False])

 

 

 

기본 집계

- 고윳값, 최빈값, 합, 평균, 최댓값, 최솟값 등을 확인하는 방법

 

# day 열 고윳값 확인
tip['day'].unique()

# day 열 고윳값 개수 확인
tip['day'].value_counts()

 

unique()를 사용하면 day열에 무슨 종류의 값이 있는지 배열 형태로 출력된다. 

그 고윳값 마다의 개수를 확인하려면 value_counts()를 이용하면 된다

 

 

# day 열 최빈값 확인
tip['day'].mode()

# day 열 최빈값 확인
tip['day'].mode()

# 전체 행 기준 합
df.sum(axis=1)

# 전체 행 기준 합
df.sum(axis=1)

# total_bill, tip 열 평균값 확인
tip[['total_bill', 'tip']].mean()

# total_bill, tip 열 중앙값 확인
tip[['total_bill', 'tip']].median()