저번에 1편에 이어 더 해야겠다!!!
정렬
- 인덱스를 기준으로 정렬하는 방법과 특정 열을 기준으로 정렬하는 방법이 있다.
- sort_values() 메서드로 특정 열을 기준으로 정렬합니다.
- ascending 옵션을 설정해 오름차순, 내림차순을 설정할 수 있습니다.
- ascending=True: 오름차순 정렬(기본값)
- ascending=False: 내림차순 정렬
# 단일 열 정렬
tip.sort_values(by='total_bill', ascending=False)
# 복합 열 정렬
tip.sort_values(by=['total_bill', 'tip'], ascending=[False, False])
기본 집계
- 고윳값, 최빈값, 합, 평균, 최댓값, 최솟값 등을 확인하는 방법
# day 열 고윳값 확인
tip['day'].unique()
# day 열 고윳값 개수 확인
tip['day'].value_counts()
unique()를 사용하면 day열에 무슨 종류의 값이 있는지 배열 형태로 출력된다.
그 고윳값 마다의 개수를 확인하려면 value_counts()를 이용하면 된다
# day 열 최빈값 확인
tip['day'].mode()
# day 열 최빈값 확인
tip['day'].mode()
# 전체 행 기준 합
df.sum(axis=1)
# 전체 행 기준 합
df.sum(axis=1)
# total_bill, tip 열 평균값 확인
tip[['total_bill', 'tip']].mean()
# total_bill, tip 열 중앙값 확인
tip[['total_bill', 'tip']].median()
'데이터 다듬기 > 데이터 다듬기' 카테고리의 다른 글
데이터프레임 변경하기 (3) | 2024.09.22 |
---|---|
데이터프레임 간단한 메소드 정리 (1) | 2024.09.18 |