데이터프레임관련 여러 메소드와 옵션, 속성 몇가지를 알아보자..
~목차~
head(): 상위 데이터 확인
tail(): 하위 데이터 확인
shape: 데이터프레임 크기
index: 인덱스 정보 확인
values: 값 정보 확인
columns: 열 정보 확인
dtypes: 열 자료형 확인
info(): 열에 대한 상세한 정보 확인
describe(): 기술통계정보 확인
head() 와 tail()은 전장에서 했음으로 생략하겟다.
크기확인 속성 - 데이터 양을 확인
df.shape
이렇게 데이터프레임명 뒤에 .shape를 입력하면 (rows, cols) 값을 갖는 튜플 형태로 출력되어 확인가능하다.
열, 행 정보 보기 - 인덱스 확인
df.index
.index를 입력하면 처음인덱스와 마지막 인덱스를 확인할 수 있고, step(인덱스 단위..?)를 알 수 있다.
열, 행 정보 보기 - 값 확인
df.values
.values를 입력하면 array 형태로 값을 확인할 수 있다.
열, 행 정보 보기 - 열 확인, 열 자료형 확인
# 열 확인
df.columns
# 열 자료형 확인
df.dtypes
# 열 자료형, 값 개수 확인
df.info()
.info()는 컬럼명과 컬럼별 개수, 타입들을 한번에 알 수 있다.
열, 행 정보 보기 - 기술 통계 확인
df.describe()
기술 통계는 정보들을 그냥 보여주는게 아니라 계산해서 보여준다.
개수(count), 평균(mean), 표준편차(std), 최솟값(min), 사분위값(25%, 50%, 75%), 최댓값(max)으로..
전체 컬럼이 아닌 일부만 선택해서 볼 수 있다.
df[['컬럼명1', '컬럼명2']].describe()
~끝~
'데이터 다듬기 > 데이터 다듬기' 카테고리의 다른 글
데이터프레임 메소드 정리2 (0) | 2024.09.24 |
---|---|
데이터프레임 변경하기 (3) | 2024.09.22 |