데이터 다듬기/데이터 다듬기

데이터프레임 간단한 메소드 정리

yumin630 2024. 9. 18. 17:34

 

데이터프레임관련 여러 메소드와 옵션, 속성 몇가지를 알아보자..

 

~목차~


head(): 상위 데이터 확인

tail(): 하위 데이터 확인

shape: 데이터프레임 크기

index: 인덱스 정보 확인

values: 값 정보 확인

columns: 열 정보 확인

dtypes: 열 자료형 확인

info(): 열에 대한 상세한 정보 확인

describe(): 기술통계정보 확인


 

 

head() 와 tail()은 전장에서 했음으로 생략하겟다.

 


 

 

크기확인 속성 - 데이터 양을 확인

df.shape

 

이렇게 데이터프레임명 뒤에 .shape를 입력하면 (rows, cols) 값을 갖는 튜플 형태로 출력되어 확인가능하다.

 

 

 

 

열, 행 정보 보기 - 인덱스 확인

df.index

 

.index를 입력하면 처음인덱스와 마지막 인덱스를 확인할 수 있고, step(인덱스 단위..?)를 알 수 있다.

 

 

 

열, 행 정보 보기 - 값 확인

df.values

 

.values를 입력하면 array 형태로 값을 확인할 수 있다.

 

 

 

열, 행 정보 보기 - 열 확인, 열 자료형 확인

# 열 확인
df.columns

# 열 자료형 확인
df.dtypes

# 열 자료형, 값 개수 확인
df.info()

 

.info()는 컬럼명과 컬럼별 개수, 타입들을 한번에 알 수 있다.

 

 

 

열, 행 정보 보기 - 기술 통계 확인

df.describe()

 

기술 통계는 정보들을 그냥 보여주는게 아니라 계산해서 보여준다.

개수(count), 평균(mean), 표준편차(std), 최솟값(min), 사분위값(25%, 50%, 75%), 최댓값(max)으로..

 

전체 컬럼이 아닌 일부만 선택해서 볼 수 있다.

df[['컬럼명1', '컬럼명2']].describe()

 

 

 

 

~끝~

'데이터 다듬기 > 데이터 다듬기' 카테고리의 다른 글

데이터프레임 메소드 정리2  (0) 2024.09.24
데이터프레임 변경하기  (3) 2024.09.22