JUST GO

[08] 판다스 데이터프레임 변경 (3) 본문

카테고리 없음

[08] 판다스 데이터프레임 변경 (3)

root_go 2023. 8. 23. 13:43

7.데이터프레임 변경 (3)

# 라이브러리 불러오기

7.1.데이터프레임 합치기(Concat)

  • concat() 함수를 사용해 인덱스 값을 기준으로 두 데이터프레임을 가로 또는 세로로 합칠 수 있습니다.

7.1.1.가로로 합치기

  • axis=1 옵션을 지정해 가로로 합칠 수 있습니다.

2) 데이터프레임 합치기

  • 이제 concat() 함수를 사용해 두 데이터프레임을 합쳐봅니다.
  • 가로로 합치므로 axis=1 옵션을 지정합니다.
  • join='outer' 는 기본 옵션값이므로 생략이 가능합니다.
# 모든 행 합치기
pop = pd.concat([pop01, pop02], join='outer', axis=1)

# 확인
pop.head(10)
  • pop02 데이터프레임에는 1981~1984년 데이터가 없어 합쳐진 결과에 결측치가 생깁니다.
  • join='inner' 옵션을 지정하면 매핑되지 못한 행은 제외됩니다.
# 모든 행 합치기
pop = pd.concat([pop01, pop02], join='inner', axis=1)

# 확인
pop.head(10)

2) 데이터프레임 합치기

  • 이제 concat() 함수를 사용해 두 데이터프레임을 합쳐봅니다.
  • 세로로 합치므로 axis=0 옵션을 지정하거나 생략합니다.
# 모든 행 합치기
pop = pd.concat([pop01, pop02], axis=0)

# 확인
pop.head()
  • 세로로 합해지면 인덱스 값이 중복될 수 있으므로 인덱스를 초기화합니다.

7.2.데이터프레임 조인(Merge)

  • merge() 함수를 사용 두 데이터프레임을 지정한 키 값을 기준으로 병합할 수 있습니다.

 

7.2.1

 

7.2.2.inner 조인

  • 같은 이름의 열이 있으면 on 옵션을 지정하지 않아도 그 열을 기준으로 조언됩니다.
  • 그래도 기준 열을 명시적으로 지정해 주기를 권고합니다.
  • how='inner' 옵션은 기본 옵션값이므로 생략할 수 있습니다.
# 조인
pop = pd.merge(pop01, pop02, on='year', how='inner')

# 확인
pop02.head(10)

7.2.3.outer 조인

  • how='outer' 옵션을 지정합니다.
# 조인
pop = pd.merge(pop01, pop02, on='year', how='outer')

# 확인
pop.head(10)