7 분 소요

[Notice] [pandas_pactice_2]

DataFrame load

import pandas as pd
import numpy as np
df = pd.read_csv('https://bit.ly/ds-korean-idol')
df2 = pd.read_csv('https://bit.ly/ds-korean-idol-2')
df
이름 그룹 소속사 성별 생년월일 혈액형 브랜드평판지수
0 지민 방탄소년단 빅히트 남자 1995-10-13 173.6 A 10523260
1 지드래곤 빅뱅 YG 남자 1988-08-18 177.0 A 9916947
2 강다니엘 NaN 커넥트 남자 1996-12-10 180.0 A 8273745
3 방탄소년단 빅히트 남자 1995-12-30 178.0 AB 8073501
4 화사 마마무 RBW 여자 1995-07-23 162.1 A 7650928
5 정국 방탄소년단 빅히트 남자 1997-09-01 178.0 A 5208335
6 민현 뉴이스트 플레디스 남자 1995-08-09 182.3 O 4989792
7 소연 아이들 큐브 여자 1998-08-26 NaN B 4668615
8 방탄소년단 빅히트 남자 1992-12-04 179.2 O 4570308
9 하성운 핫샷 스타크루이엔티 남자 1994-03-22 167.1 A 4036489
10 태연 소녀시대 SM 여자 1989-03-09 NaN A 3918661
11 차은우 아스트로 판타지오 남자 1997-03-30 183.0 B 3506027
12 백호 뉴이스트 플레디스 남자 1995-07-21 175.0 AB 3301654
13 JR 뉴이스트 플레디스 남자 1995-06-08 176.0 O 3274137
14 슈가 방탄소년단 빅히트 남자 1993-03-09 174.0 O 2925442
df2
이름 연봉 가족수
0 지민 3000 3
1 지드래곤 3500 3
2 강다니엘 3200 4
3 3050 4
4 화사 4300 3
5 정국 2900 5
6 민현 3400 6
7 소연 4500 5
8 4200 4
9 하성운 4300 4
10 태연 3700 3
11 차은우 3850 5
12 백호 3900 4
13 JR 4100 3
14 슈가 4150 3
df_copy = df.copy()
pd.concat([df, df_copy], sort = False)
이름 그룹 소속사 성별 생년월일 혈액형 브랜드평판지수
0 지민 방탄소년단 빅히트 남자 1995-10-13 173.6 A 10523260
1 지드래곤 빅뱅 YG 남자 1988-08-18 177.0 A 9916947
2 강다니엘 NaN 커넥트 남자 1996-12-10 180.0 A 8273745
3 방탄소년단 빅히트 남자 1995-12-30 178.0 AB 8073501
4 화사 마마무 RBW 여자 1995-07-23 162.1 A 7650928
5 정국 방탄소년단 빅히트 남자 1997-09-01 178.0 A 5208335
6 민현 뉴이스트 플레디스 남자 1995-08-09 182.3 O 4989792
7 소연 아이들 큐브 여자 1998-08-26 NaN B 4668615
8 방탄소년단 빅히트 남자 1992-12-04 179.2 O 4570308
9 하성운 핫샷 스타크루이엔티 남자 1994-03-22 167.1 A 4036489
10 태연 소녀시대 SM 여자 1989-03-09 NaN A 3918661
11 차은우 아스트로 판타지오 남자 1997-03-30 183.0 B 3506027
12 백호 뉴이스트 플레디스 남자 1995-07-21 175.0 AB 3301654
13 JR 뉴이스트 플레디스 남자 1995-06-08 176.0 O 3274137
14 슈가 방탄소년단 빅히트 남자 1993-03-09 174.0 O 2925442
0 지민 방탄소년단 빅히트 남자 1995-10-13 173.6 A 10523260
1 지드래곤 빅뱅 YG 남자 1988-08-18 177.0 A 9916947
2 강다니엘 NaN 커넥트 남자 1996-12-10 180.0 A 8273745
3 방탄소년단 빅히트 남자 1995-12-30 178.0 AB 8073501
4 화사 마마무 RBW 여자 1995-07-23 162.1 A 7650928
5 정국 방탄소년단 빅히트 남자 1997-09-01 178.0 A 5208335
6 민현 뉴이스트 플레디스 남자 1995-08-09 182.3 O 4989792
7 소연 아이들 큐브 여자 1998-08-26 NaN B 4668615
8 방탄소년단 빅히트 남자 1992-12-04 179.2 O 4570308
9 하성운 핫샷 스타크루이엔티 남자 1994-03-22 167.1 A 4036489
10 태연 소녀시대 SM 여자 1989-03-09 NaN A 3918661
11 차은우 아스트로 판타지오 남자 1997-03-30 183.0 B 3506027
12 백호 뉴이스트 플레디스 남자 1995-07-21 175.0 AB 3301654
13 JR 뉴이스트 플레디스 남자 1995-06-08 176.0 O 3274137
14 슈가 방탄소년단 빅히트 남자 1993-03-09 174.0 O 2925442
df_concat = pd.concat([df, df_copy], sort = False)
df_concat.reset_index(drop = True)
이름 그룹 소속사 성별 생년월일 혈액형 브랜드평판지수
0 지민 방탄소년단 빅히트 남자 1995-10-13 173.6 A 10523260
1 지드래곤 빅뱅 YG 남자 1988-08-18 177.0 A 9916947
2 강다니엘 NaN 커넥트 남자 1996-12-10 180.0 A 8273745
3 방탄소년단 빅히트 남자 1995-12-30 178.0 AB 8073501
4 화사 마마무 RBW 여자 1995-07-23 162.1 A 7650928
5 정국 방탄소년단 빅히트 남자 1997-09-01 178.0 A 5208335
6 민현 뉴이스트 플레디스 남자 1995-08-09 182.3 O 4989792
7 소연 아이들 큐브 여자 1998-08-26 NaN B 4668615
8 방탄소년단 빅히트 남자 1992-12-04 179.2 O 4570308
9 하성운 핫샷 스타크루이엔티 남자 1994-03-22 167.1 A 4036489
10 태연 소녀시대 SM 여자 1989-03-09 NaN A 3918661
11 차은우 아스트로 판타지오 남자 1997-03-30 183.0 B 3506027
12 백호 뉴이스트 플레디스 남자 1995-07-21 175.0 AB 3301654
13 JR 뉴이스트 플레디스 남자 1995-06-08 176.0 O 3274137
14 슈가 방탄소년단 빅히트 남자 1993-03-09 174.0 O 2925442
15 지민 방탄소년단 빅히트 남자 1995-10-13 173.6 A 10523260
16 지드래곤 빅뱅 YG 남자 1988-08-18 177.0 A 9916947
17 강다니엘 NaN 커넥트 남자 1996-12-10 180.0 A 8273745
18 방탄소년단 빅히트 남자 1995-12-30 178.0 AB 8073501
19 화사 마마무 RBW 여자 1995-07-23 162.1 A 7650928
20 정국 방탄소년단 빅히트 남자 1997-09-01 178.0 A 5208335
21 민현 뉴이스트 플레디스 남자 1995-08-09 182.3 O 4989792
22 소연 아이들 큐브 여자 1998-08-26 NaN B 4668615
23 방탄소년단 빅히트 남자 1992-12-04 179.2 O 4570308
24 하성운 핫샷 스타크루이엔티 남자 1994-03-22 167.1 A 4036489
25 태연 소녀시대 SM 여자 1989-03-09 NaN A 3918661
26 차은우 아스트로 판타지오 남자 1997-03-30 183.0 B 3506027
27 백호 뉴이스트 플레디스 남자 1995-07-21 175.0 AB 3301654
28 JR 뉴이스트 플레디스 남자 1995-06-08 176.0 O 3274137
29 슈가 방탄소년단 빅히트 남자 1993-03-09 174.0 O 2925442
df2
이름 연봉 가족수
0 지민 3000 3
1 지드래곤 3500 3
2 강다니엘 3200 4
3 3050 4
4 화사 4300 3
5 정국 2900 5
6 민현 3400 6
7 소연 4500 5
8 4200 4
9 하성운 4300 4
10 태연 3700 3
11 차은우 3850 5
12 백호 3900 4
13 JR 4100 3
14 슈가 4150 3
pd.concat([df, df2], axis = 1)
이름 그룹 소속사 성별 생년월일 혈액형 브랜드평판지수 이름 연봉 가족수
0 지민 방탄소년단 빅히트 남자 1995-10-13 173.6 A 10523260 지민 3000 3
1 지드래곤 빅뱅 YG 남자 1988-08-18 177.0 A 9916947 지드래곤 3500 3
2 강다니엘 NaN 커넥트 남자 1996-12-10 180.0 A 8273745 강다니엘 3200 4
3 방탄소년단 빅히트 남자 1995-12-30 178.0 AB 8073501 3050 4
4 화사 마마무 RBW 여자 1995-07-23 162.1 A 7650928 화사 4300 3
5 정국 방탄소년단 빅히트 남자 1997-09-01 178.0 A 5208335 정국 2900 5
6 민현 뉴이스트 플레디스 남자 1995-08-09 182.3 O 4989792 민현 3400 6
7 소연 아이들 큐브 여자 1998-08-26 NaN B 4668615 소연 4500 5
8 방탄소년단 빅히트 남자 1992-12-04 179.2 O 4570308 4200 4
9 하성운 핫샷 스타크루이엔티 남자 1994-03-22 167.1 A 4036489 하성운 4300 4
10 태연 소녀시대 SM 여자 1989-03-09 NaN A 3918661 태연 3700 3
11 차은우 아스트로 판타지오 남자 1997-03-30 183.0 B 3506027 차은우 3850 5
12 백호 뉴이스트 플레디스 남자 1995-07-21 175.0 AB 3301654 백호 3900 4
13 JR 뉴이스트 플레디스 남자 1995-06-08 176.0 O 3274137 JR 4100 3
14 슈가 방탄소년단 빅히트 남자 1993-03-09 174.0 O 2925442 슈가 4150 3

To merge

df
이름 그룹 소속사 성별 생년월일 혈액형 브랜드평판지수
0 지민 방탄소년단 빅히트 남자 1995-10-13 173.6 A 10523260
1 지드래곤 빅뱅 YG 남자 1988-08-18 177.0 A 9916947
2 강다니엘 NaN 커넥트 남자 1996-12-10 180.0 A 8273745
3 방탄소년단 빅히트 남자 1995-12-30 178.0 AB 8073501
4 화사 마마무 RBW 여자 1995-07-23 162.1 A 7650928
5 정국 방탄소년단 빅히트 남자 1997-09-01 178.0 A 5208335
6 민현 뉴이스트 플레디스 남자 1995-08-09 182.3 O 4989792
7 소연 아이들 큐브 여자 1998-08-26 NaN B 4668615
8 방탄소년단 빅히트 남자 1992-12-04 179.2 O 4570308
9 하성운 핫샷 스타크루이엔티 남자 1994-03-22 167.1 A 4036489
10 태연 소녀시대 SM 여자 1989-03-09 NaN A 3918661
11 차은우 아스트로 판타지오 남자 1997-03-30 183.0 B 3506027
12 백호 뉴이스트 플레디스 남자 1995-07-21 175.0 AB 3301654
13 JR 뉴이스트 플레디스 남자 1995-06-08 176.0 O 3274137
14 슈가 방탄소년단 빅히트 남자 1993-03-09 174.0 O 2925442
df2
이름 연봉 가족수
0 지민 3000 3
1 지드래곤 3500 3
2 강다니엘 3200 4
3 3050 4
4 화사 4300 3
5 정국 2900 5
6 민현 3400 6
7 소연 4500 5
8 4200 4
9 하성운 4300 4
10 태연 3700 3
11 차은우 3850 5
12 백호 3900 4
13 JR 4100 3
14 슈가 4150 3
pd.merge(df, df2, on = '이름', how = 'right')
이름 그룹 소속사 성별 생년월일 혈액형 브랜드평판지수 연봉 가족수
0 지민 방탄소년단 빅히트 남자 1995-10-13 173.6 A 10523260 3000 3
1 지드래곤 빅뱅 YG 남자 1988-08-18 177.0 A 9916947 3500 3
2 강다니엘 NaN 커넥트 남자 1996-12-10 180.0 A 8273745 3200 4
3 방탄소년단 빅히트 남자 1995-12-30 178.0 AB 8073501 3050 4
4 화사 마마무 RBW 여자 1995-07-23 162.1 A 7650928 4300 3
5 정국 방탄소년단 빅히트 남자 1997-09-01 178.0 A 5208335 2900 5
6 민현 뉴이스트 플레디스 남자 1995-08-09 182.3 O 4989792 3400 6
7 소연 아이들 큐브 여자 1998-08-26 NaN B 4668615 4500 5
8 방탄소년단 빅히트 남자 1992-12-04 179.2 O 4570308 4200 4
9 하성운 핫샷 스타크루이엔티 남자 1994-03-22 167.1 A 4036489 4300 4
10 태연 소녀시대 SM 여자 1989-03-09 NaN A 3918661 3700 3
11 차은우 아스트로 판타지오 남자 1997-03-30 183.0 B 3506027 3850 5
12 백호 뉴이스트 플레디스 남자 1995-07-21 175.0 AB 3301654 3900 4
13 JR 뉴이스트 플레디스 남자 1995-06-08 176.0 O 3274137 4100 3
14 슈가 방탄소년단 빅히트 남자 1993-03-09 174.0 O 2925442 4150 3

inner, outer 방식

df2.columns = ['성함', '연봉', '가족수']
df2
성함 연봉 가족수
0 지민 3000 3
1 지드래곤 3500 3
2 강다니엘 3200 4
3 3050 4
4 화사 4300 3
5 정국 2900 5
6 민현 3400 6
7 소연 4500 5
8 4200 4
9 하성운 4300 4
10 태연 3700 3
11 차은우 3850 5
12 백호 3900 4
13 JR 4100 3
14 슈가 4150 3

댓글남기기