Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
Tags
- PER
- python
- 유니티
- GIT
- PyQt
- IOS
- swift
- 라즈베리파이
- sqlite
- pandas
- node.js
- 함수
- tensorflow
- port
- ubuntu
- urllib
- ASP
- javascript
- 다이어트
- flutter
- 맛집
- Linux
- Excel
- PyQt5
- 리눅스
- mssql
- MySQL
- 날짜
- MS-SQL
- Unity
Archives
아미(아름다운미소)
pandas groupby sum 본문
예제
import pandas as pd
data = {'A': ['a', 'b', 'c', 'a', 'b'],
'B': ['a', 'b', 'c', 'a', 'b'],
'C1': ['10', '20', '30', 'nan', '50'],
'C2': ['1', '2', '3', '4', '5']}
df = pd.DataFrame(data)
#결측값확인
print(df.isnull().any())
# Output:
# A True
# B True
# C True
# dtype: bool
# NaN 값 제거
df['C1'] = df['C1'].fillna('0')
df['C2'] = df['C2'].fillna('0')
# 데이터 타입 변경
df['C1'] = df['C1'].astype(int)
df['C2'] = df['C2'].astype(int)
# 합계 계산
grouped = df.groupby(['A', 'B'])
result = grouped[['C1', 'C2']].sum().reset_index()
print(result)
예제1
import pandas as pd
# 샘플 데이터 생성
data = {'A': ['a', 'b', 'c', 'a', 'b'], 'B': ['a', 'b', 'c', 'a', 'b'], 'C1': [10, 20, 30, 40, 50], 'C2': [1, 2, 3, 4, 5]}
df = pd.DataFrame(data)
#데이타타입확인
df.info()
# groupby() 후 sum()
grouped = df.groupby(['A', 'B'])
result1 = grouped[['C1', 'C2']].sum().reset_index()
print("groupby() 후 sum():")
print(result1)
예제2
import pandas as pd
# 데이터 생성
data = pd.DataFrame({
'A': ['A1', 'A1', 'A2', 'A2', 'A3', 'A3'],
'B': ['B1', 'B2', 'B1', 'B2', 'B1', 'B2'],
'C': [10, 20, 30, 40, 50, 60]
})
# Groupby 수행
grouped_data = data.groupby(['A', 'B'])
# sum 수행
sum_df = grouped_data['C'].sum().reset_index()
print(sum_df)
예제3
import pandas as pd
# 데이터 생성
data = pd.DataFrame({
'A': ['A1', 'A1', 'A2', 'A2', 'A3', 'A3'],
'B': ['B1', 'B2', 'B1', 'B2', 'B1', 'B2'],
'C': [10, 20, 30, 40, 50, 60],
'D': [5, 10, 15, 20, 25, 30]
})
# Groupby 수행
grouped_data = data.groupby(['A', 'B'])
# C 컬럼의 sum 수행
sum_c_df = grouped_data['C'].sum().reset_index()
# D 컬럼의 sum 수행
sum_d_df = grouped_data['D'].sum().reset_index()
# C와 D 컬럼의 sum 결과 합치기
merged_df = pd.merge(sum_c_df, sum_d_df, on=['A', 'B'])
print(merged_df)
'랭귀지 > pandas' 카테고리의 다른 글
pandas groupby sum fillna astype (0) | 2024.07.13 |
---|---|
pandas skipna (0) | 2024.07.13 |
pandas index 확인 (0) | 2024.07.11 |
pandas 차주 월요일데이타 (0) | 2024.07.11 |
pandas 주차구하기 (0) | 2024.07.09 |
Comments