일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- port
- Linux
- pandas
- MS-SQL
- Unity
- swift
- 라즈베리파이
- PyQt5
- 함수
- python
- javascript
- sqlite
- GIT
- flutter
- IOS
- PyQt
- 맛집
- tensorflow
- 다이어트
- node.js
- Excel
- 리눅스
- mssql
- MySQL
- ubuntu
- PER
- ASP
- 날짜
- 유니티
- urllib
목록랭귀지/pandas (76)
아미(아름다운미소)
import pandas as pdimport numpy as np# 샘플 데이터 생성data = { 'a': ['A'] * 6 + ['B'] * 6 + ['C'] * 6, 'b': [10, 15, 10, -20, 5, 10, 25, -30, 5, 20, 15, 10, 10, 15, 20, 25, 30, 35], 'c': [3, 3, 3, 3, 3, 3, -3, -3, -3, -3, -3, -3, 2, 2, 2, 2, 2, 2]}# DataFrame 생성df = pd.DataFrame(data)# d 컬럼과 e 컬럼 초기화df['d'] = np.nandf['e'] = np.random.randint(-5, 10, size=l..
import pandas as pd# 예시 데이터프레임 생성data = { 'a': ['A', 'A', 'B', 'B'], 'b': ['X', 'X', 'Y', 'Y'], 'c': [1, 1, 2, 2], 'd': [10, 20, 10, 20], 'e': [100, 200, 300, 400], 'f': [150, 250, 350, 450] # f 컬럼 추가}df1 = pd.DataFrame(data)df2 = df1.copy() # df2는 df1과 동일# df1을 그룹화하고 e 컬럼의 합을 계산grouped_df1 = df1.groupby(['a', 'b', 'c', 'd'])['e'].sum().reset_index()# df2는 그대로 사용# df2의 f 컬럼을 ..
import pandas as pd# 샘플 데이터프레임 생성data = { 'a': [-140, 15, -20, 25], 'b': [26, 4, 5, 6]}df = pd.DataFrame(data)# 나누기 결과와 몫 계산df['division'] = (df['a'] / df['b']).astype(int) # 나누기 결과를 정수형으로 변환df['quotient'] = (df['a'] // df['b']).astype(int) # 몫을 정수형으로 변환df['remainder'] = df['a'] % df['b'] # 나머지 계산# 나누기 결과에 따라 나머지의 부호 조정df['adjusted_remainder'] = df.apply( lambda row: row['remainder']..
import pandas as pd# 예시 데이터프레임 생성data = { 'a': ['x', 'x', 'y', 'y', 'x', 'y', 'x', 'y', 'x', 'y'], 'b': [1, 1, 2, 2, 1, 1, 2, 2, 1, 1], 'c': ['foo', 'foo', 'bar', 'bar', 'foo', 'foo', 'bar', 'bar', 'foo', 'foo'], 'd': [10, 10, 20, 20, 10, 10, 20, 20, 10, 10], 'e': [4, 6, 10, 15, 25, 5, 3, 8, 12, 7], 'f': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J']}df = pd.DataFrame(data)..
import pandas as pd# 예시 데이터프레임 생성data = { 'a': ['x', 'x', 'y', 'y', 'x'], 'b': [1, 1, 2, 2, 1], 'c': ['foo', 'foo', 'bar', 'bar', 'foo'], 'd': [10, 10, 20, 20, 10], 'e': [5, 15, 10, 20, 25]}df = pd.DataFrame(data)# 그룹화 후 e 컬럼의 합계와 행 수 계산result = df.groupby(['a', 'b', 'c', 'd']).agg( e_sum=('e', 'sum'), row_count=('e', 'count')).reset_index()print(result)import pandas as pd# ..
import pandas as pd# 예시 DataFrame 생성data = { 'a': ['TRUE', 'FALSE', 'TRUE', 'FALSE'], 'b': [10, 20, 30, 40],}df = pd.DataFrame(data)# a가 'TRUE'인 경우 b 값을 c에 복사df['c'] = df['b'].where(df['a'] == 'TRUE')print(df)
import pandas as pd# 예제 데이터프레임 생성data = { 'a': ['apple', 'banana', 'apple', 'orange', 'banana'], 'b': [True, False, True, True, False], 'c': [1, 2, 3, 4, 5]}df = pd.DataFrame(data)# a 컬럼의 고유 값에 대해 b가 True인 c 값을 가져와서 b에 복사for unique_a in df['a'].unique(): # 해당 a값을 가진 행 중 b가 True인 c 값 찾기 true_c_values = df.loc[(df['a'] == unique_a) & (df['b'] == True), 'c'] if not true_c_valu..
import pandas as pd# 예시 데이터프레임 생성data = { 'a': ['A', 'A', 'B', 'B', 'C'], 'b': [1, 1, 2, 2, 1], 'c': [False, False, False, False, True], 'd': ['z', 'y', 'x', 'w', 'v']}df = pd.DataFrame(data)# c가 모두 False인 그룹 찾기grouped = df.groupby(['a', 'b'])# c의 값이 모두 False인 그룹에 대한 마스크 생성mask = grouped['c'].transform('all') == False# 해당 그룹에서 d 컬럼 기준으로 정렬 후 인덱스 찾기first_alpha_index = df[mask].sort_va..
특정컬럼 null 체크import pandas as pd# 샘플 데이터프레임 생성data = { 'A': [1, 2, None, 4], 'B': [None, 2, 3, 4], 'C': [1, 2, 3, 4]}df = pd.DataFrame(data)# 특정 컬럼(B)에 대해 null 값 체크null_check_B = df['B'].isnull()print(null_check_B)# 특정 컬럼(B)의 null 값 개수 세기null_count_B = df['B'].isnull().sum()print(f"'B' 컬럼의 null 값 개수: {null_count_B}")# 특정 컬럼(B)에 null 값이 있는 행 필터링rows_with_null_B = df[df['B'].isnull()]print..
import pandas as pd# 예시 데이터프레임 생성data = { 'a': ['A', 'A', 'B', 'B', 'C'], 'b': [1, 1, 2, 2, 1], 'c': [0, 0, 0, 0, 1], 'd': ['z', 'y', 'x', 'w', 'v']}df = pd.DataFrame(data)# c의 합이 0인 그룹에서 d 컬럼의 알파벳이 가장 빠른 행의 c 값을 1로 변경# 그룹화하여 c의 합 계산grouped = df.groupby(['a', 'b'])# c의 합이 0인 그룹 찾기mask = grouped['c'].transform('sum') == 0# 해당 그룹에서 d 컬럼 기준으로 정렬 후 첫 번째 행의 인덱스 찾기first_alpha_index = df[ma..