일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- sqlite
- 다이어트
- flutter
- MS-SQL
- 라즈베리파이
- Linux
- Excel
- PyQt
- tensorflow
- 함수
- IOS
- javascript
- GIT
- swift
- 날짜
- 리눅스
- ubuntu
- ASP
- PyQt5
- node.js
- python
- MySQL
- 유니티
- mssql
- 맛집
- pandas
- port
- PER
- Unity
- urllib
목록랭귀지/pandas (78)
아미(아름다운미소)
# A와 B의 결합 후 C와 결합df['coalesce'] = df['A'].combine_first(df['B']).combine_first(df['C'])print(df)
import pandas as pdimport numpy as np# 예시 데이터프레임 생성data = { 'a': ['foo', 'foo', 'bar', 'bar', 'foo', 'bar'], 'b': ['one', 'one', 'two', 'two', 'one', 'two'], 'c': ['small', 'small', 'large', 'large', 'small', 'large'], 'd': [1, 1, 2, 2, 1, 2], 'e': ['one', 'two', 'two', 'one', 'one', 'three'], 'f': [10, 20, 30, 40, 50, 60]}df = pd.DataFrame(data)# 그룹화 및 f 컬럼 값 추출def get_f_value..
import pandas as pd# 예시 데이터프레임 생성data = { 'a': ['foo', 'foo', 'bar', 'bar', 'foo', 'bar'], 'b': ['one', 'one', 'two', 'two', 'one', 'two'], 'c': ['small', 'small', 'large', 'large', 'small', 'large'], 'd': [1, 1, 2, 2, 1, 2], 'e': [10, 10, 20, 20, 10, 30]}df = pd.DataFrame(data)# 그룹화 후 e 컬럼의 최빈값 계산mode_df = df.groupby(['a', 'b', 'c', 'd'])['e'].agg(lambda x: x.mode()[0]).reset_ind..
import pandas as pd# 예제 DataFrame 생성data = { 'b': ['x', 'y', 'x', 'z', 'y', 'z'], 'c': [True, False, True, True, False, True], 'd': [10, 20, 30, 40, 50, 60]}a_df = pd.DataFrame(data)# c가 True인 경우에 대해 distinct b 값을 기준으로 d 값을 복사result = a_df[a_df['c']].drop_duplicates(subset='b')[['b', 'd']]# a_df에 결과를 merge하여 추가a_df = a_df.merge(result, on='b', how='left', suffixes=('', '_copy'))print(a_..
def mode_min(series): counts = series.value_counts() mode_val = counts.idxmax() max_count = counts.max() if (counts[counts == max_count].count() > 1): return series.min() return mode_valresult = df.groupby(['b', 'c', 'd'])['e'].agg(mode_min).reset_index()import pandas as pd# 예시 데이터프레임 생성data = { 'a': [1, 2, 3, 4, 5], 'b': ['x', 'x', 'y', 'y', 'x'], 'c': ['p', 'p', ..
import pandas as pdimport numpy as np# 예시 데이터 생성data = { 'a': ['x', 'x', 'y', 'y', 'z'], 'b': ['p', 'p', 'q', 'q', 'r'], 'c': ['apple', 'banana', 'cherry', 'date', 'fig']}df = pd.DataFrame(data)# (a, b)로 그룹화하여 c 컬럼의 최소값을 계산min_c = df.groupby(['a', 'b'])['c'].agg('min').reset_index()min_c.rename(columns={'c': 'min_c'}, inplace=True)# 원래 DataFrame과 병합df = df.merge(min_c, on=['a', 'b'], ho..
import pandas as pd# 예시 DataFrame 생성data1 = { 'a': [1, 2, 3], 'b': [4, 5, 6], 'c': [7, 8, 9]}data2 = { 'b': [1, 2, 3], 'c': [4, 5, 6], 'd': [7, 8, 9]}df1 = pd.DataFrame(data1)df2 = pd.DataFrame(data2)# 두 DataFrame의 컬럼 이름을 합치고 중복 제거combined_columns = set(df1.columns).union(set(df2.columns))# 결과를 리스트로 변환unique_column_names = list(combined_columns)# 결과 출력print(unique_column_names)..
import pandas as pd# 시작 주차와 종료 주차 설정start_week_str = '202352'end_week_str = '202405'# 연도와 주차 분리start_year = int(start_week_str[:4])start_week = int(start_week_str[4:])end_year = int(end_week_str[:4])end_week = int(end_week_str[4:])# 주차 리스트 초기화weeks = []# 주차 계산current_year = start_yearcurrent_week = start_weekwhile (current_year 52: # 주차가 52를 넘으면 연도를 증가시키고 주차를 1로 초기화 current_week = 1 ..
import pandas as pd# 예시 데이터프레임df = pd.DataFrame({'date': pd.to_datetime(['2024-07-01', '2024-07-08', '2024-07-15'])})# 현재 주차 구하기current_week = df['date'].dt.strftime('%G%V')# 전주차 구하기# 연도와 주차를 분리years = current_week.str[:4].astype(int) # 연도weeks = current_week.str[4:].astype(int) # 주차# 전주차 계산previous_weeks = weeks - 1previous_years = years.copy()# 주차가 0이 되면 연도를 줄이고, 주차를 52로 설정previous_years[pre..