'랭귀지/pandas' 카테고리의 글 목록 (5 Page)

Notice

Recent Posts

Recent Comments

Link

« 2025/06 »
일	월	화	수	목	금	토
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

Tags more

Archives

관리 메뉴

목록랭귀지/pandas (118)

아미(아름다운미소)

pandas 빈값이 아닌면 a컬럼을 _기준으로 split 하고 첫번째값 사용

import pandas as pd# 예시 데이터프레임 생성data = { 'a': ['value1_value2', '', 'value3_value4', 'value5_value6'], 'b': [1, 2, 3, 4]}df = pd.DataFrame(data)# a 컬럼이 빈 문자열이 아닐 경우 _ 기준으로 split하고 첫 번째 값 사용df['first_value'] = df['a'].apply(lambda x: x.split('_')[0] if x else None)print(df)

랭귀지/pandas 2025. 1. 3. 13:14

df 에a,b,c 컬럼이 있고 df2에도 a,b,c 컬럼이 있다면 df 에는없지만 df2애는있는 a,b,c 구하기

import pandas as pd# 예시 데이터프레임 생성data1 = {'a': [1, 2, 3], 'b': [4, 5, 6], 'c': [7, 8, 9]}data2 = {'a': [2, 3, 4], 'b': [5, 6, 7], 'c': [8, 9, 10]}df = pd.DataFrame(data1)df2 = pd.DataFrame(data2)# df2에만 있는 값 찾기result = df2[~df2.set_index(['a', 'b', 'c']).index.isin(df.set_index(['a', 'b', 'c']).index)]print(result)

랭귀지/pandas 2025. 1. 3. 09:58

pandas에서 데이타프레임의 타입이 틀린 항목찿기

import pandas as pd# 예시 데이터프레임 생성data = { 'A': [1, 2, 'three', 4], 'B': [True, False, 7.2, 'eight'], 'C': [9, 10, 11, 12]}df = pd.DataFrame(data)# 데이터 타입 확인print("데이터 타입:")print(df.dtypes)# 타입이 다른 행 찾기non_string_A = df[~df['A'].apply(lambda x: isinstance(x, str))]non_int_C = df[~df['C'].apply(lambda x: isinstance(x, int))]non_bool_B = df[~df['B'].apply(lambda x: isinstance(x, bool))]pri..

랭귀지/pandas 2024. 12. 23. 08:54

CASE WHEN 과 np.where 비교

sql case whenSELECT 이름, 성적, 출석률, CASE WHEN 성적 >= 90 AND 출석률 >= 90 THEN 'A' WHEN 성적 >= 80 AND 출석률 >= 80 THEN 'B' WHEN 성적 >= 70 AND 출석률 >= 70 THEN 'C' WHEN 성적 >= 60 AND 출석률 >= 60 THEN 'D' ELSE 'F' END AS 등급FROM 학생;np.whereimport pandas as pdimport numpy as np# 샘플 DataFrame 생성data = { '이름': ['학생1', '학생2', '학생3', '학생4', '학생..

랭귀지/pandas 2024. 12. 20. 08:25

boolean 예외처리

import pandas as pddef fn_df(dict_df_types, df) -> pd.DataFrame: list_int = [k_ for (k_, v_) in dict_df_types.items() if (v_ != 'string') and (v_ != 'boolean') and (k_ in df.columns.to_list())] list_str = [k_ for (k_, v_) in dict_df_types.items() if (v_ == 'string') and (k_ in df.columns.to_list())] list_bool = [k_ for (k_, v_) in dict_df_types.items() if (v_ == 'boolean') and (k_ in df..

랭귀지/pandas 2024. 12. 18. 15:53

pandas not null

df = df.loc[~(df['column'].isnull())]

랭귀지/pandas 2024. 9. 25. 16:28

a,b,c,d 컬럼을가진 df가 있는데 a컬럼읔 drop하고b,c로 distinct 하는데 d컬럼 알파벳오름차순 첫번째값만 남긴다

import pandas as pd# 예시 DataFrame 생성data = { 'a': [1, 1, 2, 2, 3], 'b': ['x', 'x', 'y', 'y', 'z'], 'c': ['p', 'q', 'p', 'q', 'p'], 'd': ['banana', 'apple', 'orange', 'grape', 'kiwi']}df = pd.DataFrame(data)# a 컬럼 드롭df = df.drop(columns=['a'])# b, c로 distinct한 후 d 컬럼의 알파벳 오름차순 첫 번째 값만 남기기result = df.sort_values('d').groupby(['b', 'c'], as_index=False).first()print(result)

랭귀지/pandas 2024. 9. 20. 15:46

df에서 a컬럼을 distinct 했을때 b컬럼이 true인 c컬럼을 copy b컬럼에 넣어준다

import pandas as pd# 예시 DataFrame 생성data = { 'a': [1, 2, 3, 4], 'b': ['group1', 'group1', 'group2', 'group2'], 'c': [10, 20, 30, 40], 'd': ['T', 'F', 'T', 'F']}df = pd.DataFrame(data)# f 컬럼 초기화df['f'] = None# 그룹화하여 f 컬럼 채우기for name, group in df.groupby('b'): value = group.loc[group['d'] == 'T', 'c'] if not value.empty: df.loc[group.index, 'f'] = value.values[0]print(df)i..

랭귀지/pandas 2024. 9. 20. 14:03

a,b컬럼을 groupby 했을때 c컬럼이 모두 False이면 d컬럼의 알파벳이 제일 빠른행에 c컬럼값을 True로 바꿔준다

import pandas as pd# 예시 데이터프레임 생성data = { 'a': ['A', 'A', 'B', 'B'], 'b': [1, 1, 2, 2], 'c': ['False', 'False', 'False', 'False'], # 문자열로 초기화 'd': ['apple', 'banana', 'cherry', 'date']}df = pd.DataFrame(data)# 그룹화groups = df.groupby(['a', 'b'])# c 컬럼이 모두 'False'인 그룹의 d 컬럼의 알파벳이 가장 빠른 행 찾기for name, group in groups: if (group['c'] == 'False').all(): # c 컬럼이 모두 'False'인 경우 #..

랭귀지/pandas 2024. 9. 13. 15:32

str.startswith

import pandas as pd# DataFrame 예시data = { 'a': ['RT123', 'AB456', 'RT789', 'CD012'], 'b': [1, 2, 3, 4]}df = pd.DataFrame(data)# 'RT'로 시작하는 값 필터링filtered_df = df[df['a'].str.startswith('RT')]print(filtered_df)

랭귀지/pandas 2024. 9. 12. 10:44

Prev 1 2 3 4 5 6 7 8 ··· 12 Next

목록랭귀지/pandas (118)

아미(아름다운미소)

티스토리툴바