일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- flutter
- 유니티
- ASP
- urllib
- GIT
- PyQt
- swift
- 맛집
- 함수
- mssql
- pandas
- javascript
- tensorflow
- port
- node.js
- 다이어트
- IOS
- Excel
- 날짜
- 리눅스
- Unity
- python
- MS-SQL
- 라즈베리파이
- MySQL
- sqlite
- PyQt5
- ubuntu
- PER
- Linux
목록랭귀지/pandas (76)
아미(아름다운미소)
import pandas as pd# 예시 데이터프레임 생성data = { 'A': [1, 2, 'three', 4], 'B': [True, False, 7.2, 'eight'], 'C': [9, 10, 11, 12]}df = pd.DataFrame(data)# 데이터 타입 확인print("데이터 타입:")print(df.dtypes)# 타입이 다른 행 찾기non_string_A = df[~df['A'].apply(lambda x: isinstance(x, str))]non_int_C = df[~df['C'].apply(lambda x: isinstance(x, int))]non_bool_B = df[~df['B'].apply(lambda x: isinstance(x, bool))]pri..
sql case whenSELECT 이름, 성적, 출석률, CASE WHEN 성적 >= 90 AND 출석률 >= 90 THEN 'A' WHEN 성적 >= 80 AND 출석률 >= 80 THEN 'B' WHEN 성적 >= 70 AND 출석률 >= 70 THEN 'C' WHEN 성적 >= 60 AND 출석률 >= 60 THEN 'D' ELSE 'F' END AS 등급FROM 학생;np.whereimport pandas as pdimport numpy as np# 샘플 DataFrame 생성data = { '이름': ['학생1', '학생2', '학생3', '학생4', '학생..
import pandas as pddef fn_df(dict_df_types, df) -> pd.DataFrame: list_int = [k_ for (k_, v_) in dict_df_types.items() if (v_ != 'string') and (v_ != 'boolean') and (k_ in df.columns.to_list())] list_str = [k_ for (k_, v_) in dict_df_types.items() if (v_ == 'string') and (k_ in df.columns.to_list())] list_bool = [k_ for (k_, v_) in dict_df_types.items() if (v_ == 'boolean') and (k_ in df..
df = df.loc[~(df['column'].isnull())]
import pandas as pd# 예시 DataFrame 생성data = { 'a': [1, 1, 2, 2, 3], 'b': ['x', 'x', 'y', 'y', 'z'], 'c': ['p', 'q', 'p', 'q', 'p'], 'd': ['banana', 'apple', 'orange', 'grape', 'kiwi']}df = pd.DataFrame(data)# a 컬럼 드롭df = df.drop(columns=['a'])# b, c로 distinct한 후 d 컬럼의 알파벳 오름차순 첫 번째 값만 남기기result = df.sort_values('d').groupby(['b', 'c'], as_index=False).first()print(result)
import pandas as pd# 예시 DataFrame 생성data = { 'a': [1, 2, 3, 4], 'b': ['group1', 'group1', 'group2', 'group2'], 'c': [10, 20, 30, 40], 'd': ['T', 'F', 'T', 'F']}df = pd.DataFrame(data)# f 컬럼 초기화df['f'] = None# 그룹화하여 f 컬럼 채우기for name, group in df.groupby('b'): value = group.loc[group['d'] == 'T', 'c'] if not value.empty: df.loc[group.index, 'f'] = value.values[0]print(df)i..
import pandas as pd# 예시 데이터프레임 생성data = { 'a': ['A', 'A', 'B', 'B'], 'b': [1, 1, 2, 2], 'c': ['False', 'False', 'False', 'False'], # 문자열로 초기화 'd': ['apple', 'banana', 'cherry', 'date']}df = pd.DataFrame(data)# 그룹화groups = df.groupby(['a', 'b'])# c 컬럼이 모두 'False'인 그룹의 d 컬럼의 알파벳이 가장 빠른 행 찾기for name, group in groups: if (group['c'] == 'False').all(): # c 컬럼이 모두 'False'인 경우 #..
import pandas as pd# DataFrame 예시data = { 'a': ['RT123', 'AB456', 'RT789', 'CD012'], 'b': [1, 2, 3, 4]}df = pd.DataFrame(data)# 'RT'로 시작하는 값 필터링filtered_df = df[df['a'].str.startswith('RT')]print(filtered_df)
import pandas as pd# 예시 DataFramedata = { 'a': [True, False, True, False], 'b': [1, 2, 3, 4]}df = pd.DataFrame(data)# a가 True이면 b를 c에, 아니면 b를 d에 넣기df['c'] = df['b'].where(df['a'] == True)df['d'] = df['b'].where(df['a'] == False)# 결과 출력print(df)
import pandas as pd# 데이터프레임 생성left_df = pd.DataFrame({ '키': [1, 2, 3], '이름': ['홍길동', '이순신', '강감찬']})right_df = pd.DataFrame({ '키': [2, 3, 4], '직업': ['장군', '명장', '왕']})# 왼쪽 외부 조인 수행result = pd.merge(left_df, right_df, on='키', how='left')print(result) 키 이름 직업0 1 홍길동 NaN1 2 이순신 장군2 3 강감찬 명장