'2025/03/13 글 목록

Notice

Recent Posts

Recent Comments

Link

« 2025/03 »
일	월	화	수	목	금	토
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31

Tags more

Archives

관리 메뉴

목록2025/03/13 (2)

아미(아름다운미소)

ES문자열 제거

import pandas as pdimport numpy as np# 테스트 데이터data = {'a': ['TESTES', 'EXAMPLE', 'YESES', 'NO', pd.NA, 12345]}df = pd.DataFrame(data)# 벡터화된 연산으로 'ES' 제거 및 결측값 처리df['a_cleaned'] = np.where( df['a'].notna(), # 결측값이 아닌 경우에만 처리 df['a'].astype(str).str.replace(r'ES$', '', regex=True), # ES 제거 '' # 결측값은 빈 문자열로 처리)print(df)import numpy as npimport pandas as pd# 예시 데이터프레임 생성df = pd.DataFrame..

랭귀지/pandas 2025. 3. 13. 16:58

splite

import pandas as pdimport numpy as np# 데이터 생성 함수def generate_string(): # '::'로 구분된 6개의 랜덤 문자열 생성 (최소 5개의 '::' 포함) parts = [f"part{i}" for i in range(6)] # 6개의 부분 문자열 생성 return "::".join(parts) # '::'로 연결# 400만 개의 데이터 생성num_rows = 4_000_000 # 400만 행data = {'a': [generate_string() for _ in range(num_rows)]}# DataFrame 생성df = pd.DataFrame(data)# 결과 확인print(df.head())chunk_size = 1_000_0..

랭귀지/pandas 2025. 3. 13. 09:15

Prev 1 Next

목록2025/03/13 (2)

아미(아름다운미소)

티스토리툴바