Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
Tags
- ubuntu
- flutter
- 맛집
- ASP
- 함수
- Excel
- node.js
- python
- Linux
- GIT
- 다이어트
- IOS
- port
- MySQL
- PyQt
- PER
- 라즈베리파이
- sqlite
- swift
- javascript
- mssql
- tensorflow
- PyQt5
- MS-SQL
- 리눅스
- Unity
- urllib
- 유니티
- pandas
- 날짜
Archives
목록2025/03/13 (2)
아미(아름다운미소)
ES문자열 제거
import pandas as pdimport numpy as np# 테스트 데이터data = {'a': ['TESTES', 'EXAMPLE', 'YESES', 'NO', np.nan, 12345]}df = pd.DataFrame(data)# 벡터화된 연산으로 'ES' 제거df['a_cleaned'] = df['a'].astype(str).str.replace(r'ES$', '', regex=True)# NaN 값을 빈 문자열로 대체 (필요한 경우)df['a_cleaned'] = df['a_cleaned'].replace('nan', '')print(df)
랭귀지/pandas
2025. 3. 13. 16:58
splite
import pandas as pdimport numpy as np# 데이터 생성 함수def generate_string(): # '::'로 구분된 6개의 랜덤 문자열 생성 (최소 5개의 '::' 포함) parts = [f"part{i}" for i in range(6)] # 6개의 부분 문자열 생성 return "::".join(parts) # '::'로 연결# 400만 개의 데이터 생성num_rows = 4_000_000 # 400만 행data = {'a': [generate_string() for _ in range(num_rows)]}# DataFrame 생성df = pd.DataFrame(data)# 결과 확인print(df.head())chunk_size = 1_000_0..
랭귀지/pandas
2025. 3. 13. 09:15