일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
- PER
- MS-SQL
- 날짜
- 맛집
- urllib
- IOS
- 다이어트
- swift
- Excel
- mssql
- tensorflow
- Linux
- node.js
- port
- GIT
- 유니티
- javascript
- 라즈베리파이
- MySQL
- sqlite
- python
- PyQt
- PyQt5
- ASP
- 리눅스
- Unity
- pandas
- 함수
- ubuntu
- flutter
목록2025/03/13 (2)
아미(아름다운미소)
import pandas as pdimport numpy as np# 테스트 데이터data = {'a': ['TESTES', 'EXAMPLE', 'YESES', 'NO', pd.NA, 12345]}df = pd.DataFrame(data)# 벡터화된 연산으로 'ES' 제거 및 결측값 처리df['a_cleaned'] = np.where( df['a'].notna(), # 결측값이 아닌 경우에만 처리 df['a'].astype(str).str.replace(r'ES$', '', regex=True), # ES 제거 '' # 결측값은 빈 문자열로 처리)print(df)import numpy as npimport pandas as pd# 예시 데이터프레임 생성df = pd.DataFrame..
import pandas as pdimport numpy as np# 데이터 생성 함수def generate_string(): # '::'로 구분된 6개의 랜덤 문자열 생성 (최소 5개의 '::' 포함) parts = [f"part{i}" for i in range(6)] # 6개의 부분 문자열 생성 return "::".join(parts) # '::'로 연결# 400만 개의 데이터 생성num_rows = 4_000_000 # 400만 행data = {'a': [generate_string() for _ in range(num_rows)]}# DataFrame 생성df = pd.DataFrame(data)# 결과 확인print(df.head())chunk_size = 1_000_0..