일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- sqlite
- ubuntu
- pandas
- mssql
- javascript
- ASP
- 리눅스
- 라즈베리파이
- node.js
- urllib
- Unity
- PyQt
- GIT
- IOS
- flutter
- MS-SQL
- python
- 다이어트
- PyQt5
- MySQL
- Excel
- 유니티
- tensorflow
- port
- Linux
- PER
- 날짜
- 함수
- 맛집
- swift
목록랭귀지/pandas (110)
아미(아름다운미소)
import pandas as pd# 데이터프레임 생성df1 = pd.DataFrame({'A': [1, 2], 'B': [3, 4]})df2 = pd.DataFrame({'A': [5, 6], 'C': [7, 8]})# 세로 방향으로 결합 (outer join)result_outer = pd.concat([df1, df2], axis=0, join='outer', ignore_index=True)print("Outer Join:\n", result_outer)# 가로 방향으로 결합 (inner join)result_inner = pd.concat([df1, df2], axis=1, join='inner')print("\nInner Join:\n", result_inner)# 키를 사용하여 다중 인덱스 ..
import pandas as pd# 예시 데이터프레임 생성df1 = pd.DataFrame({'A': [1, 2], 'B': [3, 4]})df2 = pd.DataFrame({'A': [5, 6], 'B': [7, 8]})df3 = pd.DataFrame({'A': [9, 10], 'C': [11, 12]}) # 컬럼명이 다름df4 = pd.DataFrame({'A': [13, 14], 'B': [15, 16]})df5 = pd.DataFrame({'A': [17, 18], 'B': [19, 20]})df6 = pd.DataFrame({'A': [21, 22], 'B': [23.0, 24.0]}) # 타입이 다름df7 = pd.DataFrame({'A': [25, 26], 'B': [27, 28]}..
Pandas에서 `concat`을 사용할 때 값이 있는 데이터프레임이 있는데 결과가 0으로 나오는 경우는 여러 가지 원인이 있을 수 있습니다. 가장 일반적인 원인은 다음과 같습니다.1. 인덱스 문제: 데이터프레임을 concat할 때 인덱스가 겹치면, 같은 인덱스의 값이 덮어쓰기 때문에 0으로 보일 수 있습니다. 이 경우 `ignore_index=True`를 설정해 보세요. ```python pd.concat([df1, df2], ignore_index=True) ```2. 열 이름 불일치: concat할 데이터프레임의 열 이름이 다르면, NaN 값으로 채워질 수 있습니다. 이 경우 원래 데이터프레임의 열 이름을 확인해 보세요.3. 데이터 타입: 데이터 타입이 다르면 연산 결과가 예상과 다르게 ..
import pandas as pd# 샘플 데이터프레임 생성data = { '팀': ['A', 'A', 'B', 'B', 'C', 'C'], '점수': [10, 20, 30, 40, 50, 60]}df = pd.DataFrame(data)# 각 팀의 점수 평균을 계산하고 원래 데이터프레임에 추가df['점수_평균'] = df.groupby('팀')['점수'].transform('mean')print(df)
import pandas as pdimport numpy as np# 샘플 데이터 생성data = { 'a': ['A'] * 6 + ['B'] * 6 + ['C'] * 6, 'b': [10, 15, 10, -20, 5, 10, 25, -30, 5, 20, 15, 10, 10, 15, 20, 25, 30, 35], 'c': [3, 3, 3, 3, 3, 3, -3, -3, -3, -3, -3, -3, 2, 2, 2, 2, 2, 2]}# DataFrame 생성df = pd.DataFrame(data)# d 컬럼과 e 컬럼 초기화df['d'] = np.nandf['e'] = np.random.randint(-5, 10, size=l..
import pandas as pd# 예시 데이터프레임 생성data = { 'a': ['A', 'A', 'B', 'B'], 'b': ['X', 'X', 'Y', 'Y'], 'c': [1, 1, 2, 2], 'd': [10, 20, 10, 20], 'e': [100, 200, 300, 400], 'f': [150, 250, 350, 450] # f 컬럼 추가}df1 = pd.DataFrame(data)df2 = df1.copy() # df2는 df1과 동일# df1을 그룹화하고 e 컬럼의 합을 계산grouped_df1 = df1.groupby(['a', 'b', 'c', 'd'])['e'].sum().reset_index()# df2는 그대로 사용# df2의 f 컬럼을 ..
import pandas as pd# 샘플 데이터프레임 생성data = { 'a': [-140, 15, -20, 25], 'b': [26, 4, 5, 6]}df = pd.DataFrame(data)# 나누기 결과와 몫 계산df['division'] = (df['a'] / df['b']).astype(int) # 나누기 결과를 정수형으로 변환df['quotient'] = (df['a'] // df['b']).astype(int) # 몫을 정수형으로 변환df['remainder'] = df['a'] % df['b'] # 나머지 계산# 나누기 결과에 따라 나머지의 부호 조정df['adjusted_remainder'] = df.apply( lambda row: row['remainder']..
import pandas as pd# 예시 데이터프레임 생성data = { 'a': ['x', 'x', 'y', 'y', 'x', 'y', 'x', 'y', 'x', 'y'], 'b': [1, 1, 2, 2, 1, 1, 2, 2, 1, 1], 'c': ['foo', 'foo', 'bar', 'bar', 'foo', 'foo', 'bar', 'bar', 'foo', 'foo'], 'd': [10, 10, 20, 20, 10, 10, 20, 20, 10, 10], 'e': [4, 6, 10, 15, 25, 5, 3, 8, 12, 7], 'f': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J']}df = pd.DataFrame(data)..
import pandas as pd# 예시 데이터프레임 생성data = { 'a': ['x', 'x', 'y', 'y', 'x'], 'b': [1, 1, 2, 2, 1], 'c': ['foo', 'foo', 'bar', 'bar', 'foo'], 'd': [10, 10, 20, 20, 10], 'e': [5, 15, 10, 20, 25]}df = pd.DataFrame(data)# 그룹화 후 e 컬럼의 합계와 행 수 계산result = df.groupby(['a', 'b', 'c', 'd']).agg( e_sum=('e', 'sum'), row_count=('e', 'count')).reset_index()print(result)import pandas as pd# ..