pd.to_numeric(arg, errors='raise')
Pandas에서 문자열이나 기타 형식의 데이터를 숫자로 변환할 때 사용하는 함수
* `arg`: 숫자로 변환할 대상 (Series, list-like 등)
* `errors`: 변환 중 오류 발생 시 처리 방법 지정
* `raise` (기본값): 오류 발생 시 예외 발생
* `coerce`: 오류 발생한 항목을 NaN으로 처리
* `ignore`: 변환 시도 없이 원본 그대로 반환
pd.cut(x, bins, labels=None, include_lowest=False)
* 연속형 데이터를 구간(bins)으로 나누어 범주형(categorical) 데이터로 변환할 때 사용
* `x`: 구간으로 나눌 연속형 데이터 (Series, 배열 등)
* `bins`
* 구간의 개수 (정수) 또는 경계값 리스트 (예: [0, 10, 20, 30])
* 정수 입력 시 데이터의 최소~최대값 기준으로 자동 분할
* `labels`
* 구간에 붙일 레이블 지정
* False일 경우 구간 정보만 반환
* 예: labels=['low', 'mid', 'high']
* `include_lowest`: True이면 첫 번째 구간의 왼쪽 경계 포함
pd.to_datetime(arg)
* 문자열, 숫자 등 다양한 형식의 데이터를 Pandas의 datetime 형식으로 변환할 때 사용
`len()` + `apply()`
* Pandas Series의 각 원소(예: 문자열, 리스트 등)에 대해 길이(length)를 계산할 때 자주 사용
map()
* Pandas에서 Series의 각 원소에 함수를 적용하거나, 값 대체(mapping)할 때 사용하는 간단하고 강력한 도구
* 함수 적용: 각 원소에 함수(`len`, `lambda`, 사용자 정의 함수 등)를 적용
* 값 매핑: 딕셔너리 또는 다른 Series를 이용해서 값을 치환
* 함수 적용 예시
* 값 매핑(치환) 예시

'Data Analysis > Basic' 카테고리의 다른 글
[Data Analysis] 데이터 전처리 해보기 (0) | 2025.03.29 |
---|---|
[Data Analysis] 데이터 시각화 해보기 (0) | 2025.03.23 |
[Data Analysis] 데이터 정제 및 분석 해보기 (0) | 2025.03.23 |
[Data Analysis] Pandas 라이브러리 연습 (0) | 2025.02.25 |
[Data Analysis] 데이터 분석 프로세스 알아보기 (0) | 2025.02.19 |