[Data Analysis] Pandas 라이브러리 연습 2

2025. 3. 20. 18:45·Data Analysis/Basic

pd.to_numeric(arg, errors='raise')

 Pandas에서 문자열이나 기타 형식의 데이터를 숫자로 변환할 때 사용하는 함수

* `arg`: 숫자로 변환할 대상 (Series, list-like 등)

* `errors`: 변환 중 오류 발생 시 처리 방법 지정

    * `raise` (기본값): 오류 발생 시 예외 발생

    * `coerce`: 오류 발생한 항목을 NaN으로 처리

    * `ignore`: 변환 시도 없이 원본 그대로 반환

 

pd.cut(x, bins, labels=None, include_lowest=False)

*  연속형 데이터를 구간(bins)으로 나누어 범주형(categorical) 데이터로 변환할 때 사용
* `x`: 구간으로 나눌 연속형 데이터 (Series, 배열 등)
 
* `bins`
  * 구간의 개수 (정수) 또는 경계값 리스트 (예: [0, 10, 20, 30])
  * 정수 입력 시 데이터의 최소~최대값 기준으로 자동 분할
 
* `labels`
  * 구간에 붙일 레이블 지정
  * False일 경우 구간 정보만 반환
  * 예: labels=['low', 'mid', 'high']

* `include_lowest`: True이면 첫 번째 구간의 왼쪽 경계 포함

pd.to_datetime(arg)

* 문자열, 숫자 등 다양한 형식의 데이터를 Pandas의 datetime 형식으로 변환할 때 사용

`len()` + `apply()`

* Pandas Series의 각 원소(예: 문자열, 리스트 등)에 대해 길이(length)를 계산할 때 자주 사용

map()

* Pandas에서 Series의 각 원소에 함수를 적용하거나, 값 대체(mapping)할 때 사용하는 간단하고 강력한 도구
 
  * 함수 적용: 각 원소에 함수(`len`, `lambda`, 사용자 정의 함수 등)를 적용
  * 값 매핑: 딕셔너리 또는 다른 Series를 이용해서 값을 치환
 
* 함수 적용 예시

* 값 매핑(치환) 예시

 

'Data Analysis > Basic' 카테고리의 다른 글

[Data Analysis] 데이터 전처리 해보기  (0) 2025.03.29
[Data Analysis] 데이터 시각화 해보기  (0) 2025.03.23
[Data Analysis] 데이터 정제 및 분석 해보기  (0) 2025.03.23
[Data Analysis] Pandas 라이브러리 연습  (0) 2025.02.25
[Data Analysis] 데이터 분석 프로세스 알아보기  (0) 2025.02.19
'Data Analysis/Basic' 카테고리의 다른 글
  • [Data Analysis] 데이터 시각화 해보기
  • [Data Analysis] 데이터 정제 및 분석 해보기
  • [Data Analysis] Pandas 라이브러리 연습
  • [Data Analysis] 데이터 분석 프로세스 알아보기
임승택
임승택
"Hello, I am Lim Seungtaek, a computer engineering student. Nice to meet you!"
  • Lim's Technology
    임승택
    임승택
    "Welcome to Lim's Technology!"
  • 누적 조회수
    총 회
    구독하기
    • 분류 전체보기 (102)
      • Blog (10)
      • Computer Vision (44)
        • Computer Vision (4)
        • Paper reviews (24)
        • Project (8)
        • Basic (8)
      • LLM (8)
        • Paper reviews (3)
        • Project (3)
        • Basic (2)
      • Data Analysis (11)
        • Basic (8)
        • Project (3)
      • Computer Graphics (2)
        • Basic (2)
      • Robotics (5)
        • Paper reviews (3)
        • Basic (2)
      • Technology Notes (15)
      • Memo (5)
  • 인기 글

  • 최근 댓글

  • 최근 글

임승택
[Data Analysis] Pandas 라이브러리 연습 2
상단으로

티스토리툴바