데이터 분석 중심 피처 엔지니어링(Feature engineering) - 반복적인 데이터 분석의 중심
탐색적 데이터분석 작업의 한 단계로 피처 엔지니어링이 있다. 피처 엔지니어링이 데이터 분석 과정에서 어떤 역할을 하고 왜 중요한지를 살펴 보고자 한다. 1. 피처 엔지니어링(Feature engineering) 이란 피처 엔지니어링은 머신러닝 모델의 성능을 향상시키기 위해 데이터를 변환하고 개선하는 과정을 말한다. 피처 엔지니어링에서 피처 Feature 는 머신러닝 모델이 학습하는 데이터의 속성 또는 특성을 말한다. 피처에는 수치형, 범주형, 순서형 등으로 구분할 수 있다. ● 수치형 피처 - 숫자로 표현 - 예를 들어, 점수, 혈압, 몸무게, 매출액, 수량 등이 았음 ● 범주형 피처 - 문자열이나 기호로 표현 - 예를 들어, 상품군, 나이대, 성별, 직업, 지역 등이 있음 ● 순서형 피처 - 정렬 가능..
2024. 2. 1.