데이터의 종류 - 수치데이터, 범주형데이터 그리고 또 우리가 알던 데이터
우리 주변에는 많은 장소가 있습니다. 카페, 병원, 관공서, 사무실, 공원 , 도로 등 건물과 환경이 존재합니다. 이런 사물에서 발생되는 다양한 종류의 데이터가 있습니다. 이번에는 이런 데이터의 종류에 대해서 알아보겠습니다. 1. 데이터의 종류 - 내주변의 데이터 주변에서 생성되는 수치, 문자, 사진, 그림, 소리 등이 디지털로 변환되어 컴퓨터에 저장되는 것을 데이터하고 합니다. 하지만 데이터라고 다 동일한 데이터가 아닙니다. 데이터도 종류를 구분할 수 있기 때문입니다. 우리에게 가장 가까운 곳에 있는 데이터는 바로 우리 입니다. 키, 몸무게, 나이, 집주소, 학점, 세금, 카드비용, 커피값 등 내가 만들어 내는 데이터이지요. 이런 데이터가 모여서 데이터셋이 되고 데이터베이스가 만들어집니다. 나무위키 "..
2024. 3. 16.
데이터 분석 중심 피처 엔지니어링(Feature engineering) - 반복적인 데이터 분석의 중심
탐색적 데이터분석 작업의 한 단계로 피처 엔지니어링이 있다. 피처 엔지니어링이 데이터 분석 과정에서 어떤 역할을 하고 왜 중요한지를 살펴 보고자 한다. 1. 피처 엔지니어링(Feature engineering) 이란 피처 엔지니어링은 머신러닝 모델의 성능을 향상시키기 위해 데이터를 변환하고 개선하는 과정을 말한다. 피처 엔지니어링에서 피처 Feature 는 머신러닝 모델이 학습하는 데이터의 속성 또는 특성을 말한다. 피처에는 수치형, 범주형, 순서형 등으로 구분할 수 있다. ● 수치형 피처 - 숫자로 표현 - 예를 들어, 점수, 혈압, 몸무게, 매출액, 수량 등이 았음 ● 범주형 피처 - 문자열이나 기호로 표현 - 예를 들어, 상품군, 나이대, 성별, 직업, 지역 등이 있음 ● 순서형 피처 - 정렬 가능..
2024. 2. 1.