본문 바로가기
데이터 마이닝(Data Mining)

연관성규칙, 군집분석, 의사결정트리

by 데이터스토리 2018. 11. 15.
반응형

데이터 마이닝


- 데이터간의 연관성을 파악하고 의사결정에 활용하기 위함


1) 연관성 분석 (Association Analysis)


데이터에서 연관된 규칙을 발견하고자 행하는 분석 기법

- 장바구니 분석(Baskey Analysis) 또는 친화성분석(Affinity Analysis) 라고 알려져 있음

- 맥주와 기저귀의 관계를 설명할 때 사용됨

  월마트 사례로 

  아내의 부탁으로 마트에 기저귀를 사러 온 애기 아빠들은 맥주를 사는 경향이 높았다.

  마트는 맥주를 기저귀 옆으로 배치 했더니, 맥주 매출이 3배 높아 졌다.

- 데이터 구조

  . 장바구니별 구입품목 리스트가로 구성

     --> A카트 : 기저귀, 맥주, 소주, 담배

     --> B카트: 맥주, 땅콩, 우유,...

     --> C카트, ....


2) 군집분석 (Clustering Analysis)

데이터 군에서 유사한 속성을 가지는 소집단으로 세분화 하는 작업

- 특징은 사전에 정의된 집단을 가지고 있지 않음

- 데이터는 서로 섞여 있지만, 유사한 것들을 그룹화 하여 작은 집단으로 분류

- 탐색적 방식임

- 마케팅에서 고객을 타케팅할 때 사용

- 데이터 구조

A고객: 20대, 여자, 미용사,...

B고객: 30대, 여자, 사무원,...


==> 가그룹(A,C,F 고객), 나 그룹(B,D,G 고객)...


3) 의사결정나무(Decision Tree)

- Y변수에 영향을 주는 X변수들간의 의사결정 구조를 트리 형식으로 표현

- 나무 가지 모양처럼 로직을 처리할 수 있음


/












반응형