데이터 과학 욕구 단계를 알아보자.
요구단계란 용어는 매슬로우의 욕구5단계가 시작이다. 여기서의 단계별 접근을 활용하여 AI에서 데이터과학 욕구 단계를 정의한 것으로 보인다.
1. 데이터 과학 욕구 단계
데이터 과학 욕구 단계는 2017년 모니카 로가티 (Monica Rogati)는 기사에 아래 그림을 발표한다. 이 그림은 인공지능과 머신러닝(ML)이 데이터 이동 및 저장, 수집, 인프라와 같이 더 평이한 영역에 근접했음을 보여준다. 많은 데이터 과학자가 ML 모델을 구축하고 튜닝하기를 원하지만, 실제 작업 시간의 70~80%는 계층 구조상 하위 세 부분(데이터 수집, 데이터 정리, 데이터 처리)에 시간을 소비하는 것으로 추정되며, 분석과 ML에 할애하는 시간은 극히 일부에 불과한 것으로 나타났다.
로가티는 기업이 AI나 ML과 같은 영역을 다루기 전에 견고한 데이터 기반(계층 구조의 하위 3개 수준)을 구축해야 한다고 주장했다. 데이터 과학자는 보통 상용 제품 수준의 데이터 시스템을 엔지니어링하도록 훈련받지 않으며, 데이터 엔지니어의 기술적 지원과 리소스의 부족 때문에 이러한 작업을 닥치는 대로 수행한다.
위 내용은 "견고한 데이터엔지니어링" 책에 나오는 내용이다. 이 글을 보면서 많은 프로젝트에 데이터 수집 및 가공 영역에 약 60%의 리소스가 배정되는 이유를 인식하게 되었다. 기사를 쓰고나, 논문을 쓸 때 가장 많은 시간을 쓰는 구간이 관련 데이터를 수집하는 작업이다. 인공지능, 데이터과학도 마찬가지다. 데이터가 없다면 이 작업은 할 수 없다. 데이터가 있어도 서로 어울리지 않는다면 그 또한 작업을 할 수 없다. 데이터가 필요한데, 데이터의 기준이 통일 되어야 하는 것이다.
조직은 각 조직의 특성이 따라 데이터를 관리하는 포맷이 있다. 시스템도 그 시스템 나름 대로의 규칙이 있다. 이제 프로젝트, 특히 데이터를 다루는 프로젝트에서는 표준을 만들고 그에 준해서 진행하는 것이 필수이다. 그래야 통일된 규칙의 데이터를 확보하기 때문이다.
욕구단계: 수집 -> 이동/저장 -> 탐색/변환 -> 집계/라벨링 -> 학습/최적화
2. 매슬로우의 욕구 5단계
매슬로우의 욕구 5단계는 생리적인 욕구에서 시작되어 자아실현으로 마무리된다. 5단계의 각 항목은 "생리적 욕구, 안전의 욕구, 애정과 공감의 욕구, 존경의 욕구, 자아실현의 욕구"로 나누고 있다.
각 단계별 그 내용을 살표보겠다.
① 생리적 욕구
인간 생존의 문제에서 기인한다. 식욕, 수면욕 등 가장 기초적인 욕구이다. 아이들이 태어나면 처음으로 하는 것이다.우리의 몸인 정상적으로 작동하기 위한 필수적인 내용이다.
② 안전의 욕구
1단계가 충족이 되면 안전에 대해서 살피게 된다. 사나운 동물을 만나면 동굴로 피해야 한다고 생각하는 원시 시절의 그 느낌이다. 이는 신체적, 정신적 안정감을 찾고자하는 성향이다. 우리는 생활이나 조직에서 안정적이고 익숙한 것을 선호하게 된다.여기는 물리적인 안전 외에도 사회적, 경제적 안정인 정신적인 안전도 같이 한다. 만약 이사를 간다면 원래 사는 곳에서 너무 멀리 떨어지게 되면 불안감을 가지는 것도 마찬가지 현상이다.
③ 애정과 공감의 욕구
이제부터는 개인 보다는 사회적인 유대감과 관련된다. 애정과 공감의 욕구는 상호작용에서 충족을 원하는 욕구다. 단체, 모임, 기업 등 조직을 속할 때 그 구성원으로 서 가지게 될 욕구다. 이 부분이 결여되는 것이 왕따인 것이다. 이 왕따 현상은 심각한 사회적인 문제를 만들 수 있다. 미국에서의 총기 난사범의 일부가 이 이상으로 이야기 된다.
④ 존경의 욕구
이제 사회 및 조직 생활을 하게 되면 소속감을 갖은 후에 우리는 누군가의 존경을 구하게 된다. 나의 위치를 인식하는 과정이다. 나의 가치가 어느 정도이고, 다른 사람과의 비교를 하게 된다. 정치에서 많이 보인다. 일정 직급을 가진 후 그 계속적인 위치를 유지하고 더 높이 가려는 것이다. 회사의 진급도 마찬가지다. 그러고 보면 인사팀의 승진제도도 이런 인간의 욕구에 기인한다고 보면 되겠다.
⑤ 자아실현의 욕구
마지막 최상위 단계이다. 이전까지는 결핍된 부분을 채워나가는 단계였다. 자아실현의 단계는 스스로 채워나가는 단계다. 내가 더 나은 나를 위해 시간을 사용하는 단계이다. 자아실현의 최상위가 종교로 본다. 모든 것으로 부터 물욕을 잊고 나 만의 고유한 자아를 만드는 것이다.
인간의 욕구와 데이터를 다루는 과학자의 욕구는 어느 정도 닮았다. 기초적인 형태가 이루어 져야 다음 단게를 만드는 건축과 같아 보였다. 이제 데이터를 다룰때 분석과 예측에 보내는 시간 보다, 데이터를 수집하고 연계하는 작업이 필요하다는 점에 인식을 같이 했으면 한다.
다음에는 데이터 관련한 또 다른 주제로 글을 남길까 한다.
'데이터인문학' 카테고리의 다른 글
데이터인문학, 에피소드 1, "교도소 폭동 예측을 위한 데이터 분석" 배경 이야기,데이터 연결하기 (1) | 2023.11.13 |
---|---|
경쟁을 부추기는 숫자들. 주가, 환율, Yes24 인터넷서점 판매지수, 보험판매건수 (1) | 2023.11.09 |
할런코베의 "보이 인 더하우스" (0) | 2023.09.09 |
클루지 (Kluge) 에 관하여 (0) | 2023.06.18 |
넷플릭스 매니페스트 아주 긴 서스펜스 드라마 (0) | 2023.06.10 |