본문 바로가기
개인 공부

데이터 사이언티스트(Data Scientist) 란?

by KwonSoonBin 2021. 9. 18.

데이터 과학

 - 현실에서 발생하는 문제를 해결하기 위해 컴퓨터를 활용하여 데이터를 분석하는 작업 전반을 의미한다.

 

데이터 과학자는 주로 팀을 이루어서  프로젝트를 수행한다. 정해진 기한과 업무량을 혼자서 해 낼 수 있는 경우는 거의 없기 때문이다.( 혼자 다 할 수 있는 역량을 가진 사람을 유니콘이라고도 함).

데이터 과학자가 갖춰야 할 자질에는 협업을 위한 의사소통 능력이 있다.(팀 단위로 프로젝트 진행하기 때문)

또한 비즈니스 실무자와 IT엔지니어 사이에서 소통하는 역할도 있다.

 

데이터 과학자에게 요구되는 실무 능력에는 아래 3가지가 있다.

  • 프로그래밍 스킬
  • 수학 & 통계학 지식
  • 도메인 전문성

도메인 전문성이란 무엇일까? 

내용을 정리하면 비즈니스에 대한 이해력을 갖춘 사람, 실무자, 문제 해결을 위한 가설설정과 검증하는 과정을 진행할 수 있는 사람..., 간단히 정리하면 특정 분야에 대한 전문적인 지식이라고 할 수 있을 것 같다.

 

이 도메인 전문성은 데이터 과학자가 되기 위해 특히 더 강조되는 부분이다. 그 이유는 프로그래밍 스킬과 수학적 지식을 갖춰도 도메인 전문성이 부족하면 공허한 작업이 되는 경우가 생긴다.

 예시로

'위급 환자 선별'

  • 의학적 지식이 없는 사람은 위급한 환자를 나누는 기준을 설정할 수 없음, 호흡? 나이? 의식?

'약 선택' 

  • 약에 대한 지식이 없는 사람은 'A'라는 약을 선택했을 때 이에 따른 부작용과 특정 질환이 있는 환자에게 처방 여부를 알 수 없음

'SNS 마케팅'

  • "SNS를 통해 제품 홍보를 하자!"라고 했을 때 SNS를 하지 않는 사람일 경우 요즘 인기 있는 SNS,  인기 모델, 유행 등을 알 수 없다.

도메인 전문성이 없다 -> 기준을 정할 수 없다 -> 우선순위, 원인, 결과를  도출해 내는 능력이 부족 or 없다.로 이어진다.

도메인 전문성을 갖춘 사람은 실습 요인에 접근이 더 빠르고 더욱 효율적으로 일 진행 가능하고 이는

데이터 선별 능력 -> 결과물의 질 상승 -> 프로젝트 성공으로 이어진다.

 

 

 

 

 

출처 https://aitrack.lms.elice.io/home

'개인 공부' 카테고리의 다른 글

Pandas 개념 및 기본정리  (0) 2021.09.26
Numpy 개념 및 기본정리  (0) 2021.09.26
List comprehension(LC)과 삼항연산자  (0) 2021.09.25

댓글