지지플랏의 DataScience

[글또] 데이터 분석을 위한 준비하고 배울 것들 본문

Data Science

[글또] 데이터 분석을 위한 준비하고 배울 것들

지지플랏 2024. 2. 18. 22:45

오늘은 준비하고 배울것들을 주제로 데이터분석가가 뻗어나갈 수 있는 Scope에 대해서 작성해보고자 한다.

배경설명


2018년에 데이터분야를 입문하고 의료데이터 분석을 거쳐 이제 5년차를 접어들고 있는 분석가이다. 요즘은 부트캠프에서 학생들에게 튜터링을 진행하고 있는데 나는 당연하다고 생각했던 지식들이 입문자들에게는 어렵고 어떻게 배울지 모르는 부분이 많은 것 같다.  이부분은 고찰해보고 추후 특강 자료로 활용할 생각이다.

예상독자는 데이터분석을 입문하려는 취업준비생이다.

본문

1. 기본 통계지식

통계라는 단어는 무겁고 그 깊이가 끝이 없는 학문이라 어디까지 배워야한다는 다들 다양한 관점이 있을 수 있으나, 적어도 분석을 수행하기 위한 최소한의 기준은 있는 듯하다.

나는 다음 학습을 권하는 편이다.

관련 학습자료
- 기초 통계: 통계의 힘
- 데이터 리터러시: ex 데이터문해력책
- ADspP


2. SQL

SQL은 아마 데이터 분석가라면 거의 필수로 요구되는 언어이다. 관계형 데이터베이스는 이미 기업에 깊게 파고들어서 이를 이용하기 위한 SQL은 필수가 되었다.

SQL은 프로그래밍언어지만 우리가 생각하는 프로그래밍과는 괴리가 있으며 적어도 문법이 어렵진않다(어색할 뿐이다). 그보다 더 큰일 인 것은 SQL은 실제 업무를 할때 부족한 점을 느낄뿐 책로 공부하는 것은 그 중요함이 와닿지 않을때가 많다는 점이다.

SQLD가 관련 자격증인데 취준생들에게 요구되는 자격증이다. oracle 기반의 standard를 배운다는 점이 중요하다. 반면 1과목의 데이터모델링은 현업에서 일하다보면  모호한 개념이 정리되기 때문에 3년차 이상 현업자에게도 재미로 한번쯤 보길 권하는 편이다.

관련 업무
비즈니스 분석: 비즈니스 이해도
데이터마트 생성: Database 지식

관련 학습 자료
자격증: SQLD

3. 파이썬

파이썬은 분석가에게 뭐랄까 계륵일때가 있다. 개발, 분석 다양한 범주를 아우르기에 있으면 좋다! 라는 느낌이 있다.

반면 최신은 분석가의 역할이 LLM에 대체될 것이라고 믿는 분위기라  데이터 엔지니어링을 포함한 개발 스콥을 야금야금 접수하고 있는 것이 트렌드이다.  이런 관점에서 파이썬은 익혀놓으면 쓰기 좋다.

초기 머신러닝이 활발할때 파이썬 무조건! 이라는 분위기가 있었는데  요즘은 LLM 이 워낙 활발해서 기업내에서 Langchain을 이용한 활용에 관심이 많다.


관련 업무
시각화: steamlit(대시보드), folium(지도시각화)
생성형API: langchain

관련학습자료
점프투파이썬
오픈소스 docs


Action Item

  • 다차원 척도법으로 업무 내용을 구분해보기. X축 문과적-이과적(유사 기술적 난이도) 등
  • 최근 학습자료 업데이트하기

7. 글또 9기 글 모음