일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- 2018계획
- 취업
- 카이제곱분포
- 구글#빅쿼리#데이터분석
- 임상통계
- Public Speaking
- 분석
- 제약
- 풀러스
- 인과추론
- Toastmaster
- 대중연설
- 토스트마스터
- 공유경제
- 사이허브
- F분포
- 데이터분석
- 평창
- 영어연설
- CC#3
- PGTM
- 데분
- SQLD
- 엘뱌키안
- 데이터
- 정형데이터
- publicspeaking
- CC#5
- 영화
- 연설
- Today
- Total
지지플랏의 DataScience
글또 10기를 시작하며 다짐 글 본문
1. 도입
글또 10기가 다시 시작되었다. 8기가 시작한게 23년 1월이니 거의 만 2년에 가까워지는 것 같다. 글또에서 글을 쓰고자고 결심한 이유는 일을하면서 문서의 힘을 경험하면서이다. 결국 다수의 사람들이 커뮤니케이션 하기 가장 기본적은 매체는 글과 문서이라고 느껴졌다. 그렇게 퇴사를 하고 개인사업을 진행하면서 내가 필요한 지식을 Hard Copy 혹은 인터넷에서 수집하는 도중 충격받은 블로그가 하나 있다.
https://recipesds.tistory.com/
히언이라는 닉네임을 가지신 분인데, 데이터사이언스에 대한 직관과 통찰로 단순히 글과 몇 가지 손으로 그린 그래프로 개념을 명쾌하게 설명해준다. 나는 놀랐던 점이, 코딩과 현란한 그래프를 가지지 않고 이렇게 쉽게 설명할 수 있다는 점이 첫 번째였고, 구조화된 글 일련의 글 목차들이 "데이터 사이언스 강좌"에 맞게 구성이 잘 되어있다는 것이 놀라웠다. 얼마나 이 분야에 고민을 많이하고 통달했으면 이런 복잡도가 높은 지식을 글로 명쾌하게 설명할 수 있을까? 실제로 히언님은 위 블로그를 만드시기 전에 임베디드 쪽에서도 체계적이고 깔끔한 설명으로 유명하시다고 한다.
이를 기반으로 하여 내가 글을 쓰고 지향하는 바가 고민해봤다.
- 나 역시 지식을 누군가가 만든 책을 받아 공부를 시작했다.
- 나 역시 이런 지식을 공유하여 보답할 선택지가 있다.
- 또한, 그 지식을 공유하면서 스스로에게 학습이 되고 나아가 나의 가치를 증명하는 기반이 될 수 있다.
2. 목표
그래서 지난 스터디 혹은 업무 간 생각이 났던 이론들을 꾸준히 이 블로그에 올리고 있다. 하지만 몇가지 아쉬운 점이 존재한다. 이론에 집중된 공부를 하다보니 조금은 뻔하고, 가끔은 발전이 없다. 공부의 완성은 지식을 흡수하고 소화시켜서 다시 주춧돌을 만들어 나만의 방식으로 재구성하는 과정이라고 생각한다. 누군가의 책은 좋은 Example이지만 단지 흡수하는 것일 뿐, 피상적으로 이해하고 best use case만 이야기하기 때문에 업무에 적용할 때는 "어떻게 시작해야하지" 라는 물음에 갖히곤 한다.
따라서, 이론을 익혔으면 이를 실무예제에 적용하여 적용하는 것이 중요하다고 느껴졌다. 예를 들면, 단순히 통계분포를 이해하는 것에 넘어 분포가 회사의 업무에 어떤 상황에 쓰일 수 있는지 등을 같이 작성하는 게 글로도, 나의 발전으로도 좋은 방향임을 이해하게 되었다. 따라서 앞으로 글또의 글은 다음 원칙을 가지고 작성해보고자 한다.
1. 비즈니스적 문제 정의
- A/B test raw code 시스템 만들기(무작위 할당, 검정 등)
2. 기반이된 이론 혹은 개념
- 통계적 해결방법이라면 Latex 수식을 이용해서 현상을 수식으로 설명하기
- Technical 방법론 기술의 배경 덧붙이기
3. 위를 실행하기 위한 실용예제
- 독립 실행 가능한 Python Script
- 프로덕트 실행을 위한 git 혹은 Docker 이미지
위 내용을 글로 쓰기엔 꽤나 빡빡한 조건이긴 하다. 일을하면서 독립된 프로젝트를 2주간 만들고 글로 표현한다는 것은 쉽지않은 일임을 지금것 느껴왔다. 그럼에도 불구하고 높은 이상을 잡는 이유는 ① 안하는 것보다 뭐든 하는 것이 낫고 ② 100의 퀄리티 시간을 소모하는 것보다, 80의 퀄리티로 여러 개를 시도해보는 것이 낫다 는 마음가짐이다.
3. 마무리
회사 다닐 때는 멀리했던 이런 지식들이 이제는 조금은 나의 무기로서 갖춰가는 모습이 보인다. 조금은 뿌듯하지만, 어떤 분야도 아직 통달했다고 하기는 어려운 것 같다. 나의 작은 육각형의 스킬을 넓힐 과정을 꾸준히해서 Chief Data Officer가 되는 것이 목표이다. 단순히 알고 끄덕이는 것과 실현하고 구현해서 결과로 내는 것은 분명히 다른 것임을 더더욱 느낀다. 하나씩 조각들을 더 발전시켜 나, 팀, 회사, 데이터 생태계에 좋은 영향을 주는 사람이 되고 싶다. 나의 블로그 별명을 만들어준 지지플랏의 창조자 하들리 윗캠처럼
'Data Science' 카테고리의 다른 글
신뢰구간의 2가지 계산방법: t분포와 부트스트래핑 (0) | 2024.11.24 |
---|---|
ADP 32회 시험 후기와 복기 (0) | 2024.10.13 |
2024년 데이터 직군이 나가야 할 방향 정리하기 ft. AI시대 데이터직군 생존 전략 (0) | 2024.08.20 |
(15) DSforS: Chap7. 7.1 주성분 분석(PCA) (0) | 2024.06.26 |
생존분석과 lifeline 패키지 활용 - LogRank, 카플란-마이어, 콕스비례위험모형 (2) | 2024.06.11 |