일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
31 |
- SQLD
- 운송법
- 임상통계
- PGTM
- 제약
- 사이허브
- 토스트마스터
- 2018계획
- 공유경제
- 평창
- 마케팅 지배사회
- 정형데이터
- 풀러스
- 영문연설
- publicspeaking
- CC#3
- Public Speaking
- 영화
- 연설
- 구글#빅쿼리#데이터분석
- CC#5
- 데이터
- 데분
- 영어연설
- 분석
- 대중연설
- 취업
- Public Spekaing
- Toastmaster
- 엘뱌키안
- Today
- Total
목록전체 글 (93)
지지플랏의 DataScience
예상독자 로컬 머신와 빅쿼리를 연결해보고 싶은 독자 데이터 적재 자동화를 동해 태블로에 시각화하고 싶은 독자 1. 배경 데이터분석을 넘어 데이터 파이프라인을 만들어 자동화를 하는 경우가 생긴다. 제일 좋은 것은 데이터 엔지니어 혹은 개발자에게 요청하는 것이겠지만 prototype 혹은 나만의 product를 만드는 관점에서 진행해보고자 한다. GCP 혹은 AWS와 같은 서버(인스턴스)를 생성하여 서버를 사용하는 법이 있긴 하지만 초보자들에게는 서버관리의 어려움도 있고 삽질을 조금 해야해서 최대한 간단한 방법인 google SDK 를 이용해서 big query에 데이터를 저장하는 방법을 알아보겠다. 본 글에서 구현하고자하는 기능은 다음과 같다. Google Cloud Storage 로그인 Google Cl..
예상 독자 시계열 데이터 분석을 입문해보자 하는 사람 Python의 기본을 알고 있고 머신러닝을 접해본 사람 1. 들어가며 시계열 데이터는 말그대로 시간의 정보를 가지고 있는 데이터를 말합니다. 시간마다 측정된 관측치 값(일일 매출량, 재고량, 판매 수익)등을 예측하기 위한 시도는 과거로부터도 관심이 많았습니다. 미리 정보를 알 수가 있다는 것은 그만큼 경영전략을 미리 세울 수 있는 장점이 있기 때문입니다. 시계열의 메인 관점은 다음과 같습니다. 과거가 미래에 어떤 영향을 주는가? 2. 머신러닝 모델과 시계열 모델의 차이 사실 시계열은 머신러닝의 부분 집합이지만 모델링 과정이 살짝 이질적이기 때문에 따로 공부하는 경우가 많습니다. 본 글에서는 머신러닝과 시계열 모델을 구별해서 명명하겠습니다. 대표적으로 ..
오늘은 준비하고 배울것들을 주제로 데이터분석가가 뻗어나갈 수 있는 Scope에 대해서 작성해보고자 한다. 배경설명 2018년에 데이터분야를 입문하고 의료데이터 분석을 거쳐 이제 5년차를 접어들고 있는 분석가이다. 요즘은 부트캠프에서 학생들에게 튜터링을 진행하고 있는데 나는 당연하다고 생각했던 지식들이 입문자들에게는 어렵고 어떻게 배울지 모르는 부분이 많은 것 같다. 이부분은 고찰해보고 추후 특강 자료로 활용할 생각이다. 예상독자는 데이터분석을 입문하려는 취업준비생이다. 본문 1. 기본 통계지식 통계라는 단어는 무겁고 그 깊이가 끝이 없는 학문이라 어디까지 배워야한다는 다들 다양한 관점이 있을 수 있으나, 적어도 분석을 수행하기 위한 최소한의 기준은 있는 듯하다. 나는 다음 학습을 권하는 편이다. 관련 학..
글의 목적 데이터 분석은 self serving부터 시작한다는 가치관을 가지고 일을 하다 보니 엔지니어링 프레임워크 관심을 두게 되었다. 이런 흐름을 반영하듯 Analytic Engineer 직무가 최근에 국내 기업에도 도입되고 있는 것 같아서 구직활동 겸 공부해본다. 대상독자 Analytic Engineer에 관심 있는 현직자, 취준생 데이터 분야에 흐름이 궁금한 개발/데이터 직군 1. Analytics Engineer(AE) 출현배경 데이터의 저장비용하락과 처리기술의 발전으로 빅데이터 직군이 태동하면서 빅데이터 관련 직무들이 많이 파생되어 가는 것은 잘 알려진 사실이다. 이 부분은 성윤님의 유튜브에서 잘 설명된 장표가 있어서 대체한다. 데이터 산업이 발전함에 따라 기존의 세부직군도 회사에 따라 재정의..
1. 글의 목적 종종 데이터 부트캠프에 강사로 참여하다 보면 알고리즘 강의를 해달라는 요청을 받는다. 알고리즘이란 무엇인지 그리고 분석가가 배우면 좋은 점은 어떤 이득이 있는지 작성해본다. 2. 예상독자 데이터 직무에 진입하려는 입문자 알고리즘을 간단하게 알아보고자 하는 사람 3. 본문 도대체 알고리즘이 뭐고 왜 쓰이는가? 알고리즘은 쉽게 말하면 개발자의 수능, 적성문제이다. 프로그래밍이라는 실력의 척도를 측정하기 위한 하나의 도구로 컴퓨터 과학에 등장하는 알고리즘이 발전되어왔다. 알고리즘을 잘한다고 프로그래밍 실력을 보장하진 않지만 어느정도 최소치를 만족하기에 입사시험으로 쓰고 있는 것이다. 그럼 분석가가 알고리즘을 왜 배워야 하는가? 1. 단적인 예!: 누군가에게 아쉬운 소리(특히 개발자에게) 하지 ..
MySQL은 데이터베이스의 한 종류로, 가장 범용적인 데이터베이스입니다. 일반적으로 회사에 데이터베이스에 구축되어 있으면 따로 로컬컴퓨터에 설치하지 않고 SQL WorkBench, DBeaver등 어플리케이션 툴을 이용하여 접속하면 되기 때문에 설치할 일이 없습니다. 반면 개인 학습 혹은 서버를 띄운 상태에서 데이터베이스를 설치하고자 한다면 이 가이드를 통해 로컬에 MySQL 데이터베이스를 설치할 수 있습니다. 목차 MySQL 설치 MySQL Command Line 으로 실행하기 Application을 통해 mysql 접속하기 - DBeaver 나의 데이터 베이스 생성하기 데이터 조회하기 (추가) SQL 이용하여 테이블, 컬럼 이름 변경하기 1. MySQL 설치 MySQL을 설치하는 것은 설치파일을 실행..
1. 글의 목적 AI에 대하여 대중들이 쉽게 이해할만한 글을 작성해보자 AI의 발전과정을 알아보고 기호주의와 연결주의에 대해서 알아보자 2. 본문 AI가 세상을 완전히 바꾸지 못하는 이유 머신러닝 딥러닝을 포함한 AI가 세상을 바꿀 것 같이 광고하고 있다. 하지만 실제로 산업에서 적용에 실패하고 AI는 허상이라고 느낄 수도 있을 것 같다. 여기엔 2가지 문제가 있다. 데이터 분석 등 의사결정에 영향을 끼치는 AI는 그 성과를 정량화하기 어려움 성과가 있더라도 그 노하우를 굳이 외부에 홍보할 필요가 없기 때문 성과 낼 수 있는 딥러닝은 현재 이미지와 자연어 처리에 국한되어 있어, 작고 좁은 분야에서 활약을 하기 때문 세상의 모든 문제를 AI로 해결하지 못하는 이유 세상의 정보에는 2가지가 있다고 한다. 바..
부제: 글또 처음 시작하려는 뉴비에게 고함! 1. 예상 독자 정기적인 글을 쓰려고 하는 블로거 글또가 처음인 뉴비 🙋♂️ 2. 글의 목적 "문서로 남기지 않는 사람은 사기꾼" 이라는 팀장님의 격언이 뇌리에 박힌 이후, 글또를 시작하게 되었다. 글또를 시작할 때는 패기넘치기게 2주에 1번 글 쓰는 거? 쉽지 라고 생각했지만, 생각보다 일정하게 글을 기고기는 쉽지 않았다. 앞으로 (1)매번 새 기수에 진행할 나에게 그리고 (2) 새롭게 글을 쓰고자 하는 독자들을 위해 글 잘 쓰는 노하우를 남겨본다. 3. 본문 글쓰기 쉬운 주제를 정하자 개인적으로 제일+제일 중요하다고 생각하는 것이다. 공부를 따로 해서 글을 남기면 투자시간이 확 올라간다. 그보단 현실이나 업무에서 마주치는 문제와 경험들을 정리하는 연상선이..