일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | |
7 | 8 | 9 | 10 | 11 | 12 | 13 |
14 | 15 | 16 | 17 | 18 | 19 | 20 |
21 | 22 | 23 | 24 | 25 | 26 | 27 |
28 | 29 | 30 | 31 |
- 분석
- 영화
- 정형데이터
- PGTM
- CC#5
- 데이터분석
- 토스트마스터
- 엘뱌키안
- 제약
- 데이터
- 카이제곱분포
- CC#3
- 대중연설
- 평창
- Toastmaster
- publicspeaking
- Public Speaking
- 2018계획
- 구글#빅쿼리#데이터분석
- 연설
- 취업
- SQLD
- 인과추론
- 사이허브
- 데분
- 공유경제
- 영어연설
- 임상통계
- F분포
- 풀러스
- Today
- Total
목록2024/07 (6)
지지플랏의 DataScience
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/Wz42m/btsIRm0yB0R/TKPeYFxFtQ2Ed1IsMmOnZ1/img.png)
이산확확률변수와 연속확률 변수들을 정리해본다.1. 글목차이산확률변수연속확률변수2. 본문현실의 세계 문제는 다양하고 복잡하다. 동전을 던지는 실험, 도로에서 발생하는 교통사고의 수, 특정 시간동안 걸려오는 콜 전화의 수 등 다양한 상황을 정확하게 반영하기 위해서 다른 확률 변수가 필요하다고 할 수 있다. 확률변수는 특정 현상을 모델링하는데 의의미가 있다. 예컨데 포아송 확률변수는 일정 시간 또는 공간에서 발생하는 사건의 수를 모델링하는데 유용한 식으로 말이다. 오늘은 이산확률 변수에 대하서 정리해보자.2.1. 이산확률변수- 각 시행마다 성공확률($p$)가 정해져 있을때 시행 횟수 ($n$)회 중에서 성공한 횟수 ($X$)의 도수 분포평균: $E(X) = np$ 혹은 $ E(X) = \sum_{k=0}^..
이번 단원들은 확률, 조합, 순열에 대해서 다룬다. 기본적인 내용이니만큼 간단하게 정리해본다.1. 글목차2.1. 순열과 조합2.2. 확률과 통계 빈출 기호2. 본문확률과 통계 과목에서 나오는 2가지 개념은 순열과 조합이다. 2.1 순열과 조합순열(Permutation)정의: 순열은 순서를 고려하여 객채를 배열하는 방법이다. 즉 $n$ 개의 객체 중 $r$개를 선택하여 배열하는 경우의 수를 의미한다. 공식:$ P(n, r) = \frac{n!}{(n-r)!}$ 조합(Combination)정의: 조합은 순서를 고려하지 않고 객체를 선택하는 방법. 즉 $n$개의 객체 중 $r$개를 순서 없이 선택하는 경우의 수공식: $ C(n, r) = \binom{n}{r} = \frac{n!}{r!(n-r)!} $ 2...
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/LC1Rh/btsIy5rxYc0/4CABf61CoTc4mfnDe47PR0/img.png)
선형회귀를 예제를 이용해서 구해보자1. 글목차단순선형회귀다중선형회귀2. 본문 3. 참고Linear Regression in SQL, Is It Possible?Multiple Regression in Pure SQL
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/7t4dN/btsIzA469r1/IB2KBy91qmz6D8F28P54jK/img.gif)
6단원 연구설계 단원에서는 통계학적 질문이 무엇인지, 표본조사의 방법, 통계 연구법의 종류, 실험등에 대해서 배운다. 학부때부터 실험을 많이 진행해왔는데, 빅데이터 산업군에 들어오면서 실험연구에서 진행되는 분석과 유사하면서 다르다고 느껴졌다. 그 구분법이 궁금했었다.이번 글에는 통계 연구법에 대한 분류를 알아본다.1. 글목차2.1. 표본연구2.2. 관찰연구2.3. 실험연구2. 본문양적 연구를의 통계연구법은 표본연구, 관찰연구, 실험연구 3가지로 구분 할 수 있겠다. 2.1. 표본연구정의: 표본 연구는 전체 모집단에서 일정한 기준에 따라 선택된 부분집합. 즉 표본을 조사하여 모집단의 특정을 추정하는 연구방법.특징표본추출: 모집단에서 표본을 무작위로 추출, 표본 추출 방법이 중요함추론: 표본의 결과를 바..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/A0oXM/btsIrae2r6X/2xdOZXkxLyHIkSPw0qe060/img.png)
데이터과학을 위한 통계 스터디에 이어서 Khan Academy의 확률과 통계 단원을 가볍게 공부해본다. Khan Academy는 무료로 수학을 배울 수 있는 플랫폼인데 중학교부터 대학교 과정까지 필수수학을 다루며, 영상과 평가 홈페이지가 매우 잘 되어 있다. 본 카테고리에서는 소개와 동시에 확률과 통계에 대한 내용을 정리하고 유의미한 컨텐츠 내용들을 정리해볼 예정이다. 1. 글목차1단원: 범주형 자료 요약하기2단원: 양적자료를 나타내고 분석하기3단원: 양적 자료의 요약 2. 본문기본적으로 확률과 통계 과목은 대학교 기초 수준의 내용으로 자료분석부터 시작하는 간단한 내용부터 회귀와 분산분석까지 포함하는 단변량, 다변량 분석의 내용까지을 다룬다. 기본적으로 Quiz과 단원별 테스트가 존재하며 이를 알려주..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/bxhtGm/btsIhWhz0aV/TAbuv2JKsudVionHJStdb0/img.jpg)
2달간 데이터과학을 위한 통계 스터디를 완료했습니다! 무사 마무리를 기념하며 책에 대한 평가와 스터디에 대한 회고를 진행해보았습니다. 100년만의 스터디였는데 뒤돌아보니 안했으면 후회했을 것 같네요!1. 글 목차스터디 결성 이유책 리뷰스터디 KPT2. 본문2.1. 스터디 결성이유이제 머신러닝을 조금 아는 수준이 되었는데 뭔가 부족한 이런 마음이 한켠에 있었습니다. 그 니즈를 해결하고자 여러 책을 탐색했었는데 21년에 처음 나온 이 책이 눈에 띄더라구요. 1판에는 R코드만 있었는데 2판이 되면서 Python 코드도 추가되었고 통계, 머신러닝, 데이터과학에 대한 다양한 분야를 아우르는 것 같아 깊은 독서를 위해 진행하게 되었습니다. 2.2. 책 리뷰2.2.1. 책의 장단점기본적으로 데이터사이언스를 위한 이..