일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 분석
- 제약
- 데분
- 토스트마스터
- 풀러스
- Toastmaster
- CC#5
- 공유경제
- PGTM
- 평창
- 마케팅 지배사회
- 연설
- 취업
- 대중연설
- 데이터
- SQLD
- 엘뱌키안
- 정형데이터
- CC#3
- 운송법
- Public Speaking
- 영어연설
- 영문연설
- 2018계획
- 구글#빅쿼리#데이터분석
- publicspeaking
- 영화
- Public Spekaing
- 사이허브
- 임상통계
- Today
- Total
목록2024/05 (4)
지지플랏의 DataScience
1. 목차2.9.이항분포2.10. 카이제곱분포2.11. F분포2.12. 푸아송 분포와 그 외 관련 분포들2.13. 마치며 2. 본문2.9. 이항분포이항분포란 각 시행마다 성공확률(p)가 정해져있을때 주어진 시행 횟수(n) 중에서 성공한 횟수(x)의 도수 분포를 말한다. 따라서 n,p에 따라 다양한 이항분포가 존재한다. 이항분포의 평균은 n * p 이며 분산은 n * p * (1-p) 이다.관련용어시행(trial): 독립된 결과를 가져오는 하나의 사건(예: 동전 던지기)성공(sucees): 시행에 대한 관심의 결과(유의어:1, 즉 0에 대한 반대)이항식(binomial): 두 가지 결과를 갖는다.(유의어: 예/아니요, 0/1, 이진)이항시행(bionmial trial): 두 가지 결과를 가져오는 시행(유의..
1. 목차2.4. 부트스트랩2.5. 신뢰구간2.6. 정규분포2.7. 긴꼬리 분포2.8. 스튜던트 t 분포모수, 통계량을 넘어가서 표본샘플링과 신뢰구간, 분포 등에 대해서 알려주는 단원입니다. 2. 본문2.4. 부트스트랩재표본추출(재표집, 리샘플링, resampling): 관측 데이터로부터 반복해서 표본추출하는 과정. 부트스트랩과 순열(셔플링) 과정을 표현부트스트랩(Bootstrap): 통계량이나 모수를 추정하는 방법 중 하나로, 현재 있는 표본에서 추가적으로 표본을 복원추출하고 각 표본에 대한 통계량과 모델을 다시 계산하는 방법, 데이터나 표본통계량이 정규분포를 따라야한다는 가정이없는 장점부트스트랩 표본(Booststrap sample): 관측 데이터 집합으로 얻는 복원 추출 표본 부트스트랩 알고리즘1..
데이터 과학통계 1.5. ~ 2.3.에서는 탐색적 데이터분석의 사례를 소개한다. 1.5 데이터 분포 탐색하기1.6 이진 데이터와 범주 데이터 탐색하기1.7 상관관계1.8 두 개 이상의 변수 탐색하기1.9 마치며2. 데이터와 표본 분포2.1 임의 표본추출과 표본 편향2.2 선택 편향2.3 통계학에서의 표본분포 1. 용어정리커널밀도추정(Kernel Density Estimation): 밀도 추정이란 관측된 데이터로 원래 변수의 확률 분포 특성을 추정하는 것이다. 여기서 밀도 추정 방법에서도 Parametric 한 방법과 Non-Parametric 한 방법으로 나누어진다. Parametric 방법은 정규분포와 같은 분포를 가정하고 밀도를 추정하는 것이다.반면 현실에서는 이렇게 모델이 미리 주어지는 경우가 ..
데이터 과학통계 1.1. ~ 1.4.에서는 탐색적 데이터분석의 사례를 소개한다. 1.1 정형화된 데이터의 요소1.2 테이블 데이터1.3 위치 추정1.4. 변이추정1. 용어 정리데이터과학을 처음 마주할 때 가장 곤란한 사실은 같은 의미를 다른 용어로 쓸 때가 있다는 것이다. 데이터를 레코드라고 하기도하며, 레코드는 2차원 테이블의 행을 뜻한다. 혹은 관측치라고도 부른다. 2차원 테이블에서 세로축을 열이라고 부르기도 차원 혹은 변수라고 부르기도한다. 이는 데이터과학이라는 학문이 통계학과 컴퓨터공학의 2가지 나무에서 성장하여 만난 학문이기 때문이다. 그 때문인지 본 책에서는 용어를 통일하려는 노력을 많이한다. 1.1 정형화된 데이터의 요소연속형 데이터: 구간형, 실수형, 수치형 데이터이산형 데이터: 정수형..