일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 |
Tags
- 인과추론
- CC#5
- F분포
- 카이제곱분포
- 데분
- 사이허브
- Toastmaster
- publicspeaking
- 데이터분석
- 영어연설
- 풀러스
- 2018계획
- SQLD
- 대중연설
- 임상통계
- 평창
- 엘뱌키안
- PGTM
- 구글#빅쿼리#데이터분석
- 데이터
- 연설
- Public Speaking
- 영화
- 토스트마스터
- 취업
- 제약
- CC#3
- 정형데이터
- 분석
- 공유경제
Archives
- Today
- Total
목록2024/06/23 (1)
지지플랏의 DataScience

1. 책 목차6.2. 트리모델6.2.1. 간단한 예제6.2.2. 재귀 분할 알고리즘6.2.3. 동질성과 불순도 측정하기6.2.4. 트리 형성 중지하기6.2.5. 연속값 예측하기6.2.6. 트리 활용하기6.3. 배깅과 랜덤 포레스트6.3.1. 배깅6.3.2. 랜덤 포레스트2. 본문트리는 기본적으로 if-else로 이루어지는 구조로 성장한다. 트리(tree,나무)라는 표현을 쓰는 이유는 의사결정과정이 나무가 뻗어나가는 모양과 유사하기 때문이다. 시작하는 변수를 Root 노드(뿌리 노드)라고 하며 마지막 노드를 Leaf 노드(잎 노드)라고 한다. 그렇다면 어떤 변수부터 시작하여 분기해가야하는가? 오늘은 분기를 나눌 때의 기준인 정보이득과 엔트로피를 알아보자. 2.1. 엔트로피첫번째로 엔트로피 개념이 등장한다...
Data Science/데이터과학을 위한 통계
2024. 6. 23. 23:12