일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 |
Tags
- SQLD
- Toastmaster
- 연설
- 인과추론
- 데분
- 분석
- 엘뱌키안
- 풀러스
- 카이제곱분포
- 영화
- CC#3
- 구글#빅쿼리#데이터분석
- F분포
- 사이허브
- 평창
- 영어연설
- 데이터
- 제약
- 데이터분석
- 임상통계
- 공유경제
- 토스트마스터
- 2018계획
- Public Speaking
- 취업
- 정형데이터
- publicspeaking
- 대중연설
- PGTM
- CC#5
Archives
- Today
- Total
목록2024/06/23 (1)
지지플랏의 DataScience
(13)DSforS: Chap6. 6.2 트리 모델 - 정보이득개념
1. 책 목차6.2. 트리모델6.2.1. 간단한 예제6.2.2. 재귀 분할 알고리즘6.2.3. 동질성과 불순도 측정하기6.2.4. 트리 형성 중지하기6.2.5. 연속값 예측하기6.2.6. 트리 활용하기6.3. 배깅과 랜덤 포레스트6.3.1. 배깅6.3.2. 랜덤 포레스트2. 본문트리는 기본적으로 if-else로 이루어지는 구조로 성장한다. 트리(tree,나무)라는 표현을 쓰는 이유는 의사결정과정이 나무가 뻗어나가는 모양과 유사하기 때문이다. 시작하는 변수를 Root 노드(뿌리 노드)라고 하며 마지막 노드를 Leaf 노드(잎 노드)라고 한다. 그렇다면 어떤 변수부터 시작하여 분기해가야하는가? 오늘은 분기를 나눌 때의 기준인 정보이득과 엔트로피를 알아보자. 2.1. 엔트로피첫번째로 엔트로피 개념이 등장한다...
Data Science/데이터과학을 위한 통계
2024. 6. 23. 23:12