programming/파이썬으로 배우는 통계학

K-Fold 교차 검증_모델 성능 평가

Jofresh 2023. 7. 24. 16:37
728x90
반응형

K-Fold 교차 검증은 모델의 성능을 평가하는 방법 중 하나로, 데이터를 여러 개의 폴드(fold)로 나누어 모델을 여러 번 학습하고 평가하는 방법입니다. 이를 통해 모델의 일반화 성능을 더 정확하게 추정할 수 있습니다.

 

예를 들어, K-Fold 교차 검증을 5개의 폴드로 수행하는 과정을 설명해보겠습니다.

             데이터 준비: 총 100개의 샘플 데이터가 있다고 가정합니다.

             데이터 분할: 데이터를 5개의 폴드로 나눕니다. 이때, 각 폴드는 비슷한 크기의 데이터를 가지도록 무작위로 섞어서 나눕니다.

 

검증을 위해 폴드를 5개로 나눔

 

 

             반복 학습과 평가: 5개의 폴드 중 4개의 폴드를 학습 데이터로 사용하고 나머지 1개의 폴드를 테스트 데이터로 사용하여 모델을 학습하고 평가합니다. 이를 5번 반복하여 각 폴드를 모두 한 번씩 테스트 데이터로 사용합니다.

 

 

각 폴드를 학습하고 테스트함.

 

 

             성능 평가: 5번의 반복으로 얻은 평가 결과를 종합하여 모델의 성능을 평가합니다.

 

예를 들어, 정확도의 평균값을 계산하여 모델의 일반화 성능을 추정합니다.

 

K-Fold 교차 검증을 통해 데이터의 분포에 민감하지 않은 모델의 성능 평가를 할 수 있으며, 모델의 일반화 능력을 더 정확하게 평가할 수 있습니다. 또한, 데이터셋이 작을 때에도 데이터를 최대한 활용하여 모델을 평가할 수 있는 장점이 있습니다.

 

 

 

 

 

** K-fold 교차 검증 실사용 포스팅

 

로지스틱회귀 모델을 이용한 분류 분석_sklearn 머신러닝

안녕하세요. 오늘은 예제를 통해 sklearn의 로지스틱 회귀모델링을 통한 분류 분석에 대해서 포스팅해보겠습니다. 타이타닉호의 생존자/비생존자 그룹을 분류하여 어떤 피처가 생존/비생존에 영

jofresh.tistory.com

 

instargram Jofresh_

 

728x90
반응형