Python/Data Analysis

Python/Data Analysis

[Machine Learning] 스태킹 앙상블

■ 스태킹 앙상블의 개요 스태킹(Stacking)은 개별적인 여러 알고리즘을 서로 결합해 예측 결과를 도출한다는 점에서 배깅(Bagging), 부스팅(Boosting)과 공통점을 가짐 하지만, 개별 알고리즘으로 예측한 데이터를 기반으로 다시 예측을 수행한다는 큰 차이점을 가짐 이 때, 기반 모델들이 예측한 값을 통해 메타 모델이 이를 학습하고 예측하는 모델 스태킹 모델의 핵심은 여러 개별 모델의 예측 데이터를 각각 스태킹 형태로 결합해 최종 메타 모델의 학습용 피처 데이터 세트와 테스트용 피처 데이터 세트를 만드는 것 ■ 스태킹 앙상블의 구체적인 프로세스 with python 위스콘신 암 데이터 세트에 기본 스태킹 모델을 적용해본다. 데이터 로딩 후 학습/테스트 데이터로 분할 # 필요한 모듈 불러오기 i..

Python/Data Analysis

[Pandas] 머신러닝 데이터 분석

1. 머신러닝 개요¶1-1. 머신러닝이란?¶ 머신러닝(machine learning) : 기계 스스로 데이터를 학습하여 서로 다른 변수 간의 관계를 찾아 나가는 과정 해결하려는 문제에 따라 예측(prediction), 분류(classification), 군집(clustering) 알고리즘 등으로 분류됨 예측(prediction) : 주가, 환율 등 경제지표 예측 등 분류(classification) : 은행에서 고객을 분류하여 대출을 승인하거나 거절하는 문제 등 군집(clustering) : 비슷한 소비패턴을 가진 고객 유형을 군집으로 묶어내는 문제 등 복잡한 이론보다는 실제 데이터를 가지고 간단한 문제부터 예측해보는 것이 바람직함 1-2. 지도 학습 vs 비지도 학습¶ 머신러닝은 크게 지도 학습, 비지..

semperparatus
'Python/Data Analysis' 카테고리의 글 목록