목록Machine Learning/Classifier (2)
Patrick's 데이터 세상
Sklearn에서 제공하는 Classifier 모듈을 활용하여 분류 모델을 만듭니다. Task는 긍정, 중립, 부정 3개로 분류하는 감성 분류 모델입니다. 👉🏻 Data Load & Check vectorize는 content 데이터로 TF-IDF vectorizing 한 'vec'을 활용하였습니다. df.head() 👉🏻 Train Test Split from sklearn.model_selection import train_test_split train_data, test_data = train_test_split(df, test_size=0.2, random_state=42) train_data = train_data.reset_index() test_data = test_data.reset_ind..
기계 학습에서 분류, 회귀 분석 등에 사용되는 앙상블 학습 방법의 일종으로 훈련 과정에서 구성한 다수의 결정 트리로부터 분류 또는 평균 예측치(회귀분석)를 출력함으로써 동작한다. wikipedia 출처 RanDomForest는 DecisionTree(의사 결정 트리)가 여러 개 모여서 Forest를 이룬 듯한 구조를 가지고 있다. 만일 feature가 9개라면, Random Forest에서 3개의 Tree에 각각 3개의 feature를 쪼개어 할당한다. 간단히 말해 2개의 Tree가 dead라고 예측하였으니, 심슨은 dead라고 예측될 것이다. - 집단 학습을 기반으로 고정밀 분류, 회귀, 클러스터링 구현 - 학습 데이터로 다수의 의사결정 트리를 만들고 그 결과의 다수결로 결과 유도 랜덤포레스트를 이해하..