Gaussian Naive Bayes(2)
-
나이브 베이즈(Naive Bayes) 실습(1) - 붓꽃 분류
이 포스트는 허민석님의 유튜브 머신러닝 내용을 정리한 글입니다. 실습 코드는 도서 나의 첫 머신러닝/딥러닝에서 발췌해왔습니다. 실습 코드와 자료는 링크의 Github에서 볼 수 있습니다. 이번 포스트에서는 붓꽃(iris)의 꽃받침 특징을 데이터로 활용하여 붓꽃의 종류를 분류해보겠습니다. 학습 모델은 이전 포스트에서 알아본 나이브 베이즈 알고리즘 중 하나인 가우시안 나이브 베이즈 모델(Gaussian Naive Bayes)을 사용하겠습니다. 가우시안 나이브 베이즈 모델을 사용하는 이유는 붓꽃 데이터 특징들이 이산적이지 않은 연속적인 성질을 가지고 있기 때문이며, 자세한 내용은 이전 포스트를 참고해주시길 바랍니다. 붓꽃 분류는 연속적인 특징을 갖는 데이터 분류의 대표적인 예시로, 이미 사이킷런 내에 데이터가..
2022.01.29 -
나이브 베이즈(Naive Bayes)
이 포스트는 허민석님의 유튜브 머신러닝 내용을 정리한 글입니다. 실습 코드는 도서 나의 첫 머신러닝/딥러닝에서 발췌해왔습니다. 실습 코드와 자료는 링크의 Github에서 볼 수 있습니다 이번 포스트에서는 머신러닝 지도 학습 분류 알고리즘 중 하나인 나이브 베이즈(Naive Bayes) 알고리즘에 대해 알아보겠습니다. 이미 우리는 이전 포스트들에서 다양한 분류 알고리즘에 대해 알아봤습니다. 대표적으로 kNN은 데이터의 특성을 벡터 공간의 축으로 지정해서 데이터 간의 유클리드 거리를 토대로 분류했으며, SVM에서는 데이터를 분류하는 적절한 Decision Boundary를 찾아 데이터를 분류했습니다. 이번에 알아볼 나이브 베이즈 알고리즘은 확률 기반 알고리즘으로, 데이터를 독립적인 사건으로 가정(Naive)..
2022.01.24