본문 바로가기

👩🏻‍💻TECH/머신러닝3

머신러닝 모델 성능 평가 지표 총정리 (정의, 특징, 고려사항) 💡이번 포스팅에서는 이런 것들을 다뤄요머신러닝 모델 성능을 평가하기 위한 지표에 대해서 설명합니다. Accuracy(정확도), Precision(정밀도), Recall(재현율), Confusion Matrix(혼동행렬), ROC-AUC, F1 Score를 다룹니다. 이들 지표는 각각 다른 관점에서 모델의 성능을 측정하며, 따라서 해결하고자 하는 문제 그리고 모델의 특성과 목적에 따라 어떤 지표를 중점적으로 사용할지 결정해야 합니다. 🤔들어가며 지표의 정의에 대해서 설명하기 전에 예측의 4가지 경우에 대해서 이야기하려고 한다. 지표에 따라 이 네 가지 경우 중 어떤 것을 분자와 분모에 두는지가 달라진다. TP: True Positive (실제로 Positive인데 Positive로 예측) TN: Tru.. 2025. 1. 29.
머신러닝 모델학습에서의 편향과 분산 1. 머신러닝 모델학습에서 편향과 분산의 의미  편향과 분산의 개념을 간단히 설명하면 데이터의 치우침과 데이터의 퍼져있음을 뜻한다. 머신러닝 모델학습에서의 편향과 분산은 다음과 같이 풀이할 수 있다(황세웅, 2023, 재인용). 편향: 예측한 결과가 정답과 일정하게 차이가 나는 정도 분산: 주어진 데이터 포인트에 대한 모델 예측의 가변성을 의미 2. 편향과 분산의 관계: Trade-Off편향과 분산의 관계는 Trade-Off 관계이다. 즉, 한쪽이 증가하면 한쪽이 감소하는 관계에 놓여 있다. 이 관계는 다음과 같은 예시로 설명할 수 있다.  편향이 크다는 것은 예측한 결과가 정답과 차이가 나는 정도가 크다는 의미로 모델이 데이터에 비해 단순하기 때문에 생긴다. 모델이 단순하게 생겼다면 매번 예측하는 값은.. 2024. 10. 28.
지도학습과 비지도학습 👀모든 포스팅은 직접 이미지와 글을 작성하고 있습니다. 사용하실 때는 꼭 링크와 출처를 남겨주세요 머신러닝은 기계가 규칙을 학습해서 사람이 매번 하기에는 복잡하거나 어려운 일들을 대신 해주는 기술이다. 여기에는 대표적으로 지도학습과 비지도학습 두 가지 방식이 있는데, 오늘은 각각의 정의와 특징을 다뤄보고자 한다. 지도학습(Supervised Learning)지도학습은 답(올바른 출력)이 있는 훈련 데이터를 학습하는 방식이다. 지도학습은 말 그대로 지도를 해주는 학습이다. 틀렸다 맞았다를 판단할 수 있는 데이터가 포함되어 있는 훈련데이터를 통해 기계는 특정 경우에만 올바른 답이 나오는 규칙을 학습한다.  지도학습에는 KNN, 선형회귀, 로지스틱 회귀, 서포트 벡터 머신, 결정 트리, 랜덤 포레스트, 신경.. 2024. 10. 17.