본문 바로가기

머신러닝4

머신러닝 모델학습에서의 편향과 분산 1. 머신러닝 모델학습에서 편향과 분산의 의미  편향과 분산의 개념을 간단히 설명하면 데이터의 치우침과 데이터의 퍼져있음을 뜻한다. 머신러닝 모델학습에서의 편향과 분산은 다음과 같이 풀이할 수 있다(황세웅, 2023, 재인용). 편향: 예측한 결과가 정답과 일정하게 차이가 나는 정도 분산: 주어진 데이터 포인트에 대한 모델 예측의 가변성을 의미 2. 편향과 분산의 관계: Trade-Off편향과 분산의 관계는 Trade-Off 관계이다. 즉, 한쪽이 증가하면 한쪽이 감소하는 관계에 놓여 있다. 이 관계는 다음과 같은 예시로 설명할 수 있다.  편향이 크다는 것은 예측한 결과가 정답과 차이가 나는 정도가 크다는 의미로 모델이 데이터에 비해 단순하기 때문에 생긴다. 모델이 단순하게 생겼다면 매번 예측하는 값은.. 2024. 10. 28.
[기록] 머신러닝 자전거 수요 예측 모델 개발 (Kaggle) (2) 지난 이야기 [기록] 머신러닝 자전거 수요 예측 모델 개발 (Kaggle)지난 기록에서는 자전거 수요 예측 모델 개발에 대해 고려해야 할 것들을 단계별로 살펴보고 Kaggle에 Submission을 해보면서 score를 점검하는 시간을 가졌다.  오늘의 계획오늘 할 일은 다음과 같다. - y 값 로그 변환, 역변환 시도 (오전)- 3차 submission (오전)- MSLE 중심으로 보고서 작성 (오후) - 블로그에 내용, 과정 정리하고 PPT로 마무리 작업 개선 시도와 2차 결과: day_of_week, 시간대별 대여건수 day_of_week랑 시간대별 대여건수를 컬럼으로 생성 했을 때 점수가 좋지 않게 나왔다. 성능은 높아졌는데 점수가 1점대가 나와서 다른 조언을 따르기로 했다.  +) 추가  로그 .. 2024. 10. 17.
지도학습과 비지도학습 👀모든 포스팅은 직접 이미지와 글을 작성하고 있습니다. 사용하실 때는 꼭 링크와 출처를 남겨주세요 머신러닝은 기계가 규칙을 학습해서 사람이 매번 하기에는 복잡하거나 어려운 일들을 대신 해주는 기술이다. 여기에는 대표적으로 지도학습과 비지도학습 두 가지 방식이 있는데, 오늘은 각각의 정의와 특징을 다뤄보고자 한다. 지도학습(Supervised Learning)지도학습은 답(올바른 출력)이 있는 훈련 데이터를 학습하는 방식이다. 지도학습은 말 그대로 지도를 해주는 학습이다. 틀렸다 맞았다를 판단할 수 있는 데이터가 포함되어 있는 훈련데이터를 통해 기계는 특정 경우에만 올바른 답이 나오는 규칙을 학습한다.  지도학습에는 KNN, 선형회귀, 로지스틱 회귀, 서포트 벡터 머신, 결정 트리, 랜덤 포레스트, 신경.. 2024. 10. 17.
[기록] 머신러닝 자전거 수요 예측 모델 개발 (Kaggle) 오늘은 머신러닝 예측 모델 개발을 하고 일과 후에는 통계 공부를 할 계획이다. 원래는 시간 있을 때 매일 공부 기록과 후기를 남기려고 했는데 아무래도 여유 시간이 많이 없다보니 따로 시간 내서 작성하기 보다는 쉬는시간에 간단히 남겨도 좋지 않을까 생각했다. 내가 작업한 기록도 남길 겸.  Kaggle의 Bike Sharing Demand로 예측 모델 만들기이번주에는 캐글의 자전거 수요 예측 모델을 만들어보고 있다. 데이터는 아래에서 받아 볼 수 있다.    Bike Sharing DemandForecast use of a city bikeshare systemwww.kaggle.com 모델 만들 때 고려사항예측 모델 만들 때 신경써줘야 할 것들을 적어보자. 1. 전처리 2. 어떤 모델로 돌릴 것인지 3... 2024. 10. 16.