다층 다항 회귀와 연도/월 간의 상호작용
연도(year)와 월(month)의 역할
연도와 월을 함께 사용하는 이유는 서로 다른 정보가 있기 때문이다. 연도는 시간적 흐름에 따른 점수 변화를 학습하고, 월은 각 월마다 나타나는 점수의 주기적 패턴을 학습하는 데 주로 사용됨. 연도는 2022년, 2023년 등 시간에 따른 변화 경향을 반영하고, 월은 4월5월에 점수가 높아지고 11월12월에 낮아지는 등의 반복적인 패턴을 잡아냄.
연도(year)와 월(month)이 상호작용하는 방식
연도는 각 연도별로 다른 점수의 평균적 차이를 학습함. 예를 들어, 2022년에는 점수가 대체로 높았고, 2023년에는 낮았다는 전반적인 흐름을 학습함. 반면, 월은 매년 반복되는 주기적 변화를 학습함. 예를 들어, 4월에는 항상 점수가 높고, 12월에는 점수가 낮다는 패턴을 학습하게 됨.
상호작용의 구체적인 방식
연도와 월이 각각 따로 학습되는 것이 아니라, 두 변수 간의 관계가 함께 모델에 반영됨. 연도는 주로 연도별 평균적인 변화 경향을, 월은 매달 반복되는 주기적인 특징을 학습함.
다항 회귀에서 이러한 방식은 수식으로 표현할 수 있음:
이 수식에서 **연도(year)**는 시간적 흐름에 따라 점수가 상승하거나 하락하는 추세를 반영하고, **월(month)**은 주기적인 점수 변화를 학습함. 월에 대해 다항식 변환을 적용하여 비선형적인 패턴을 더 잘 포착할 수 있게 됨.
연도와 월을 함께 학습하는 이유
연도와 월을 함께 사용하는 이유는 두 가지다:
- 연도별 변화 학습: 경제 상황이나 외부 요인에 따라 각 연도마다 평균적인 점수가 달라질 수 있기 때문에 연도별로 학습할 필요가 있음.
- 월별 변화 학습: 매년 반복되는 주기적인 점수 변화를 포착하기 위해 월별로 패턴을 학습함. 예를 들어, 45월에는 점수가 상승하고, 1112월에는 점수가 낮아지는 패턴이 있을 수 있음.
상호작용의 추가 도입
연도와 월이 독립적으로만 학습되는 것이 아니라, 연도와 월의 상호작용 항을 모델에 추가할 수도 있음. 예를 들어, 다음과 같은 수식으로 표현할 수 있음:
이 수식에서 연도와 월의 상호작용을 추가함으로써, 특정 연도에 특정 월의 점수가 더 높거나 낮아지는 패턴을 학습할 수 있음. 예를 들어, 2024년 4월에는 점수가 더 높고, 2023년 4월에는 낮아지는 특징을 반영할 수 있음.
주기적인 패턴 적용
월별로 주기적인 패턴이 있을 경우, 사인(sin), 코사인(cos) 같은 주기 함수를 사용하여 주기적인 특징을 더 잘 포착할 수 있음. 사인 함수와 코사인 함수를 통해 월이 12개월 주기로 반복된다는 특징을 반영할 수 있음.
이러한 주기 함수는 월별 주기성을 모델에 반영하는 데 유용하며, 다항 회귀와 함께 사용할 경우 더욱 정교한 패턴을 학습할 수 있음.
'AI > ML' 카테고리의 다른 글
분류 성능 지표 : Precision, Recall, F1-score (0) | 2024.12.17 |
---|---|
[ML] Feature Engineering (0) | 2024.09.23 |
[ML] 소프트맥스 회귀 구현하기 (0) | 2024.05.07 |
[ML] 소프트맥스 회귀(Softmax Regression) 이해하기 (0) | 2024.05.03 |
[ML] 원-핫 인코딩(One-Hot Encoding) (0) | 2024.04.05 |