RFM (Recency, Frequency, Monetary value) 분석

데이터리안 SQL 입문반

최근 데이터리안에서 SQL 데이터 분석 캠프 입문반을 수강하면서 현업에서 필요한 데이터 분석 개념을 많이 접하고 있다. RFM은 3가지 기준, 얼마나 최근에 구매했는가(recency), 얼마나 자주 구매했는가(frequency), 얼마나 큰 금액을 사용했는가(Monetary value)에 따라 고객군을 나누는 기법이다. 어떤 고객이 회사에 더 큰 가치를 가져다주는지에 따라 타겟팅된 전략을 수립할 수 있다. 아래 링크에 RFM... [Read More]

ISL 9. Support Vector Machines

An Introduction to Statistical Learning

서포트 벡터 머신(support vector machines; SVM)은 1990년대 컴퓨터 과학계에서 개발되어 지금까지 널리 사용되는 분류 기법 중 하나이다. 이번 챕터에서는 먼저 초평면 분리를 이용하는 최대 마진 분류기(maximal margin classifier)와, 소프트 마진(soft margin)을 이용해 최대 마진 분류기보다 모델의 분산을 낮출 수 있는 서포트 벡터 분류기(support vecotr classifier)에 대해 알아본다. SVM은 선형 결정... [Read More]
Tags: ISL

ISL 8. Tree-Based Methods

An Introduction to Statistical Learning

이번 장에서 학습할 트리(tree) 기반 방법은 예측변인 공간(predictor space)을 여러 개의 단순한 구역으로 계층화 또는 분할한다. 어떤 관측치에 대해 예측하기 위해서는 해당 관측치가 속한 구역에 있는 다른 훈련 관측치들의 평균이나 최빈값을 사용한다. 예측변인 공간을 나누는 규칙을 나무(tree)로 표현할 수 있기 때문에 이러한 방법을 결정 트리(decision tree) 방법이라고 한다. 트리 기반... [Read More]
Tags: ISL

ISL 7. Moving Beyond Linearity

An Introduction to Statistical Learning

지금까지 선형 모델에 대하여 공부했다. 그러나 실제로 선형성 가정이 지켜지는 경우는 거의 없기 때문에 일반적인 선형 회귀는 예측력 면에서 심각한 한계점을 가진다. 이번 장에서는 선형성 가정을 완화하면서 모델 해석 가능성은 유지하기 위한 여러 접근법들을 살펴볼 것이다. 먼저, 다항 회귀(polynomial regression)는 원래의 예측변인들을 거듭제곱하여 선형 모델에 새로운 예측변인으로 추가하는 방법이다. 계단... [Read More]
Tags: ISL

ISL 6. Linear Model Selection and Regularization

An Introduction to Statistical Learning

챕터 7부터 본격적으로 비선형 모델에 대하여 공부하기 앞서 이번 챕터에서는 선형 모델 프레임워크를 확장하기 위한 접근법들을 살펴볼 것이다. 이 접근법들은 다음과 같은 측면에서 선형 모델을 개선시킬 수 있다. 먼저, 예측 정확도이다. 만일 \(n\)이 \(p\)에 비해 그리 크지 않다면 최소 자승 적합에서 변산도가 커져 과적합이 발생할 수 있으며, \(p > n\)이라면... [Read More]
Tags: ISL