728x90

데이터마이닝 5

Google Analytics (구글 어널리틱스)에 대하여

전에 블로그을 쓰면서 생각해 보니 데이터마이닝을 하기 위한 순서가 통계. 분석, 시각화 라고 설명을 하였습니다. 그래서 원래 블로그을 쓸 때 순서대로 공부하면서 써야 하지만.. 아무래도 재미있게 하고 나서 심오하게 들어가는 것이 맞을 것 같애 시각화툴 중에 제 입장에서 그나마 쉬운게 구글 쪽이라 이 부분에서 Google Analytics 을 설명하고자 합니다. 구글 아널리틱스 (Google Analytics) http://www.google.com/analytics/ 일단 요약을 하자면 Google Analytics는 웹로그 분석기 입니다. 아무래도 마케팅 쪽 및 사이트분석에서 많이 사용을 할 수 있을 것 같습니다. 일단 사이트 접속 후 가입을 해야하는데.. 구글 회원이더라도 가입을 다시 해야하네요. 즉..

시스템 2021.01.13

MS - 리프트 차트(Analysis Services - 데이터 마이닝)

리프트 차트(Analysis Services - 데이터 마이닝) SQL Server 2016 and later 다른 버전 적용 대상: SQL Server 2016 A 리프트 chart 는 임의 추측에 대해 비교할 때 마이닝 모델이 제공하는 향상률을 그래픽으로 나타내며 리프트 점수를 기준으로 변화를 측정합니다. 서로 다른 모델에 대한 리프트 점수를 비교하여 가장 적합한 모델을 확인할 수 있습니다. 또한 모델의 예측이 유용하지 않은 지점을 확인할 수 있습니다. 예를 들어 리프트 차트를 검토하면 프로모션 캠페인이 30%의 고객에게만 효과적임을 파악하고 해당 수치를 사용하여 캠페인의 범위를 제한할 수 있습니다. SQL Server 데이터 마이닝에서는 리프트 차트를 사용하여 동일한 예측 가능한 특성이 있는 여러 ..

데이터마이닝 알고리즘

태스크 사례 알고리즘 설명 불연속 특성 예측 잠재 구매자 목록에서 잠재 고객을 좋음 또는 나쁨 플래그로 지정합니다. 다음 6개월 이내에 서버가 실패할 확률을 계산합니다. 환자 결과를 분류하고 관련 요인을 탐색합니다. Microsoft 의사 결정 트리 알고리즘 Microsoft 의사 결정 트리 알고리즘은 불연속 특성 및 연속 특성 모두의 예측 모델링에 사용하기 위해 분류 및 회귀 알고리즘입니다. 불연속 특성의 경우 알고리즘은 데이터 집합 내 입력 열 간의 관계를 기반으로 예측합니다. 이 알고리즘은 해당 열의 값인 상태를 사용하여 사용자가 예측 가능으로 지정하는 열의 상태를 예측합니다. 특히 알고리즘은 예측 가능한 열과 상관 관계에 있는 입력 열을 식별합니다. 예를 들어 자전거를 구입할 가능성이 높은 고객을..

Microsoft 선형 회귀 알고리즘

Microsoft 선형 회귀 알고리즘 SQL Server 2016 and later 다른 버전 적용 대상: SQL Server 2016 Microsoft 선형 회귀 알고리즘은 종속 변수와 독립 변수 간의 선형 관계를 계산하고 이 관계를 예측에 사용하는 데 도움이 되는 Microsoft 의사 결정 트리 알고리즘의 변형입니다. 이 관계는 데이터 계열을 가장 잘 나타내는 선에 대한 수식 형식을 사용합니다. 예를 들어 다음 다이어그램의 선은 데이터를 가장 잘 나타내는 선형 표시입니다. 다이어그램의 각 데이터 요소에는 회귀선으로부터의 거리와 관련된 오류가 있습니다. 회귀 수식에서 계수 a와 b는 회귀선의 각도와 위치를 조정합니다. 모든 요소와 관련된 오류 수의 합계가 최소가 될 때까지 a와 b를 조정하여 회귀 수..

728x90
반응형