본문 바로가기

마케팅/데이터

기초 통계 개념_2(비율, 확률, 평균, 분산, 표준편차 등)

기초 통계 개념_2


비율과 확률

비율 : 비교하는 양 / 기준량

확률 : 해당 사건이 일어날 경우의 수 / 일어날 수 있는 모든 경우의 수

 

구매 비율은 연령 별로 다를 수 있어도, 구매 확률은 모두 동일하다.

* 구매확률은 구매한다와 안한다로 나뉘기 때문


확률의 덧셈, 곱셈 법칙

확률의 덧셈 법칙

- 서로 동시에 일어나지 않는 사건(배반 사건)의 경우 두 사건의 확률을 더하여 확률을 구한다는 개념

예시. 동전의 앞면 또는 뒷면이 나오는 사건

 

확률의 곱셈 법칙

- 서로 동시에 일어나는 사건(독립사건 또는 종속사건)의 경우에는 두 사건의 확률을 곱하여 확률을 구한다는 개념

예시. 독립 사건(서로 영향이 없는 사건)

주사위 2개를 던졌을 때 1과 2가 나올 확률

1 / 6 X 1 / 6 = 1 / 18

 

종속사건(사건이 먼저 일어나면 그 다음 사건에 영향을 미치는 사건)

주머니 속 빨간 공 3개, 파란 공 2개가 있을 때, 빨간 공 1개를 꺼낸 뒤 넣지 않고 파란 공 1개를 더 꺼낼 확률

3 / 5 X 2 / 4 = 30%

 

비가 오는 날 우비가 완판될 확률이 50%, 강수확률은 40%, 우비가 완판 될 확률은?

- 해당 사건은 종속사건임

40 / 100 X 50 / 100 = 20%


평균, 분산, 표준편차

데이터가 정규분포를 이루고 있을 때 의미있는 지표

하나의 봉우리를 기준으로 좌우대칭되는 그래프가 되는 상태를 의미

 

평균 : 전체 데이터 합계 / 전체 데이터 개수

분산 : 데이터의 흩어진 정도를 나타내는 값, 그래프에서는 기울기(경사)로 표현

(평균과의 차이)제곱의 합계 / 전체 데이터의 개수

표준편차 : 분산에 루트

 

예시. A/ 평균 거래액 20,000원인 고객 그룹의 평균 거래액을 26,000원으로 올리는 것과

B/ 평균 거래액이 50,000원인 고객 그룹의 평균 거래액을 60,000원으로 올리는 것 중 더 어려운 것은?

 

A의 표준편차는 2,000원 / B의 표준편차는 5,000원

B가 A 대비 1표준편차만큼 더 쉽다.


상관  분석

- 두 변수가 선형적인 관계를 가지는지 분석하는 기법으로 상관계수를 가지고 측정함

- 서로 다른 데이터의 관계를 수치화한 것을 의미

- 상관 분석은 상관 관계에 대한 것을 나타낼 뿐 인과 관계를 나타내지 않음

- 상관계수는 단위가 없기 때문에 단위가 다른 변수들 간의 분석도 가능

 

상관 계수

- 상관계수는 -1 ~ 1사이의 값을 가짐

- 상관계수가 음의 값을 가질 것을 음의 상관관계이므로 한 변수의 값을 작으면 다른 변수의 값도 커짐

- 반대로 상관계수가 양의 값을 가질 경우 한 변수의 값이 커지면 다른 변수의 값도 커짐

 

상관계수는 +-0.4 이상일 경우 상관계수가 있으며, 1과 가까울 수록 상관관계가 높음

 

엑셀에서 CORREL 함수를 사용해서 계산할 수 있음

= CORREL(A변수의 범위, B변수의 범위)

 

예시. CORRL(매출의 범위, 노출의 범위) 와 같이 활용하여 매출이 올랐을 때

노출, 도달, 클릭, 앱설치, 광고비용 중 어떤 수치가 가장 매출액과 관계가 높을까?


A/B 테스트의 가설 설정부터 결과 분석

순서도

가설 설정 -> 변수정의 -> 독립변수별 성과 확인 -> 기존 성과 비교 검증

 

가설설정 원칙

- 가설은 검증 가능하게 설정 : A를 실행하면 B가 10% 증가할 것이다.

- 가설은 데이터 기반으로 설정 : 논리적 유추를 통해 설정해야 하므로 근거(데이터)가 필요,

- 가설 설정을 위한 데이터가 없을 경우, 가설 설정을 위한 데이터 수집 목적의 단기적인 테스트 진행 가능

- 가설 설정을 위한 데이터가 없을 경우, 다른 레퍼런스와 아이디어를 참고해서 가설 설정 가능

 

예시. 구매전환율 개선 실험 가설

가정. 제품의 정가 대신 최대 할인율을 적용한 가격을 보여주면 구매전환율이 증가할 것

1단계. 제품의 정가 대신 최대 할인율을 적용한 가격을 보여주기 위한 비용 산출

2단계. 구매전환율이 얼마나 개선되어야 1단계에서 산출한 비용이 상쇄되는지 계산

가설. 구매전환율이 10% 개선되어야 상쇄된다면 아래와 같이 가설 설정

- 제품의 정가 대신 최대 할인율을 적용한 가격을 보여주면 구매전환율이 10% 증가할 것이다. 


변수 정의

독립 변수 : 원인에 해당하는 변수

독립 변수와 종속 변수는 인과 관계가 이루어지도록 설정

빠르고 정확한 테스트 결과 분석을 위하여 한 번에 한가지 영역만 설정

 

종속 변수 : 결과에 해당하는 변수

종속 변수의 경우 주요 KPI 또는 개선햐애 할 지표를 선택하는 것이 좋음

 

독립 변수 지정할 만한 예시

랜딩 url 또는 링크, CTA 버튼 내 문구, 타이틀 또는 소구 포인트, 이미지 또는 디자인, 타겟 연령 또는 성별 또는 관심사, 캠페인 목표, 비딩

 

종속 변수로 지정할 만한 요소 예시

링크 클릭 수 또는 클릭률, 앱 오픈 수 또는 오픈율, 회원가입 수 또는 가입률, 예약 수 또는 예약률, 구매 수 또는 구매율, 그 외 중요한 KPI나 GOAL

 

결과 분석

독립 변수별 성과 비교

- 독립 변수인 A와 B 중 무엇이 더 종속 변수를 많이 개선 또는 변화시켰는지 확인하는 과정을 의미