결국 하고 싶은 말은 박스안에 있는 말이다.
p-value가 작아야 실험값을 사용할 수 있고 논문이 통과되고 연구자가 행복해진다.
가설검정의 대상은 항상 귀무가설이다.
대립가설 = 연구자의 주장
귀무가설 = 대립가설의 반대
가설검정하면 알게되는 값 p-value (가설검정은 항상 귀무가설을 검정한다)
p-value가 0에 가깝다! = 귀무가설이 틀렸을 가능성이 높다
귀무가설이 틀릴 가능성이 높다 = 대립가설이 맞을 가능성이 높다
대립가설이 맞다 = 연구자의 가설이 맞았다 = 연구자가 행복해진다
생물이나 의학관련 논문을 보면 항상 나오는 말이 p-value가 어쩌고~ 해서 자기가 맞았다. 라는 식으로 이야기를 전개하는 경우가 많다.
시계열을 공부하면서 가설에 대한 검정으로 p-value라는 말이 자꾸 나와서 공부를 해봤다.
먼저 귀무가설과 대립가설이라는 것을 알아야한다.
귀무가설은 내 주장과 반대되는 가설로 일반적인 상황과 조건에 대해 이야기 한다.
대립가설은 귀무가설의 반대로 내가 주장하고자 하는 가설이다.
예를 들어, 어떤 의약품의 효능을 검증하는 실험에서 귀무가설은 "이 의약품은 효과가 없다"이다. 만약 실험 결과 p-value가 매우 작게 나온다면, 즉, 이 실험 결과는 귀무가설이 맞을 때는 매우 드물게 나타날 수 있는 일이라는 것을 의미하게 되며. 따라서 귀무가설을 기각하고, 대립가설 "이 의약품은 효과가 있다"를 채택할 수 있게 된다.
가설검정에서는 항상 귀무가설을 검정한다. 귀무가설은 연구자가 주장하는 대립가설과는 반대로, 일종의 '기본 가정'으로 생각할 수 있는 것이다. 귀무가설이 기각되면 대립가설이 채택되게 되고 연구자의 주장이 채택되게 되는 것이다.
p-value란, 귀무가설이 맞다는 가정하에, 우리가 관측한 결과 이상이 나올 확률을 의미한다. 이 확률이 작을수록, 우리가 관측한 결과는 귀무가설이 맞다는 가정하에는 매우 드물게 일어난 일임을 나타내고, 따라서 p-value가 작다는 것은 귀무가설을 기각하는 데 충분한 증거가 있다는 것을 의미한다.
p-value는 이론적으로는 0과 1 사이의 값을 가지지만, 보통 0.05나 0.01이 넘지 않으면 유의미하다고 판단한다.
주로 별을 달아서 얼마나 강력한지 (작은지) 나타낸다.
별 갯수가 많을수록 대립가설이 강력해진다 | 대략적인 p-value 값 |
* | 0.1 |
** | 0.01 |
*** | 0.001 |
p-value가 0.05 이하이면, 우리는 귀무가설을 기각하고 대립가설을 채택할 수 있게된다.
p-value는 귀무가설을 검증하기 위한 중요한 지표 중 하나이다. p-value가 작을수록, 귀무가설이 틀릴 가능성이 높아지며, 대립가설이 맞을 가능성도 높아지게 되고, 별이 많아질 수록 연구자가 행복해진다!
[M2 pro MacOS 13] Tensorflow와 Pytorch 설치 및 사용코드정리 (1) | 2023.03.28 |
---|---|
[GPT] 나만의 작은 Chat-GPT! "알파카" 코드 두줄로 설치하는 법 (LLaMA, Dalai, Alpaca 설치법) (3) | 2023.03.26 |
[Anormaly Detection] Isolation Forest 분류트리를 거꾸로 생각하면 이상치를 찾을때 사용할 수 있다! (0) | 2023.03.19 |
캐글/데이콘을 위한 실용가이드 : CRISP-DM for python (0) | 2023.03.07 |
빅데이터 기반의 플라즈마 진단에 관한 생각 (2) | 2023.03.04 |