PGR21.com
- 자유 주제로 사용할 수 있는 게시판입니다.
- 토론 게시판의 용도를 겸합니다.
Date 2018/11/13 02:40:47
Name OrBef
Subject [일반] 통계적으로 유의미한 차이 vs 현실적으로 유의미한 차이
거의 뻘소리에 가까운 글입니다.

대단한 이야기를 하려는 것이 아니기에, 서두는 치우고, 바로 본론으로 들어가겠습니다.

"이상의 연구에 따르면, 양 집단 간에는 통계적으로 유의미한 차이가 있다고 볼 수 있습니다"

라는 말을 받아들을 때에는 상당히 조심해야 합니다. 왜냐하면 저 말이 "현실적으로 유의미한 차이가 있다" 라는 뜻이 아니기 때문이죠.

어떤 동전을 100,000 번 던졌더니 앞면이 50,100 번 나왔다고 칩시다. 이 동전은 앞뒤가 나올 확률이 50-50 인 동전일까요 아닐까요?

이런 질문에 대한 답변을 하기 위해서 만든 개념이 p-value 입니다. 앞뒤가 나올 확률이 50-50 인 동전을 100,000 번 던졌을 때, 앞면이 50,100 번 이상 나올 확률을 계산해보면 대충 2.3% 정도가 됩니다. 이 2.3% 를 우리는 p-value 라고 부릅니다. 즉 p-value 란,

"테스트 대상 집단에 아무런 바이어스가 없을 경우에, 우연에 의해 해당 바이어스가 일어날 확률"

을 뜻합니다. 보통 사회과학자들이 통계를 해석할 때 p-value 가 5% 아래라면 해당 테스트 대상 집단에 바이어스가 있다고 결론을 내린다고 합니다. 즉, 위에서 예로 든 동전은 50-50 의 동전이 아닐 확률이 훨씬 더 높다는 거지요. 주어진 자료만 가지고 결론을 내려야 한다면 해당 동전은 50.1% - 49.9% 정도로 기울어진 동전일 겁니다. 즉, 50,100 와 49,900 사이에는 통계적으로 유의미한 차이가 있습니다.

근데 그런 동전이라고 해서 우리가 점심 내기용으로 사용하기에는 아무런 부족함이 없지요. 즉, 해당 동전의 바이어스는 "통계적으로는 유의미" 하지만, "현실적으로는 무의미" 합니다.

해서, 어떤 논문에 사용된 문구가 "양 집단 간에는 통계적으로 유의미한 차이가 있다" 라는 식이라면, 접할 때 어느 정도는 의구심을 가지고 접근해야하는 것 같습니다.

--
본인이 가진 정치 성향에 따라서 사람들이 동일한 삼단논법에 대해서 정/부 판정을 내릴 때 "통계적으로 유의미한 차이가 있다" 라는 논문이 있더라고요. 아니 정말? 이라는 생각이 들어서 읽어봤더니, 71% vs 68% 의 차이가 난 것이고, 그 작은 차이가 모집단의 사이즈를 고려해볼 때 "통계적으로 유의미한 차이가 있다" 라는 소리더군요. 해서 급분노한 김에 글을 써봅니다.

--
화를 달래기 위해서 유튜브에서 본 영상을 부록으로 드립니다.

솔직히 이 이상 실감나고 아드레날린 넘치는 원맨아미 씬이 영화사상 또 있을까 싶습니다.





통합규정 1.3 이용안내 인용

"Pgr은 '명문화된 삭제규정'이 반드시 필요하지 않은 분을 환영합니다.
법 없이도 사는 사람, 남에게 상처를 주지 않으면서 같이 이야기 나눌 수 있는 분이면 좋겠습니다."
스칼렛
18/11/13 02:48
수정 아이콘
전 통알못 p밸류충이긴 하지만 Effect size가 중요하죠. 기존 치료보다 한달 더 살게 하는 비싼 항암제가 무슨 의미가 있나 싶던.

통계가 참 어려운거 같아요. 통계나 자연과학 하시는 분들 사이에선 의사들이 통계 몰라서 이상한 논문 쓰는거 놀리는게 무슨 밈처럼 되어 있기도 하고...
18/11/13 02:49
수정 아이콘
바로 그렇습니다!! 이렇게 한 줄로 요약해주셔서 감사합니다!!
TheLasid
18/11/13 05:36
수정 아이콘
그러니 여러분은 상관분석을 멀리하고 회귀분석을 가까이하시는 편이 좋습니다! (반쯤 농담입니다.)

통계적으로도 유의하고 현실적으로도 ofbef님의 멘탈에 을 유의미한 영향을 준 사례 잘 보았습니다 :)
18/11/13 07:49
수정 아이콘
회귀분석의 회귀 계수도 0.000000001이라는게 통계적으로 유의하다 이래버라면 사실상 아무 의미 없다는거....ㅠ
스주니
18/11/13 18:51
수정 아이콘
꼭 그런건 아니고 스케일 대비로 보셔야맞는게 개미 몸무게를 메가톤으로 스케일 올려버리면 저런 작은 숫자 잘 나옵니다.
18/11/13 18:52
수정 아이콘
(수정됨) 그렇게 안 했는데 저런게 나왔을 때 얘기죠.

개미 무게를 밀리그램으로 측정했는데 저리 나와도 통계적으로 유의하면 유의하다고 주장하는게 지금의 많은 사회과학 논문이니까요.
스주니
18/11/13 18:57
수정 아이콘
사화과학 논문을 안읽어서 ㅠㅠ 그렇다면 참....
18/11/13 06:06
수정 아이콘
베이지언이 이 글을 싫어합니다. 후다다닥
안개곰
18/11/13 06:20
수정 아이콘
여기다 p-해킹 같은걸 끼얹으면...?
18/11/13 06:24
수정 아이콘
으아니 위 세 댓글을 보니 이곳은 통계덕후들이 우글대는 곳이었다는.... 난 여기서 빠져나가야겠어!
18/11/13 08:18
수정 아이콘
통계적으로 유의미한 통계덕후가 존재하는군요!
지바고
18/11/13 09:21
수정 아이콘
위 세 댓글을 이해한다는 자체가 덕후란 증거입니다....
Ps.댓글 달고 글쓴이 닉넴을 보고, 코멘트의 괴리감이 더 커졌네요 크크
18/11/13 10:26
수정 아이콘
제가 공학 전공자이긴 하지만 통계를 쓰지 않는 분야라서, 사실상 초보입니다 :)
signature
18/11/13 07:21
수정 아이콘
귀무가설을 기각한다
아이지스
18/11/13 08:12
수정 아이콘
카이제곱 검정을 실시하겠습니다
jjohny=쿠마
18/11/13 08:37
수정 아이콘
그 정도면 카지노나 도박대회에서 사용하기에는 현실적으로 유의미한 차이일텐데,

그렇다면 점심내기에 사용하기에도 현실적으로 몹시 유의미한 차이로 보입니다. 점심내기는 중요하니까요!
18/11/13 09:00
수정 아이콘
앗 이런, 저만 알고 있으려고 했는데..... (쳇 이래서 눈치 빠른 인간은 싫다니깐!)
18/11/13 09:05
수정 아이콘
학계와 일반인의 사고 방향이 반대인 것도 재미있습니다.

말씀하신 대로, 학계에서는 통계적으로 유의한 차이가 입증되면, 이것이 현실적으로 차이가 있는 것인지를 간과하는 경향이 있지요.

반대로 일반인들은, 통계적으로 유의한 차이가 입증되지 않은 자료를 가지고 현실적으로 차이가 있다고 주장하는 사례가 비일비재하고요.
물론 통계적 차이가 없다고 현실적 차이도 없는 없다고 확정지을 수는 없지만, 어쨌든 해당 시점에서는 unproven된 상태이니.
18/11/13 09:10
수정 아이콘
(수정됨) 저는 통계덕후도 아니고, 사회과학 쪽도 통계 쪽은 체리피킹해서 듣는 사람입니다.. 이래서 개괄서가 아니라 논문을 직접 읽어야하는데, 수포자 출신이라 거대한 악순환의 늪에 빠진 기분이네요.

아직 학부생이니 통계멸시하는 문학비평 및 문학사 부분의 비중을 줄이고, 언어학과 번역학쪽 지식을 늘리려고 자발적으로 노오력중인데도 어째 가르치시는 분들도 통계를 크게 섞지 않으시더군요. 작년에 '기계번역의 이해' 덕분에 information flow 관련해서 조금 배움을 얻었지만 말그대로 강의명에 쓰이는 '이해' 수준이고요...

이런 구질구질한 이야기를 왜 길게 말했냐면, 통계학이 학문이라 참 다행이다...라는 거요.

똑똑한 사람은 어느 시대에 있었으나, 결국 결론이 완전 헛발질일 가능성도 있어버렸고, 지금 같이 지식이 위로 정확히 쌓이기만 하는 시대가 정말 특이점이 아닌가... 연금술사들이 말하길: "모든 약의 처방은 미신적이지 않고, 과학적이어야한다. 기존의 의학은 틀렸다. 의학은 신의 영역이 아니다. 사라센의 약은 페르시아인과 투르크인, 무어인, 크리스천의 병을 모두 났게 한다. 이는 신의 체계 이상의 더 거대한 세계가 우리 삶을 지배하고 있다는 것이다."


"예컨데, 신의 변덕과 달리 하늘에서 기계적으로 움직이는 별들의 움직임이 그렇다. 여태까지 모든 적혀진 지식과 내가 직접 모은 지식들이 상관관계를 가진다."

사실 결론이 다 정해져있는데, 어떻게든 결론이 하나로 안쏠리게 하려는 분야의 노력에 경의를 표합니다.
Colorful
18/11/13 09:14
수정 아이콘
예전에 책에서 통계적으로 유의미하려면
|X-Y|>루트(X+Y) 이어야 한다는 걸 본 기억이 있네요
100명이 투표를 하면 적어도 10표차이가 나야된다는...
metaljet
18/11/13 09:47
수정 아이콘
efficacy vs effectiveness
당연히 학계에서도 원래 고민해야 하는거지만... 그래도 논문 점수는 쌓아야 하니까요 ㅠ
이치죠 호타루
18/11/13 11:24
수정 아이콘
대놓고 거짓말만 안 하기 매우 쉽죠.
그리고 그나마도 못 하는 사람 천지구요.
여왕의심복
18/11/13 11:38
수정 아이콘
진짜 또 고민 또 고민하는 부분입니다.

참 웃긴게 요즘 빅데이터로 넘어가게되면 100만명 대 100만명도 P-hack됩니다.

100만명 평균 51.0 나머지 100만명 평균 50.8이것도 통계적으로 유의한 차이가 되어버리지요.
18/11/13 17:47
수정 아이콘
제가 잘 몰라서 이해가 안되서 질문드리는건데요. 51.0과 50.8로 차이가 있으면 차이가 있는것 아닌가요? 차이가 적다는 것이 차이가 없다는 뜻은 아닌 것 같은데요. 아니면 신뢰도가 모수에 비해서 넓어서 값이 매번 달라질 수 있다는건가요?
여왕의심복
18/11/13 18:15
수정 아이콘
맞습니다 결국 해석의 영역으로 넘어갑니닫. 통계라는 것이 해석의 여지를 줄이기 위해서 사용하는 것인데 결국 다시 해석을 해야하는 상황이 되는겁니다.
루트에리노
18/11/13 19:10
수정 아이콘
차이가 있습니다. 적용 분야에 따라서 의미가 있을수도, 없을수도 있죠.
스칼렛
18/11/13 13:30
수정 아이콘
대신귀
여운0.
06을
드리겠
습니다

몇년 전 미국 통계학회에서 글에서 말씀하신 이유들을 들어 p값의 남용을 주의하라는 성명서를 낸 적도 있다고 하더라고요. 실제로 몇몇 진보적인 학술지는 p값 쓴 논문 안받겠다고 선언했다고...
사업드래군
18/11/13 16:54
수정 아이콘
원래 논문을 쓸때는 p value가 0.049가 나올 때까지 데이터를 갈아 넣는 겁니다. 유의미한 결론!!!
키비쳐
18/11/13 17:16
수정 아이콘
유의미함 아무튼 유의미함
스주니
18/11/13 18:56
수정 아이콘
개인적으로 저런 의미 없는 쥐어짜기 p밸류만 제시한건 다 리젝 주고 방법 자체가 이론적인 바탕이 있을때 저러면 데이터 구하는데 정말 난항을 겪었구나 싶은 공감에 그냥 넘어갑니다.
18/11/13 17:05
수정 아이콘
p-value는 그냥 H0를 기각하게 하는 최소한의 유의수준을 나타낼 뿐 그 이상도 이하도 아니니까요.
애초에 0.05를 쓴 것도 처음에 통계학의 기틀을 정립한 사람이 그냥 쓴게 관습적으로 내려오는 것일뿐..
긴 하루의 끝에서
18/11/13 18:01
수정 아이콘
현실적으로 유의미한 차이라는 데에는 명확한 기준이 없다는 게 사실 가장 중요한 것 아닐까요?
스주니
18/11/13 19:00
수정 아이콘
없기는 한데 분야마다 정해진 가이드라인이 있긴합니다. 제가 하는 통계 분야가 좀 특이해서라고 쓰고 어려서 그런지 분야 안가리고 그냥 통계파트만 리뷰해달라고 부탁하시는 분들이 많은데 그때마다 그 분야에 쓰이는 룰오브썸브 다 주긴 합니다. 극단적으로 유의수준 0.000001도 있긴 하더라구요.
긴 하루의 끝에서
18/11/13 19:25
수정 아이콘
이론은 보편적인 이야기에 해당하는 것이니 개별 특수성을 갖는 각 분야들은 자체적인 실무적 기준을 어느 분야든 가지고 있을 테죠. 저는 이론적 기준과 마찬가지로 보편적으로 통용되는 현실적 유의미함이라는 건 없지 않냐는 얘기였습니다.
스주니
18/11/14 00:45
수정 아이콘
그건 맞는 말씀이십니다.
스주니
18/11/13 19:05
수정 아이콘
본문에서 쓰신 부분 내용을 연구하시는 분도 꽤 많습니다. 예전에 마인즈앤머신 관련 학회를 갔는데 인과관계나 심리통계등등 정확히 제목이 의미하는 부분에 대해 생각 많이 하시더라구요.
목록 삭게로! 맨위로
번호 제목 이름 날짜 조회 추천
78856 [일반] 나는 왜 가는 회사마다 이모양일까 [35] 이꺼저거저시바12388 18/11/14 12388 7
78855 [일반] 로아 기다리는 동안 교육제도에 대한 고찰 [37] 주워니긔6461 18/11/14 6461 3
78854 [일반] 직장인중에서 용이라고 느낄만한 사람 [31] 삭제됨13518 18/11/13 13518 8
78853 [일반] 영화 보헤미안 랩소디를 보고 나서 보면 좋을만한 퀸 영상들 [17] Alan_Baxter10162 18/11/13 10162 9
78852 [일반] [스포일러] 원피스 최악의 혐오캐 모모노스케 [110] TAEYEON19069 18/11/13 19069 5
78851 [일반] 페미니즘 테스트 돌려봤습니다. [123] 레슬매니아11980 18/11/13 11980 1
78849 [일반] 페미를 현실에서 느끼고 있습니다. [124] 삭제됨18621 18/11/13 18621 11
78848 [일반] 40대 대기업 퇴사자들의 1차사 살아남기-3부-남에 부서 일 긁어오기 [42] 미사모쯔12876 18/11/13 12876 32
78846 [일반] [잡담]생전 처음 중고거래 사기를 경험했습니다. -2부: T전화+더치트 짱짱 (오류수정) [19] jjohny=쿠마9709 18/11/13 9709 6
78845 [일반] LG유플러스의 화웨이 채택 이거 전국적으로 크게 문제될거 같습니다 [33] 무플방지협회11697 18/11/13 11697 3
78843 [일반] BTS 티셔츠 논란에 대한 일본방송 [142] 잰지흔15537 18/11/13 15537 3
78842 [일반] 메탈헤드가 걸그룹을 좋아하게 되면서 느낀 점 [23] 로즈 티코6662 18/11/13 6662 4
78841 [일반] 통계적으로 유의미한 차이 vs 현실적으로 유의미한 차이 [36] OrBef13786 18/11/13 13786 5
78840 [일반] 김무성에 대한 20-30의 대답 : 너네도 각자도생 해라 [92] chilling15650 18/11/12 15650 1
78839 [일반] 영국의 역사 - 노르만 왕조의 성립까지 [21] 신불해12187 18/11/12 12187 55
78838 [일반] 숙명여고 쌍둥이 퇴학조치 결정이라네요. [81] Rorschach15310 18/11/12 15310 6
78837 [일반] [잡담]생전 처음 중고거래 사기를 경험했습니다. (심지어 2번 당할 뻔...) [59] jjohny=쿠마11229 18/11/12 11229 0
78836 [일반] 이민을 포기하고 한국에서 사는 것을 선택한 이유 [206] 삭제됨19652 18/11/12 19652 19
78834 [일반] 드디어 나온 태블릿용 카카오톡 [36] 기다30495 18/11/12 30495 0
78833 [일반] 돌잔치, 준비부터 마무리까지 [33] 비싼치킨8388 18/11/12 8388 27
78832 [일반] 한 달간 추리소설을 읽으며 - 우부메의 여름 (스포) [36] 잠잘까8163 18/11/12 8163 5
78831 [일반] 캐나다에서 난리난 동급생 괴롭힘 사건 [83] swear17768 18/11/11 17768 12
78830 [일반] 인디언이 꾸던 악몽은 백인이 아니라 한국인이었을까 [41] Farce16493 18/11/11 16493 25
목록 이전 다음
댓글

+ : 최근 1시간내에 달린 댓글
+ : 최근 2시간내에 달린 댓글
맨 위로