[정시 용어의 이해 (심화)] 5편 : 표준점수 함수의 형성 원리 (탐구)
안녕하세요
표준점수, 등급, 백분위에 관한 기본 설명을 모두 마치고 드디어 심화편에 들어왔습니다.
타이틀에 (심화) 표시를 붙였지만 사실 이번 편은 크게 어려운 내용이 아니고, 다음 편이 진짜 어렵습니다.
특히 이번 편에서 파트 Ⅰ~Ⅱ 부분은 다음 편 내용의 기본이 되기 때문에 이 파트만이라도 잘 숙지해주시기 바랍니다. 파트 Ⅲ~Ⅳ는 솔직히 말씀드리면 TMI에 가깝습니다.
지난 편 링크입니다.
[1편] 표준점수 기본 : https://orbi.kr/00059924973
[2편] 표준점수와 등급컷 : https://orbi.kr/00059952153
[3편] 표준점수 증발/점프 현상 : https://orbi.kr/00059992389
[4편] 백분위 계산법 : https://orbi.kr/00060019522
다 읽으실 필요는 없고, 1편 정도만 읽고 오시면 될 것 같습니다.
Ⅰ. (사회/과학/직업)탐구 표준점수 함수의 원형
탐구 영역에서 표준점수 함수의 원래 형태는 다음과 같습니다.
S는 표준점수, x는 원점수입니다.
"어! 1편에서는 S = ax + b라고 했잖아요! 그럼 1편에서 거짓말을 한 건가요?"
거짓말이 아닙니다. 함수를 다음과 같이 변형시키면 결국 S = ax + b꼴이 된다는걸 알 수 있습니다.
여기서 x의 계수를 a로, 상수항을 b로 처리하면 결국 S = ax + b가 되는거죠.
1편에서는 여러분들의 이해를 돕기 위해 표준점수 함수를 S = ax + b로 간략화하여 소개하였습니다.
하지만 이번 편은 심화편인만큼, 원형도 함께 곁들여서 설명할 테니 잘 따라오시기 바랍니다.
Ⅱ. 탐구 표준점수 함수의 요소
* 읽을때 표준'편차'와 표준'점수' 헷갈리지 않으시기 바랍니다. 저도 쓰면서 계속 헷갈리더라고요.
표준점수 함수의 요소는 원점수(x), 평균(m), 표준편차(σ), 이 세 가지입니다.
그런데 원점수(x)는 개인에 따라 다르기 때문에 논외로 하고,
평균(m)과 표준편차(σ)가 표준점수에 어떻게 영향을 주는지 살펴보도록 하겠습니다.
(1) 평균
표준점수 함수에서 평균의 역할은 다음과 같습니다.
"평균이 낮을수록 표준점수가 전체적으로 높아진다."
사실 당연한 이야기입니다. 표준점수는 난이도가 반영된 점수 체계이지 않습니까?
평균이 낮을수록 난이도가 어렵다는 의미니까, 평균이 낮을수록 표준점수가 높은 것은 당연합니다.
수식에서도 이를 충분히 증명할 수 있는데요
m이 작을수록 x-m이 커지는거니까, 결국엔 S가 커지는 결과로 이어지게 되는 것입니다.
상식적으로 충분히 받아들일 수 있는 이야기이기 때문에 여기까지만 설명하고 넘어가도록 하겠습니다.
(2) 표준편차
표준점수 함수에서 표준편차의 역할은 다음과 같습니다.
"표준편차가 낮을수록 (저득점자와 고득점자 간의) 표준점수 격차가 커진다."
이 사실 자체는 수식을 통해 충분히 증명 가능합니다.
표준점수 함수를 S = ax+b라고 할 때, x의 계수 a는 다음과 같다고 하였습니다.
즉, a는 표준편차와 정확히 반비례 관계입니다.
표준점수 함수 S = ax + b의 특징 중에 하나는 다음과 같습니다.
"원점수가 1점 오를 때마다 표준점수는 a점씩 오른다."
결국 a가 클수록 표준점수 격차가 커진다는 사실을 알 수 있습니다.
그런데 a는 표준편차와 반비례 관계라고 했으니
a가 커지기 위해서는 표준편차가 작아져야 합니다.
따라서 표준편차가 작을수록 표준점수 격차가 커진다는 결론을 얻을 수 있습니다.
음... 그래도 잘 모르겠다면...?
직접 계산해보면 되죠!
평균이 25점이고 표준편차가 13점이라고 가정했을 때
0점과 만점(50점)의 표준점수를 각각 구해보면 31점과 69점이 나온다는 사실을 알 수 있습니다.
이때의 0점과 만점의 표준점수 격차는 38점이 되겠네요.
그렇다면 평균은 유지한 채 표준편차만 9점으로 낮춰보겠습니다.
0점과 만점(50점)의 표준점수를 각각 구해보면 22점과 78점이 나오게 됩니다.
이때의 0점과 만점의 표준점수 격차는 무려 56점입니다.
아까의 38점과 비교해보면 확연한 차이가 있죠?
이처럼 표준편차가 작을수록 표준점수의 격차가 커진다는 사실을 구체적인 예를 통해서 알아보았습니다.
그런데 왜 그런걸까요? 왜 표준편차가 낮을수록 표준점수 격차가 커지도록 설계했을까요?
표준편차가 작으면 위 그래프처럼 인원이 평균 주변에 몰리는 경향이 나타납니다.
인원 대부분이 평균 주변에 몰려있는 상황에서 혼자서 고득점을 한다면, 잘하는게 훨씬 두드러져 보이겠죠? 그래서 이때 고득점자에게 상당히 높은 표준점수를 주는 것입니다.
그런데 반대로, 이 상황에서 매우 낮은 점수를 받는다면
"남들은 그래도 평균 근처에는 다 갔던데, 넌 그 근처도 못 가고 뭐했니?"
가 되어버리는거죠. 따라서 저득점자에게는 표준점수가 상당히 낮게 부여되는 것입니다.
고득점자에게는 표준점수를 상당히 높게 주고, 저득점자에게는 상당히 낮게 주니
결국 표준점수 격차가 커지는 결과로 이어지는 것이죠.
그런데 평균이 유지된 채로 표준편차만 커지면?
평균 주변에 있던 인원들이 다 흩어져서 양 끝에 각각 몰리게 될겁니다.
따라서 고득점자 입장에서는 "너 말고도 고득점자 많은데? 표준점수를 좀 덜 줘야겠군."이 되는 것이고
저득점자 입장에서는 "너 말고도 저득점자가 많네? 표준점수를 조금 더 줄게."가 되는 것입니다.
결국 둘의 표준점수 격차는 줄어들게 되는 것이죠.
이해를 돕기 위해 혼잣말을 동원해봤는데 이해가 잘 되셨을지는 모르겠습니다 ㅎㅎ...
마지막으로 표준편차가 작아지면 누구에게 이득이고 누구에게 손해인지 수식 관점에서 살펴보고 다음 파트로 넘어가겠습니다.
(1) 원점수(x)가 평균(m)과 매우 가까울 경우
'x - m'이 거의 0이 되므로, 수식에서 파란색 네모친 부분의 값이 0에 수렴합니다.
따라서 저 부분을 0으로 처리하면 표준점수(S)는 50점에 수렴한다는 사실을 알 수 있습니다.
x - m이 0에 가깝기 때문에 표준편차(σ)의 영향은 잘 받지 않습니다.
(2) 원점수(x)가 평균(m)보다 높을 경우
'x - m'이 양수이므로, 표준편차(σ)가 작을수록 파란색 네모친 부분의 값이 커집니다.
따라서 표준편차(σ)가 작을수록 높은 표준점수를 받을 수 있으며, 표준편차(σ)가 크면 표준점수를 덜 받게 됩니다.
(3) 원점수(x)가 평균(m)보다 낮을 경우
'x - m'이 음수이므로, 표준편차(σ)가 작을수록 파란색 네모친 부분이 절댓값 큰 음수가 되어 손해가 커집니다.
따라서 표준편차(σ)가 작을수록 표준점수가 낮아지며, 표준편차(σ)가 크면 상대적으로 높은 표준점수를 받게 됩니다.
Ⅲ. 표준점수 함수 구해보기
실제로 여러분이 교육청 학력평가에서 탐구 표준점수 함수를 직접 구해보실 수 있습니다.
교육청 학력평가 채점자료에는 평균과 표준편차가 명시적으로 주어져있기 때문입니다.
다만 평가원 모의평가와 수능은 평균과 표준편차를 안 주기 때문에 여러분이 구할 수 없는...건 아니지만 구하기가 어렵습니다.
따라서 이 파트에서는 교육청 학력평가 자료를 통해 표준점수 함수를 직접 구해보는 것으로 하겠습니다.
올해 10월 전국연합학력평가 채점 결과 파일을 첨부했는데, 다운받기 싫으시면 안 받으셔도 괜찮습니다.
다운받아서 '영역별 원점수평균 및 표준편차' 탭에 들어가시면
다음과 같이 인원, 평균, 표준편차가 과목별로 모두 기록되어 있습니다.
탐구 표준점수 함수는 평균과 표준편차만 있으면 구할 수 있으니까, 구하는게 그리 어렵지는 않을겁니다.
그러면 함수를 직접 구해보는데 뭘 구해볼까요...
화학Ⅰ, 생명과학Ⅰ, 물리학Ⅱ 이렇게 세 과목의 표준점수 함수를 구해보겠습니다.
화학Ⅰ : 평균(m) = 24.44점, 표준편차(σ) =12.87점
생명과학Ⅰ : 평균(m) = 24.96점, 표준편차(σ) =10.94점
물리학Ⅱ : 평균(m) =16.26점, 표준편차(σ) =10.96점
이 값만 그대로 아래 식에 집어넣으시면 되겠죠.
정말 그대로 집어넣으시면 됩니다.
전혀 어렵지 않죠?
이제 이 함수에 x = 30을 대입하시면 30점의 표준점수가 나오는 것이고
x = 45를 대입하시면 45점의 표준점수가 나오는 것입니다.
"S = ax + b 꼴로 바꿔야 하는 것 아닌가요?"
굳이 안 바꾸셔도 됩니다. 이 자체로도 표준점수 함수입니다.
하지만 ax+b가 훨씬 직관적이긴 하니까, 그 꼴로 한 번 바꿔보겠습니다.
무한소수를 끝까지 쓸 수는 없으니, 소수점 아래 넷째 자리까지만 표현했습니다.
이렇게 교육청 학력평가의 채점 자료를 통해 여러분이 직접 표준점수 함수를 구해보실 수 있습니다.
교육청 학력평가 채점 자료는
학력평가자료 > 교육정보 > Home (sen.go.kr)
서울특별시교육청 사이트에서 웬만하면 다 찾아보실 수 있습니다.
Ⅳ. 표준점수 함수의 그래프
함수 얘기가 나오면 역시 그래프가 빠질 수 없겠죠.
그래서 이 파트에서는 위에서 구한 표준점수 함수를 토대로 그래프를 그려볼겁니다.
(1) 생명과학Ⅰ vs 물리학Ⅱ
생명과학Ⅰ과 물리학Ⅱ의 표준점수 함수는 각각 다음과 같았습니다.
이 식을 토대로 원점수(x)를 가로축으로, 표준점수(S)를 세로축으로 두고 그래프를 그려보겠습니다.
그려보니까 어떤가요? 마치 둘이 평행하는 것처럼 그려졌습니다.
그리고 물리학Ⅱ의 그래프가 생명과학Ⅰ보다 전반적으로 위에 있습니다. 왜 그런걸까요?
둘의 평균과 표준편차를 유심히 보셨다면 알 수 있습니다.
생명과학Ⅰ : 평균(m) = 24.96점, 표준편차(σ) =10.94점
물리학Ⅱ : 평균(m) =16.26점, 표준편차(σ) =10.96점
둘을 비교해볼때, 표준편차(σ)는 거의 비슷합니다. 표준편차가 비슷하기 때문에 그래프의 기울기도 비슷해서 거의 평행하는 것처럼 그려진 것이죠.
그러나 평균(m)에서 큰 차이가 나고 있습니다. 물리학Ⅱ의 평균이 생명과학Ⅰ보다 8.7점이나 낮죠?
두 그래프를 비교함으로써 다음과 같이 의미 있는 관찰을 할 수 있습니다.
① 표준편차(σ)가 비슷한 경우에, 평균(m)이 낮을수록 표준점수가 전반적으로 높아진다는 사실을 다시 한 번 살펴볼 수 있었습니다.
② 표준편차(σ)가 비슷하기 때문에, 두 과목에서 저득점자와 고득점자 간의 표준점수 격차는 비슷하다는 사실도 알 수 있습니다. 실제로 생명과학Ⅰ의 0점과 만점의 표준점수는 각각 27점, 73점이므로 격차는 46점이고, 물리학Ⅱ의 0점과 만점의 표준점수는 각각 35점, 81점이므로 역시 격차가 46점이 됩니다.
(2) 화학Ⅰ vs 생명과학Ⅰ
이번에도 앞에서 구한 함수를 토대로 그래프를 그려보겠습니다.
처음에는 화학Ⅰ의 표준점수가 더 높았는데, 20점대 후반 쯤에서 생명과학Ⅰ이 화학Ⅰ을 따라잡습니다.
이번에도 평균과 표준편차를 통해 이유를 살펴보도록 하겠습니다.
화학Ⅰ : 평균(m) = 24.44점, 표준편차(σ) =12.87점
생명과학Ⅰ : 평균(m) = 24.96점, 표준편차(σ) =10.94점
둘을 비교해볼 때, 평균(m)은 생명과학Ⅰ이 살짝 더 높고, 표준편차(σ)는 화학Ⅰ이 많이 높네요.
이 조건은 생명과학Ⅰ 저득점자에게는 최악의 조건이라고 할 수 있습니다.
일단 평균(m)이 높으면 표준점수가 낮아진다고 했고, 표준편차(σ)가 낮으면 고득점자에게 이득인거지 저득점자에게는 오히려 손해이기 때문에 저득점자 입장에서는 나쁜 조건만 모두 갖춘 것이나 다름없습니다.
따라서 생명과학Ⅰ의 그래프가 더 낮은 위치에서 시작한 이유를 여기에서 찾을 수 있습니다.
그러나 고득점 영역에서는 표준편차(σ)가 낮은 것이 오히려 이득이기 때문에, 표준편차(σ) 차이가 크게 나는 지금과 같은 상황에서는 고득점 영역에서 생명과학Ⅰ이 화학Ⅰ을 따라잡기에 매우 유리합니다.
그래프를 보시면 결국 28점 쯤에서 생명과학Ⅰ이 화학Ⅰ을 따라잡았고, 만점에서는 생명과학Ⅰ이 화학Ⅰ보다 표준점수가 3점 높은 것으로 그래프가 끝나게 됩니다.
두 그래프를 비교함으로써 다음과 같이 의미 있는 관찰을 할 수 있습니다.
① 평균(m)이 비슷한 경우에, 표준편차(σ)가 낮으면 고득점자에게는 이득, 저득점자에게는 손해라는 사실을 다시 한 번 살펴볼 수 있었습니다.
② 화학Ⅰ의 0점과 만점의 표준점수는 각각 31점과 70점으로, 격차가 39점입니다. 생명과학Ⅰ에서는 각각 27점과 73점으로 격차가 46점이었다는 것을 생각하면, 표준편차(σ)가 낮을수록 고득점자와 저득점자 간의 표준점수 격차가 커진다는 사실도 다시 한 번 확인할 수 있습니다.
이제 가장 어려운 6편만을 남겨두고 있습니다.
6편에서 찾아뵙겠습니다. 감사합니다.
[6편] (심화) 표준점수 함수의 형성 원리 (국어·수학)
0 XDK (+0)
유익한 글을 읽었다면 작성자에게 XDK를 선물하세요.
-
닉네임추천좀해주세요
이거보고 걍 4일뒤에 성적표 받아서 확인하기로 했다...
개추는 눌렀습니다!!!
ㅋㅋㅋ
올려주신 글 잘 읽고 있습니다. 저도 예전에 호기심으로 엑셀로 원점수에 대응하는 표점과 백분위 산출하는 걸 해봤었는데, 말하신 바와 같이 평가원 시험은 원점수 평균과 표준편차를 제공하지 않아 직접 추정해야만 하더라고요.. 그래서 제가 내린 결론이, 평균, 표준편차를 미지수로 놓고 (50-m)/σ×10+50 = 만점 표준점수±0.5 범위, (0-m)/σ×10+50 = 0점 표준점수±0.5 범위로 세워서 두 부등식의 영역의 교집합을 구한 다음 각 교집합에 해당되는 (m, σ) (*0.01 간격으로 이산화)의 순서쌍별로 나타나는 표점 증발 중 가장 그럴듯해 보이는 표점 증발 리스트가 포함된 순서쌍으로 결정하는 것이었는데요, 이런 로직으로 코드를 짜서 돌려도 애초에 표점 증발 구간을 깔끔하게 예측하기가 어려운 문제가 있었습니다. 환동님은 평가원 채점결과 자료 제작하실 때 어떤 방식으로 평균/표준편차를 추정하시는지 궁금합니다! (특히, 원점수 만점이 존재하지 않기도 하는 직업탐구 영역은 위에 적은 과정대로 안 될 것 같아서요..)
제가 만든 프로그램은
① 0점과 50점의 표준점수
② 증발된 표준점수
를 입력하면 평균과 표준편차를 자동으로 산출하도록 짜여있습니다.
군대에서 무지성으로 짠 코드라 지금 보면 뭔 소린지 하나도 모르겠는데... 일단 아는대로 말씀드리겠습니다.
[① 0점과 50점의 표준점수]를 입력하면
두 표준점수의 차이를 이용하여 표준편차와 평균의 대략적인 범위를 구할 수 있습니다.
0점과 50점의 표준점수 차이가 n점이라면,
500/(n+1) < σ < 500/(n-1)임이 자명합니다.
이렇게 표준편차의 대략적인 범위를 구해놓습니다.
그리고 이 '대략적인 표준점수 범위'와 '0점 표준점수', '50점 표준점수'를 이용해서 또 평균의 대략적인 범위도 알아냅니다. 범위 식이 복잡하니 이하 생략하겠습니다.
[② 증발된 표준점수]는 제가 직접 입력해야 하는데요,
도수분포표를 보시면 중간중간에 유난히 인원 수가 튀는 점수가 있습니다. 그 부분이 주로 표점 증발이 일어난 부분입니다.
예를 들어, 표준점수 56점, 57점, 58점의 인원이 각각 342명, 615명, 327명이라면 표준점수 57점에서 표점 증발이 일어났을 확률이 높습니다.
그런데 원점수 기준으로 40점대와 10점 미만에서는 이 법칙이 잘 안 맞을 때가 많습니다.
그럴 때는 10점대 ~ 30점대 라인에서 증발된 표준점수를 모두 구해놓고 그 간격을 보는겁니다.
예를 들어서, 표준점수 증발이 37점, 42점, 46점, 51점, 55점에서 일어났다면, 표점 증발이 전반적으로 4~5점 간격으로 일어나고 있기 때문에 그 다음 표점 증발은 59점이나 60점에서 일어났음을 알 수 있습니다. 59점인지 60점인지는 인원 수를 보고 최종 판단합니다.
증발된 표준점수를 모두 입력하면
프로그램이 평균 범위를 최종적으로 좁혀서 알려줍니다.
그 다음에 제가 그 범위 안에 있는 평균값을 아무거나 하나 입력하면
그 평균에 맞는 표준편차의 범위를 최종적으로 좁혀서 알려줍니다.
예를 들어서, 평균 범위가 27.614 < m < 27.713으로 나와서 제가 27.66을 입력했다면,
27.66점에 맞는 표준편차 범위(ex : 12.124 < σ < 12.147)를 출력해줍니다.
따라서 엑셀 표에 평균 27.66을 입력하고, 표준편차는 12.13이나 12.14로 입력하면 통계표가 자동으로 완성이 됩니다.
처음부터 끝까지 완벽하게 설명하려면 수식이 정말정말 많이 필요하고 수학적인 인과관계도 하나하나 다 따져봐야 됩니다... 댓글로 모든걸 설명하기에는 상당히 제한되는 점 양해 부탁드립니다
그렇군요.. 감사합니다!