[Crux] 수치 데이터를 이용한 표본분석 : 이론
크럭스(CRUX) 컨설팅
크럭스 컨설팅 12월 11일(월) 올해 마지막 정시예약 : 여기 클릭하시면 됩니다.
<수치 데이터를 이용한 표본분석 이론>
안녕하세요. CRUX 김희범입니다.
(글 읽으시기 전에 ‘좋아요’와 ‘팔로우’ 부탁드립니다)
표본분석이란 무엇일까요? 표본분석은 왜 하는 것일까요?
이 질문에 대한 답변은 표본분석을 시도하는 이유와 이용하는 방법에 따라 크게 달라질 수 있습니다.
전통적인 표본분석은 내 위에 있는 모든 사람들을 조사하고 기록하고 관찰하는 것입니다. 지원권이 한정된 폐쇄된 구간에서 흔히 ‘카운팅’이라고 불리는 방법으로 허수, 추합 등 빠져나갈 인원을 한 명씩 걸러냅니다. 경쟁자들의 점수, 타 지원 학과를 하나씩 찾고 별명을 붙이거나 특이사항을 메모할 수도 있습니다. 이러한 추적은 잘못하면 끝이 없는데, 경쟁자들이 지원한 학과의 표본을 열어보지 않으면, 결국 의미가 없기 때문입니다. 따라서 매우 제한적으로만 사용할 수도 있고, 개인이 사용할 수 있는 대상 범위는 넓게 잡아도 이과는 인설의, 문과는 과거 서울대 지원권 정도입니다. 이러한 방법의 목적은 닫힌 구간 내 미시적인 한두 자리 싸움에서 승리하는 것입니다.
그보다 넓은 구간에서도 내 위 경쟁자들의 점수를 하나씩 기록할 수는 있습니다. 하지만 추합을 따지거나 경쟁자의 이동을 찾자니 끝이 없습니다. 요즘 계열제 모집단위나 대형과는 모집인원만도 100명이 넘어가는데, 이들을 모두 기록하고 있을 수는 없는 노릇입니다. 오히려 간소하게 각 ‘표본’이 아니라 ‘수치’를 다루기도 합니다. 나의 등수가 몇 등인지, 예상 컷부터 나까지 몇 명이나 있는지 등입니다. 그런데 이런 데이터는 모아 놓아도 제대로 읽기가 어렵습니다. 각 수치들이 어떤 의미를 내포하고 어떻게 연결되는지 잘 모르기 때문입니다. 그리고 분석서비스들이 제공하는 수치 지표들은 결국 분석서비스가 제공하는 결론으로 귀결됩니다. 그렇다 보면 숫자들에서 유의미한 정보를 뽑아내지 못하고 ‘칸수’에 매몰됩니다.
수치를 다루는 표본분석의 목적은 무엇일까요? 수치를 이용한 표본분석의 목적은 거시적인 측면에서 ‘흐름’을 읽는 것입니다. 한두자리 싸움에 집중하는 것이 아니라, 내가 속한 게임판의 상황을 읽는 용도입니다.
입시에 임하는 개인이 ‘흐름’을 읽는 것은 매우 어렵고 한정적입니다. 아래는 ‘개인’이 조금이나마 흐름을 느낄 수 있도록 하는 의도에서, 최대로 간략화한 데이터 정리 시트 양식입니다. (저희 '컨설턴트'들은 훨씬 더 종합적인 다른 방식을 사용합니다. 기본적으로 제 노하우를 바탕으로 하되, '개인'도 시도해볼 수 있도록 계량했습니다.)
오늘은 바로 이 수치 데이터를 이용한 표본분석에 대해서 소개해 보려 합니다.
엄밀히 말하면 표본분석이라기보다는 나만의 입시 리포트, 혹은 입시 포트폴리오라고 생각할 수 있을 것 같습니다. 필요한 만큼, 가능한 만큼, 할 수 있는 만큼, 하고 싶은 만큼 수치를 모으고 계산하면 됩니다. 오늘은 양식에 대한 설명이고, 다음 글이 보다 실전적일 예정입니다.
먼저 상단은 과거 데이터와 올해 나의 정보를 기입하는 부분입니다.
왼쪽 위에는 관찰하고자 하는 학과 정보(학교, 군, 학과)를 적습니다.
상단 중앙 부분에는 과거 데이터를 입력합니다. 당시의 모집정원과 추가합격인원, 지원자수를 기입하면, 엑셀을 이용하여 자동으로 합격총원, 추합율, 최종경쟁률을 구할 수 있습니다.
이렇게 정보를 기입해 놓으면, 어느 정도 규모의 과인지, 어느 정도 추합이 도는지, 경쟁률은 어느 정도 되는지를 확인할 수 있습니다. 다만 주의할 점은 학과 신설, 통폐합, 군 변동, 입시 정책 변화(교차지원 도입) 등에 따라 데이터가 크게 바뀔 수 있습니다. 올해가 바로 그 변화의 해일 수도 있고요. 이러한 히스토리와 특이사항을 가장 오른쪽 메모란에 기록해 놓으면 됩니다.
과거 누백도 기록합니다. 컨설턴트들은 조금 더 체계적인 방법을 사용하지만, 개인이시라면 많이들 이용하는 누백 데이터를 쓰셔도 무방합니다. 70% 누백은 공시되는 정보를 바탕으로 하는데, 과거 합격인원의 허리하단부 누백을 확인할 수 있게 해주어 안정 지원 범위를 확인시켜줍니다. 100% 누백은 점공 등을 통해 확인하거나 자체적으로 예측한 추정치에 바탕으로 둡니다. 인터넷에 돌아다니는 누백은 틀린 정보가 많지만, 일반적으로 폭빵을 확인할 수는 있습니다. 3~4개년치 데이터에서 툭 튀는 누백값이 보이면 폭이나 빵으로 보시면 됩니다. 이러한 내용도 해석해서 오른쪽 메모란에 적어놓으면 좋습니다.
그리고 과거 누백들 바로 밑에 올해 나의 누백을 기록하시면 됩니다. 과거의 70%컷, 100%컷과 비교해서 매우 대략적으로 자신의 위치를 가늠할 수 있습니다. 사실 각 해의 누백은 서로 독립적인 것이어서 이렇게 묶어보는 것이 엄밀한 방법은 아닙니다. 주의하여 사용하시기 바랍니다. 분석기도 입시철에 계속 최신판이 나오는데, 최신 누백을 기록하고 싶으시다면, 그냥 기존 나의 누백을 지우고 새로운 나의 누백을 기록하면 됩니다. 이전 누백도 남기고 싶으시면, 메모란에 히스토리를 남겨놓으면 됩니다. (사실 누백은 라인 잡는 시기 이후로는 무용한 편이어서 굳이 세세하게 최신화하지 않아도 됩니다. 다만, 분석기를 철썩 같이 믿는 지원자들도 있어서, 하나의 변인으로 인정하고자 기록할 수 있는 공간을 마련한 것입니다.)
왼쪽 아래에는 나의 산출점수를 기록합니다. 변환표준점수 공개 이후 점수가 달라질 수 있는데, 이 경우는 위 누백과 달리, 반드시 새롭게 바뀐 자기 점수를 업데이트하시길 바랍니다.
내 점수 오른쪽에는 올해 모집인원을 기록합니다. 이 부분도 데이터가 최신화될 수 있습니다. 수시 이월 전에는 최초 모집인원이나 예측 모집인원을 사용하다가, 최종모집인원이 공개되면 수치를 바꿔주면 됩니다. 이러한 변동도 메모란에 변동일과 함께 기록해주시면 좋습니다.
모집인원을 기록하면, 과거데이터를 바탕으로 기대 추합인원, 기대 합격인원, 평균추합율, 기대지원자수, 평균경쟁률을 확인할 수 있습니다.
이 수치들을 설명하자면,
평균추합율은 그 위에 기입했던 ‘과거 추합율의 평균치’입니다.
‘기대 추합인원 = 최종모집인원 x 평균추합율’로 과거 정보를 바탕으로 올해 기대되는 추합인원을 구할 수 있습니다.
‘기대 합격총원 = 최종모집인원 + 기대 추합인원‘ 입니다.
평균경쟁률은 그 위에 기입했던 ‘과거 경쟁률의 평균치’입니다.
‘기대 지원자수 = 최종모집인원 x 평균경쟁률’이며, 과거 경쟁률을 바탕으로 올해 기대되는 지원자수를 구할 수 있습니다.
주의할 점은, 튀는 값이나 더 이상 유의미하지 않은 값이 존재할 수 있다는 점입니다. 모집 인원 변화, 군 이동, 학과 통폐합, 입시 제도 및 방식 변화, 폭빵, 마감 직전 절대적으로 낮았던 경쟁률 등등이 원인입니다. 이러한 히스토리를 알고 있느냐, 아웃라이어 등을 어떻게 처리할 것이냐가 ‘개인’의 실력이라고 할 수 있습니다.
다음은 본격적으로 수치들을 기록하는 부분입니다.
왼쪽에는 날짜를 기록합니다. 저는 12/30~1/5으로 7일간 한 번씩으로 예시 시트를 만들어드렸지만, 개인의 상황에 따라 날짜나 시간대를 더하거나 빼거나 하시면 됩니다. 그래도 마지막 3일간은 하루에 한 번씩은 기록하기를 권합니다.
입력해야 하는 정보는 예측 지표, 예측컷, 최초합격 가능 인원, 추가합격 가능 인원, 실제지원한 분석대상자수와 나의 등수, 나보다 하나 높은 칸까지의 인원수 내 칸의 꼴지의 순위, 나의 실제지원 등수 변화, 전체 모의지원자수와 그중 나의 전체 등수, 예측 지원자수, 적정 누백(점수)과 예상 누백(점수)입니다.
하나씩 설명드리면,
예측지표는 각자 자신이 보고 있는 지표를 입력하면 됩니다. 색깔일 수도 있고, 확률일 수도 있고, 0부터 9까지 숫자일 수도 있습니다. 모두가 보기 때문에 기록합니다.
예상점수는 예측컷입니다. 문을 닫을 것으로 예측되는 표본 인원의 점수일 것입니다.
최초합격 가능 인원은 지원 표본에서 최초합격으로 판단되는 인원수를 의미합니다.
추가합격 가능 인원은 지원 표본에서 추가합격으로 판단되는 인원수를 의미합니다. (합격 가능 인원 – 최초합 가능 인원)으로 구할 수도 있고, 편한 방식대로 기록하고 수식을 걸어주면 됩니다.
‘합격가능인원 = 최초합격 가능 인원 + 추가 합격 가능 인원’입니다.
나의 등수와 분석대상자수는 실지원이 예상되는 집계된 모의지원자수와 그 중 나의 순위입니다.
나의 위치는 '나의 등수 / 합격가능인원'을 백분위(%)로 표시하여 나타냅니다. 컷으로부터 나의 상대적인 위치를 가늠할 수 있습니다. 일반적으로 70%를 안정으로 봅니다. 보수적으로는 60%까지 잡을 때도 있습니다. 하지만 때로는 110%도 안정일 수 있습니다. 거시적으로 흐름을 읽는 것이 중요하고, 이 수치의 고평가와 저평가를 읽어내는 것이 실력입니다. 저희 노하우이기도 하고요. '개인'이 제일 어려움을 겪는 분야입니다.
나의 등수 변화는 그 이전에 기록한 ‘나의 등수’와 방금 기록한 '나의 등수'의 차이를 적는 것입니다. 등수가 앞으로 갔을 때 양수로 할 지, 음수로 할 지 등은 편한 방식대로 하시면 됩니다.
컷까지 인원은 나로부터 문 닫을 것으로 예상되는 사람까지 몇 명이 있는지입니다. 합격가능인원에서 나의 등수를 빼서 구합니다. 내 위로 몇 명이 들어오면 자신이 문을 닫게 되는지, 내 앞으로 몇명이 빠져야 내가 문을 닫을 것으로 예측되는지 확인할 수 있습니다.
오른쪽 아래에 윗지표 누적 인원과 내 지표 누적 인원은 표본 상에서 나보다 하나 높은 지표를 받은 꼴지의 순위와 나와 같은 지표를 받은 꼴지의 순위입니다. (본인이 보는 '예측지표'와 같은 지표를 의미합니다) 나의 등수와 비교하여 보면 나의 위치를 조금 더 잘 가늠할 수 있습니다.
전체등수와 전체지원자수는 그 학과를 모의지원한 모든 경쟁자들의 수와 자신의 순위입니다.
예측 지원자수는 예측되는 올해 지원자수입니다.
예측 지원자수를 기입하였다면, 상단에 기록했던 최종모집인원으로 나누어 예측 경쟁률을 구합니다.
적정 누백과 예상 누백은 많이들 보는 누백의 적정 누백(혹은 점수)과 예상 누백(혹은 점수)을 기록하면 됩니다. 적정 대신 소신을 이용하셔도 됩니다. 매번 기록할 정도로 중요도를 갖는 수치는 아닙니다. 굳이 안 보셔도 되고, 앞서 말했듯 누군가는 보기 때문에 같이 확인합니다.
마지막으로,
‘예측 표집비율 = 분석대상자수 / 예측지원자수’,
‘기대 표집비율 = 분석대상자수 / 기대지원자수’로 구합니다.
예측 표집비율과 기대 표집비율은 예측 혹은 기대치 대비 얼마만큼 표본에 경쟁자들이 확인되고 있는지를 확인시켜줍니다. 이 수치가 높다면, 이 학과에 대해 표본의 현실성이 높거나, 실제 표본이 외적·시스템적으로 ‘가정’된 정도를 넘어서고 있거나, 실제지원자들이 많이 들르고 있다는 뜻입니다.
수치들에 대해 설명했으니, 어떻게 보면 좋을지 간략히 다루겠습니다. 설명드렸듯, 수치는 거시적인 흐름이나 가정을 확인하기 위해 관찰하는 것입니다.
1. ‘과거를 바탕으로 기대되는 수치’와 ‘올해 보여지고 있는 수치’를 비교합니다. (통시적)
2. 어떤 정보가 실제 데이터가 아닌 추정에 의해 가정되고 있는지를 살핍니다. (가정)
3. ‘올해 보여지고 있는 수치’의 변화를 관찰합니다. (추이)
4. 하나의 학과가 아닌, 목표 지점의 좌우와 상하의 데이터를 같이 모아서 비교하며 살핍니다. (공시적)
5. 이를 통해, ‘나의 위치’를 ①구조적으로 ②상대적으로 확인하고, 내 경쟁자들이 무엇을 보고 있고, 어떤 판단, 행동, 추이를 보여주고 있는지 / 보일 것인지 잡아냅니다. (가설/시나리오 설정)
필요한 만큼, 가능한 만큼, 할 수 있는 만큼, 하고 싶은 만큼 하시면 됩니다. 부족하다고 생각되면 더 정보를 수집하면 되고, 과하게 느껴지면 덜어내면 됩니다.
커트라인 형성과 폭빵의 원리는 단순하지만, 현실에서 드러나는 양상과 시그널은 꽤나 다변적입니다. 지금까지 말씀드린 방법은 ‘개인’이 여러 상황에서 판을 읽고 능동적으로 판단하기 위해, 최소한으로 확인하면 좋을 ‘수치’들을 모으고 확인하는 방법이었습니다. 열심히 한다고 좋은 결과가 따라오는 것은 아니지만, 열심히 하면 최소한 손해보지는 않는 것이 입시입니다. 저의 이전 글들과 이어질 글을 읽으시면 조금 더 이해가 될 것입니다.
다음 글에서는 위 방법을 통해 실제 사례를 분석해보겠습니다. 감사합니다.
취소분 등의 올해 마지막 정시상담 예약 : 12월 11일 월요일
크럭스상담 우선권을 부여하는 예약신청서 작성 : https://zrr.kr/nERp
0 XDK (+0)
유익한 글을 읽었다면 작성자에게 XDK를 선물하세요.
-
대부분 메가측정되엇던거에서 떨어지나요?.. 올라가는 경우는 없나요 국어...
-
설의 0
언매 미적 물2 지2로 내신 cc이면 정시일반전형으로 합격 불가능한가요?
-
그 자리에서 말하면 부정행위 처리됐었나?
-
(백분위) 언매 96 미적 96 영어1 물리 96 화학 98이요… 지금 거의 모든...
-
낮 22도 어디갔노
-
혼자한거긴 한데 논술복기한거 여기다가 올려도 될지 모르겠고 걍 내가 풀고 온거...
-
뭔가 18~20,25~29,43~45 푸는게 정배였는데 중간중간에 들을게 너무...
-
작수 54455 25수능 가채점상 23312 지옥의2024년 ㅅㅂ것
-
개인적으로 연계 공부에 굉장히 부정적인 입장이라 올해 수능을 보기까지 개인적으로는...
-
오타랑 비문, 문제 자체검수도 하다보니 7시간이나 걸림;; 초안은 4시간컷인데 졸려죽겟네
-
지구 1컷 1
44라는 여론들이 왜 점점 많아지는거 같죠 ㅋㅋㅋ 다수 업체들 예상처럼 1컷 42이길...!
-
등급컷 0
님들 물리 1컷 46될 가능성은 없나여? 지구 2컷 38될 가능성도...
-
롤 정신병 걸릴것같아.... 탑레 다이아, 현재 에메-플레 지옥에 빠짐 오버워치...
-
언매 vs 화작 1
재수 준비하고 있는데 언매 할지 화작 할지 고민중입니다 이번 수능에서 화작 15분...
-
치타는 울다가 웃어서 엉덩이에 털났다.
-
반갑습니다. 19
-
사실상 오지 말라죠? 최고점-최저점 20점 이상이냐 이하냐에 따라 다르지만
-
지금 6등급이구. . . 일단새벽 6시-7시 20분까지 모의고사연습 9시까지...
-
3월 말부터 공부하면요 ㅠ
-
정상화좀
-
일단 3월부터 수능날까지 매일 3-4시간 투자할거고 3월말부터개념,기출 들이박고...
-
33257수의대 1
과탐은 올해하다가 놧는데 재수하면 수의대 갈 수 잇을까요 과탐은 생지로 바꾸려합니다
-
님들 나 어때? 1
나 진심 문제 있는걸까. . 너무 불안해
-
생지랑 정도 많이들었고, 쏟은 시간이 아까워서 사탐런을 하기 망설여집니다 우선...
-
ㄹㅇ 중간에 정병왔을거같음 국어 5월중순인가에 풀려서 경기도에서 버스타고 갔는데...
-
가채점 지금 진학사나 메가에서 점수 주는 거 확통틀이면 표점 우세한 거 반영되어있나요?
-
생각보다 꽤 많은 동아리가 나이 많으면 컷합니다 지금 기준 9n부터는 신입컷하더라구요
-
학교 다니면서 느낌 진짜 있음 그냥 나랑 다른거라 부럽다거나 그런 느낌도 안듦걍...
-
고1이고 스카다니고있는데 중학생들 시험기간되면 너무 시끄럽고 사람이 많아서 집가까운...
-
고인물임
-
언매 91 미적 공통-2 미적-1 틀림 88 영어 4등급 생명 45 지구42...
-
31411 정시 문과라인 어디까지일까요? 정시는 처음입니다 2
국어 78 언매 수학 88 미적 영어4 정법 47 사문47 입니다 문과라인 어디까지...
-
연세대 이 트래쉬 잡대 대체 가스라이팅을 어캐했길래 애들이 계속 연대한다 연대한다...
-
오랜만에 메가나 들어가볼까 해서 갔는데 2타시네요..? ㄷㄷ 양승진t가 4타 되시고..
-
고교 출결때문에 암만 높여봐도 97점이네... 5월 입대 노리고있는데 이거...
-
학고반수 실패에 관해 질문 답변.. 제발 부탁드립니다.. 2
1학년 1학기 아예 학교 안다니고, 2학기는 휴학했습니다. 학사경고장은 받았습니다....
-
탐구 고민 0
과탐 1 2 각각 뭐 해야하죠? 물1 지2?
-
올해같은 입시에서 서울대 의치대는 cc면 힘든가요? 0
어떻지 모름
-
감점폭도 크고 비교내신도 안 주는 이유는 메디컬 때문같음 그리고 수시 출신이나 내신...
-
예체능이라 수학 빼고 저 성적 나왔습니다 .. 재수때 나름 거의 아침부터 열심히...
-
으아아아ㅏ아ㅏ 잘래
-
생1은 개념형 다풀고 근수축 막전위 푼후 4문제 찍어서 하나 맞추면 개날먹으로...
-
어지간하면 bb아님 cc 둘 중에서 준다던데 cc는 얼마나 까이는 거임...
-
반드시 ㄱㄱ헛
-
이거 채용조건형임??? sk나 삼전??
-
그냥 얼굴 때문이 아니라 돈버는게 얼마나 ㅈ같고 고된건지 알면 알수록 짜증이남
-
논술 질문 0
제가 a에서 선분 cd에 내린 수선과 cd가 만나는점을 h라하자를 a에서 선분...
-
형 잔다. 2
오르비 취침소등하겠습니다. 편안한 밤 되십시오!
좋은글감사합니다
ㄹㅇ 좋은글.
110%는 10%의 오타인가요?
아닙니다. 해당 수치는 확률이 아니라 누적 등수 개념입니다.
40명 합격 가능할 때 44등이면 110%입니다. 구간 자체가 고평가되어 있으면 110%여도 안정~적정 카드일 수 있습니다. 그런곳을 잘 찾는것이 저희의 강점 중 하나입니다.
글 감사합니다
그런데 예측지원수는 마음대로 정하는 건가요?
많이들 보는 곳의 예측치입니다. 보조도구로써 역이용합니다. 이 예측치가 자꾸 틀려서그런지 작년부터 잘 공개하지 않습니다. 쪽지 주시면 보다 자세히 답변드리겠습니다!