
今天,我們就一起來分析分析這份ESR,看看從中能得到哪些啟示吧,根據一位同學的成績來分析,重點在于gmat算分機制分析,一起來了解一下,為之后的考試做準備!
整體概述這位Y童鞋的目標分數是730分。
考完試出來,她給我的反饋是:SC做的很順利,CR和RC做的稀爛,尤其是CR,有四五題是她最弱的歸納題:
那么ESR中反映出的V各科情況是否真的如此呢?我們且往下看:
V各科單科概況
先來看V的單科情況:



還是老規矩,先看V的整體數據三張圖:
CR算分題8題錯了4題,平均用時2分19秒,得分37分;RC算分題10題錯2題,平均用時2分07秒,得分39分;
SC算分題12題錯3題,平均用時1分13秒,得分35分。
從正確率和pace來看,ESR的數據似乎和她下考場后的直觀感受比較吻合:CR和RC都費時較多,而CR的正確率確實也不理想,只有50%。
但是,從得分來看,竟然和她的自我感覺乃至正確率大相庭徑:她的SC得分居然是最低的!
為什么會這樣?可能有同學會得出結論:GMAT是玄學。
但其實如果你了解自適應的算分原理,可能就能理解了。
自適應的算法非常復雜,需要用到IRT項目反應理論及MLE最大似然估計等高級算法,我們就不堆數學公式了,我簡單用定性的說明,爭取讓你能夠明白。
簡單來說,GMAT計算你的能力值,需要繪制出你的“難度-正確率曲線”。這個曲線顯然不是直接把你的所有題目樣本簡單的連起來,而是需要一個理論模型來將離散的樣本進行回歸分析。
我們最常見的樣本回歸分析模型就是線性回歸,也就是根據樣本擬合出一條直線。但是難度和正確率顯然不應該符合線性關系。GMAT實際用到的是邏輯回歸模型(logistic model):

我們定性的認知一下這個曲線的意義:曲線橫軸是題目難度,縱軸是做對的概率。理論上,特別簡單的題目,你的正確率會趨于100%,而特別難的題目你的正確率會趨于0%。當然,考慮到有蒙對的概率,所以圖形最后并不趨于0而是趨于10%,這是GMAC選取的猜測參數c。
當GMAC把你的做題樣本按照模型算法擬合成這樣一個曲線后,你的能力值應該是對曲線求導,取斜率絕對值最大的點a所對應的難度b。它的意義是:在這個難度附近,難度波動對你的正確率影響最大,也就是說輕微的難度增加就會導致你正確率有相對顯著的下降:

假如用視力測試來類比的話,比方說醫生發現你從2.0到4.9,答題正確率100%,5.0的時候你就有一部分看不清了,而5.1以上全都看不清。這意味著你在4.9之前和5.1之后正確率幾乎毫無波動(只不過前者是保持100%,后者保持0%),而在5.0附近正確率波動特別顯著,所以最終醫生會評估你的視力為5.0。
所以小結一下:GMAT最后的算分,是擬合出你的“難度-正確率曲線”,然后求導取斜率最大點對應的難度值作為你的真實實力值,再換算成相應的得分。
花了這么多精力來講原理,接下來我們說說為什么Y童鞋的CR正確率50%卻能得37分,以及為什么她的SC正確率高達75%卻只有35分。
我們來看官方給出的一個正常分布和一個異常分布:

上圖綠色點代表做對的題,紅色點代表做錯的題,按難度系數排列。這是一個正常分布,整體上符合簡單題正確率穩定對,難題真正確率也穩定對,而越靠近中間正確率波動越大。Y童鞋CR的“中間”大概就在37分難度附近,比方說她的八道CR算分題,3題是低于36難度的題都對了,3題是高于38難度的題都錯了,而2道37難度左右的題對一題錯一題,那么她CR的得分就是37分。

而這個圖是一個異常分布,你會發現最難的題目在右上角,正確率很高,而整個圖靠中間的部分正確率反而低。這時你會發現系統擬合出的曲線比正常情況左移了很多,相當于只考慮了左上角的對題和中間下方的錯題,右上角做對的難題樣本等于被舍棄了。Y童鞋的SC題目分布很可能類似于這個分布,不過沒有這么極端(如果單科過于極端可能會被打最低分6分,如果三科都極端可能會被懷疑作弊)。比方說她遇到了4道34分以下的題目都做對了,遇到3個36分以上的題也都對了,但遇到5個35分左右的題目卻錯了3個。這時候,36分以上的難題相當于白做對了,擬合曲線只考慮了36分難度以下的9個題,最終給出了35分的得分。
這個故事告訴我們:中等難度題目的穩定性,比多做對幾個難題要更加重要。
當然,進一步分析的話,我們會發現:Y童鞋的SC整體難度應該是低于CR的。而她明明更難的題都能做到高正確率,為什么35分左右的題正確率反而這么低呢?
理論上有可能是因為恰好有那么三四個該難度的題恰好考到了她的知識盲點。但如果是這種情況,考試中應該會有明顯的感覺,根據她的考后反饋,排除這種情況。
所以,大概率是另外一種可能性:她在前面比較早有一個對她而言不難的35分題,她大意做錯了,這導致SC單科的升庫速度會略低于其他兩科;然后她在最后可能出現了連錯掉庫,而恰好掉到低難度的時候是兩個SC題,這兩個題又做錯了,導致SC單科分數低于她的真實實力。
我們接著看考試流程:
考試過程分析
這里我們主要看分段正確率、難度和時間餅圖:

她四個quarter的算分題錯題情況分別是:
第一部分8題錯2題,正確率75%;第二部分7題錯1題,正確率86%;第三部分7題錯2題,正確率75%;第四部分8題錯5題,正確率50%。
第一部分她的簡單題和中等題基本都做對了,而兩道錯題平均難度相當大,接近40分。而看她的時間餅圖會發現,她在第一部分居然平均一題用時只有1分鐘,做得太快太著急了。
我們按照餅圖面積,錯題平均用時大約是正確題兩倍,稍微估算一下她的用時:
6R+2×2R=480s
對題用時R約等于50s一題,而錯題用時約1分40秒一題。再結合她前面的各科平均pace,我有理由推斷:她這一部分應該是錯了一道較難的CR,用時超過2分20秒,同時錯了一道SC,用時大約1分鐘左右。
結合前面的信息,我進一步推斷她第一部分是連續對了4-5題,很快進入高分庫,系統給了一個超難題做錯之后,又錯了一個35分左右難度的SC,于是又給了一兩個30左右難度的題目她做對了。
第二部分她繼續保持良好的勢頭,在難度上升的情況下,正確率仍然非常高,對題平均難度在35分左右,直到難度上升到接近45才錯了一個題。從用時來看大概率是錯了一個超難的RC。
第三部分平均難度接近40分了,這部分她的整體正確率仍然很高,但錯題平均難度和對題持平,應該不是錯了表現最好的那科,而用時比正確題目多很多,大概率不是SC,很可能是兩道CR很難的CR歸納題。
注意到前三部分她做的非常快,第四部分應該有很多時間。但這部分在難度和第三部分持平的情況下正確率卻很低。結合前面她的考后感受,我做出的猜測是:這部分她先做對了一兩題后,遇到了一篇超難的RC,她做得有些吃力,但實際只錯了一道算分題。然后緊接著又出現一個CR的難歸納題,而前面的挫敗給她在CR歸納題上帶來了一定的心理陰影,她不僅這題做錯了,還有點心態失衡,想放棄治療了。
最后三道題中理論上應該有一個測試題,另外兩個很可能是連著兩個SC都做錯了,尤其是最后一題,她應該是還有時間多,等在那里到最后才選,但是選錯了,所以出現這部分錯題用時異常多的情況。
當然,上述分析有不少是我的推斷,所以需要詢問溝通實際情況。
說實話,分析到這里我覺得這位Y童鞋這次考試有點可惜。
如果最后她心態不出現大幅波動,很有可能能做對最后的SC題,如果那樣的話,反而是個別的錯題被擬合曲線拋棄,SC得分甚至可能比RC要高,那么她很有可能已經分手了。
當然,從她這次考試,也明顯暴露出來一些問題:
首先她前面做的太快,雖然正確率已經非常高了,但也一定程度上導致了前面不經意的小失誤。如果能稍微的穩定一下pace,避免過早做錯能力范圍內的題,其實最后的錯題影響會小很多。據了解Y童鞋考前模考做得太少,建議下次考前還是需要通過模考練練pace。前面可以稍微快點為后面難題節約時間,但也不要太快,否則失誤率會增加。
其次,她在最后的心態崩了。究其原因是CR和RC在最后倍感吃力,從而誤以為自己這兩科沒考好。但事實證明,她的這個判斷是錯的。這種吃力的感覺,其實是因為升庫使得題目難度加大,觸碰到了她的能力上限邊緣。判斷錯了,本身倒是不扣分,但是這對最后的心態帶來了較大的消極影響。就好比一場馬拉松,跑到離終點還有不到1公里,卻提前卸了一口氣。
其實之前在分享里也提到過,GMAT考到最后對于高手而言是個逆商考試,希望Y童鞋通過這次的經歷,積極做一些心態建設。真正在考場上,理論上盡量是要保持平和的心態,不要去揣測是否升庫掉庫,因為無論如何,前面做的題都不能改,你眼下能做的最優方案都是把后面能做對的題盡可能做對。
當然,人沒法真的把自己變成無情的做題機器,那么考試中寧可給自己一些盲目自信:吃力的時候,不要覺得是自己考砸了,而要相信這是因為系統升庫的原因;而做得比較輕松的時候,也不要擔心自己掉庫了,而要相信是因為自己能力強難題也不覺得難,這樣不斷給自己正面的心理暗示,鼓勵自己堅持到最后。
小結
今天我們通過具體的一個案例帶著大家初步了解了一下GMAT計算分數的原理。同樣30美金的ESR,讀得懂和讀不懂,價值有天壤之別。

? 2025. All Rights Reserved. 滬ICP備2023009024號-1