網路城邦
上一篇 回創作列表 下一篇   字體:
做一道练习题
2011/08/08 17:29:25瀏覽1008|回應2|推薦5

  

指考 99 年大學指考高低標,五標。

年度  99      
       

    

         頂 標               前 標             均 標               後 標               底 標

 

國文  67      62      54      44      36   *

英文  79      69      48      26      13   * 

數甲  79      65      45      25      14   **

數乙  88      78      60      40      22

化學  68      57      38      21      12   *

物理  57      43      24      12       6

生物  81      73      58        40         28

歷史  75         68      57        43         31

地理  63         56      46        34         26   *

 

 

这是一个某地学生在 99 年大學指考分数的五標分布表,数据量足够大(large sample size)。

这里的“標”指的是 percentile--

頂標是 88 percentile

前標是 75 percentile

均標是 50 percentile

後標是 25 percentile

底標是 12 percentile


我的问题是,根据这五標,能否大致知道其它分数的 percentile?

例如,在數甲里,70分大致是在什么 percentile?


由于不知道數甲分数的随机变量X的分布函数,因此我只能作一个预先假定(assumption),即,这个随机变量X ~ N( u, sigma ),也就是正态分布。

数表中给出的“均標”应是指中间值(median),而非平均值(X bar)。


“數甲”分数的五標分布结构还算比较对称。

第一步是估算出平均值(X bar)。


如果正态分布的这个 assumption 是对的话,那么,75 percentile 与 25 percentile 的中心点就是平均值。

(65+25)/2 = 45 --这与中间值重合。


同理,88 percentile 与 12 percentile 的中心点也应是平均值。

(79+14)/2 = 46.5 --不与中间值重合。

当然,观察值(observation)如果出现一点小偏差也是正常的。

我决定用这两个平均值来做平均,得到的结果即作为 u 的估计值(estimate)。

(45+46.5)/2 = 45.75

第二步是估算出标准方差 sigma(standard deviation)。

 

用 88 percentile 来计算,查标准正态分布表值:

(79-45.75)/sigma = 1.175 ==> 

sigma =(79-45.75)/1.175 =28.2979

 

用 75 percentile来计算,

(65-45.75)/sigma =0.675 ==> 

sigma =(65-45.75)/0.675 = 28.5185

 
最后用这两个 sigma 值来做平均,得到的结果即作为 sigma 的估计值(estimate):28.40

正态变量的标准化转换为  Z=(X-u)/sigma

把 70 分代入,得到:(70-45.75)/28.40 = 0.85

查 0.85 的标准正态分布表值,得到 0.8023,即,70分大约是 80 percentile。

另外,我若想知道其它的 percentile 大约是多少分。

例如,60 percentile大约是多少分?

先查 0.60 的标准正态分布表值,得到Z值约为 0.25。

然后,Z=(X-45.75)/28.40 ==> 

X=0.25(28.40)+45.75 = 52.85

即,60 percentile大约是 53 分。

 

 

希望有高手来不吝赐教,或在文下直接点评,或留悄悄话,一律欢迎。

 

我这里先谢过了。
 

 

 

 

( 時事評論國防軍事 )
回應 推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:https://classic-blog.udn.com/article/trackback.jsp?uid=sasguru&aid=5516659

 回應文章

随机
過程
2011/08/11 08:06
一個雞蛋,一把鹽,這麼閒啊?

随机变量哪裡夠,那就試試隨機過程吧
sas(sasguru) 於 2011-08-11 17:07 回覆:
愿闻其详。望大师不吝赐教。

yichun
等級:8
留言加入好友
如何處理 "skew"?
2011/08/09 01:36
拜讀貴覆。

1.如分佈果為“完美對稱鐘”(symmetrical bell; http://www-users.york.ac.uk/~mb55/intro/triglhs.gif)或者“接近完美對稱”,則貴法已足堪實用。即:“將z值與百分量比,作自由轉換”(convert z value to percentile). 坊間甚至有商用軟體程式,將常態分佈計算納入內藏計算式,只需鍵入z值,即可得出percentile (例如:http://www.measuringusability.com/zcalcp.php)

2.但若實測分佈為“不對稱鐘” (asymmetrical bell),又稱偏鐘式(skewed bell),有無簡易計算法則?
sas(sasguru) 於 2011-08-09 06:27 回覆:

 

谢兄台之指点。

兄台果然犀利,一出手便戳中我的软肋。

这个思考题我原以为简单,若按书上的经典作法,就是套用“完美對稱鐘”的解法。

但开始入手后,却发现有些科目的五标分布不是很对称,因此陷入困境。再加上一些琐事缠身,无法长考,一时竟卡住了。

后来一想,无论如何,这个思考题必须是按科目分开计算。因此先挑了一些五标比较“對稱鐘”的来,按标准解法先做。

那个“数甲”的分布,应该算是相当对称了。其它还有一些还算对称的,我都打上标记(*)。

剩下的一些有skewness的科目,无非是或 skew to right,或 skew to left。


我还在思索中。一种可考虑的手法是,还是按“對稱鐘”的算法,但做两次。

第一次是按高标、顶标来计算,得出结果。

第二次是按低标、底标来计算,得出另一结果。

最后把这两个结果取一平均数来作为最终答案。