考试成绩分布的数学模型
吴潇辉
摘要:一门课程考完之后我们在分析成绩的时候会发现,一个班的成绩根据我们的经验往往是分布在[0,100]之间的任意一段(可设以10分为一段),并且考得特别低的很少,例如:0分、10分,考得特别高的也很少,例如:100分,但大多数人考的不是特别高也不是特别低,例如:70~90之间。
现在,我们要建立一个数学模型来研究分数的分布情况。我们主要通过运用概率论中随机变量的概率分布规律的讨论,运用软件对题目中的数据进行拟合的方法,并且把两种结果进行比较,最终得出学生成绩的分布服从三大随机变量概率分布中的正态分布
关键词:数据拟合概率分布函数概率密度函数MATLAB  MATHMATIC
一、问题的提出:
大学生学完一门课程,要进行考试,考试之后就有了成绩。通过这个成绩可以说明学生的学习情况也可以说明老师出题的合理性。有人说一个班级的老师成绩应付从正态分布可,那么,这种说法是否正确呢?例如下面的表格给出了某班某门课的考试成绩:
下面我们要解决的问题是:
1、通过上面的表格分析这个班的成绩是否服从正态分布。
2、结合表格中的成绩给出成绩服从正态分布的判别方法和标准,以说明成绩分
布的合理性。
二、模型假设:
1、次门课程出题的难易程度相对于学生的学习程度来说适中,也就是说这次成绩具有合理性,可以把它当作衡量其他出题是否合理的标准。
2、为了下面分析的方便我们姑且认为成绩的分布具有连续性。
三.符号说明
:y在某一段分数上的人数;
:
N班级总人数;
:p在某一段分数上的人数所占的比例;
():
p A试验结果A的概率;
():
F x概率分布函数;
():
p x概率密度函数;
,:
σμ常数。
四、模型建立与求解:
从上面的表格中我们可以看出:成绩分布在70~90分之间的人数最多,在0~50分以及90~100分的人数很少,50~69分之间的人数也比较少。因此我们可以近似认为学生成绩与分布在某一段成绩的人数之间关系可近似用下面的草图来表示:
由于
y
p
N
=
41
y
=,也就是说对上面图中所有的纵坐标同除以41,因此应当不
改变图形的形状,所以每一段分数上分布概率与分数段之间的关系如图所示:
分数为随机变量,右上图可以观察出,分布在70~89分断的概率最大,同时我们可以粗略的计算出:这个班这门课程的平均成绩大约为:74.4分,它也就在这段分数中。
下面我们来说明成绩大致服从正态分布:
1、随机变量的概率分布有三大分布,即:二项分布、泊松分布和正态分布,二项分布和泊松分布是用来讨论离散型随机变量,而我们在假设的时候已经把分数的分布近似的认为是连续型随机变量。
2、二项分布和泊松分布是建立在n重贝努里实验的基础之上的,贝努里实验只有两个实验结果A及A,并且(),()1
==-=(其中01
P A p P A p q
<<),而成绩
p
的出现不可能只出现两种结果,它不可能服从二项分布和泊松分布。
3、理论表明,一个变量如果收到大量微小的、独立的随机因素的影响,那么这个变量一般是正态随机变量。我们现在讨论的成绩正好满足这一点,影响成绩的因素很多,例如:出题的难易、学生学习的程度、平时成绩的影响、学生的临场发挥、老师改试卷时的误差等等。并且这些因素也是相互独立的,它们之间并不从在特殊关系。
综合所述,成绩的分布应当服从正态分布。
以下给出一个判别成绩服从正态分布的方法和标准:
首先对给出的数据进行分析:
-每隔5分,分为20段,进行统计,统计出分数分布在每一段上的人数和把0100
在每一段上的人数所占的比例。如下表:
分数人数人数/总人数分数人数人数/总人数0-5 0 0 51-55    2 0.04878
6-10 0 0 56-60 0 0
11-15 0 0 61-65    3 0.07317 16-20 0 0 66-70    3 0.07317 21-25    1 0.02439 71-75    4 0.09756 26-30
0 0 76-80    4 0.09756 31-35    1 0.02439 81-85 12 0.292682 36-40 0 0 86-90    6 0.146341 41-45    1 0.02439 91-95    2 0.04878 46-50
1
0.02439
96-100
1
0.02439
对分析得出的数据做出如下图:
从图中可以看出这些点近似服从正态分布的图像,现在再利用matlab 软件对这些数据进行拟合。 正态分布函数为()()2
2
20
2y x
F x e
dy μσπσ
-=
,假设()y F x =,
而某一段分数分布的概率为()()11221221()0.5*P x x x F x F x e e σσ
⎡<<=-=⎢⎢⎥⎣⎦
,而每一段的概率可根据上面的表格得出,所以可用matlab 软件来拟合一个正态分
布概率密度函数,假设正态分布函数为220.5*y e e σσ⎡⎤
=⎢⎥⎢⎥⎣⎦
,可用表格中数据拟
合可得出:80,79μσ==,见附录1:
根据这两个值,我们就可得出正态分布概率密度函数
2
2
(80)
2*79
1
()*
2*79
x
p x e
π
-
-
=,所以现在做出它的图像进行分析便可判定成绩是否服从正态分布。图像如下:
为了便于分析成绩的分布情况,我们可做出以下两个区间的图像,因为成绩虽然只在[]
0,100这个区间上,但概率密度函数区间太小看出成绩分布的整体趋势,所以可对称的放在区间,但这不影响在[]
0,100这个区间上的分布情况。
2
2
1(80)
*,{,160,240}
2*79
2*79
x
plot Exp x
π
⎡⎤
⎡⎤
-
--
⎢⎥
⎢⎥
⎣⎦
⎣⎦
2
2
(80)
*,{,160,320}
2*79
2*79
x
plot Exp x
π
考试之后⎡⎤
⎡⎤
-
--
⎢⎥
⎢⎥
⎣⎦
⎣⎦