浅谈置信度与置信区间差异与关系
作者: 发布时间:2017.10.30 浏览量:4679

工作中很多人提问:置信度和置信区间是什么意思,能通俗易懂的讲一下吗?


实验室改建


置信度:以测量值为中心,在一定范围内,真值出现在该范围内的几率。一般设定在2σ,也就是95%,95%是通常情况下置信度(置信水平)的设定值。


置信区间:在某一置信度下,以测量值为中心,真值出现的范围。 我们在论文里经常看到CI,CI是置信区间,一定概率下真值得取值范围(可靠范围)称为置信区间。其概率称为置信概率或置信度(置信水平)。

 

真实数据往往是实际上不能获知的,我们只能进行估计,估计的结果是给出一对数据,比如从1到1.5,真实的值落在1到1.5之间的可能性是95%(也有5%的可能性在这区间之外的)。区间是由抽样的数据根据大样定律结合查表得来的。区间越小精度越高,区间越大置信度越高。

 打个比方,我们猜小妮子的年龄,你给出区间是25-35,这个区间很小置信度很低但精度就很高,你说在8岁到80岁之间,那是百分百的置信度了,不过精度太低毫无意义。的确99%准确度高于95%,但是它的精度(精密度)就低于95%。95%的置信度是一般通用的。

 

更专业的解释:

置信区间的定义

首先我们先定义一些区间估计的概念。

θ:待估计的总体参数

θL:由样本确定的置信下限

θU:由样本确定的置信上限

α:大于0,小于1的数值

1-α:置信度


如果由样本确定的两个统计量θθ满足(θL<θ<θU)=1-α, 就称随机区间(θL,θU) 是θ 的置信度为1-α 的置信区间。θθ分别称为置信度为1-α 的置信下限和置信上限,1-α 称为置信度。我们估计小学生的平均身高是在1.40m和1.50m之间,可靠程度为95%。现在可以用公式将以上的叙述表达出来,即

P(1.40<<1.50)=95%


式中的?表示小学生的平均身高。(1.40<<1.50)是置信区间;95%是置信度,1.40m和1.50m分别是置信下限和置信上限。


置信区间的分类

双侧置信区间:上例中的(1.40<<1.50)属于双侧置信区间。


单侧置信区间:在有些场合下,我们只关心总体参数的某一侧界限。例如,对于产品的寿命来说,消费者只关心其寿命的下限,对其上限则希望越长越好;而对于许多成本,则正好相反。


区间估计的原理

下面我们以估计总体参数为例,说明区间估计的原理。设有总体X~N(?2),σ2已知,估计?的置信度为1-α的双侧置信区间。从总体中随机抽取样本容量为n的样本,样本均值为`X。所以样本随机变量可以表示为`X~N(?,σ2/n)。(由总体随机变量X~N(?,σ2),样本容量为n,样本均值为`X,得到样本随机变量为`X~N(?,σ2/n)的具体推理过程,请见连续型随机变量——抽样分布)


根据样本随机变量`X~N(?2/n),经过变换可得随机变量(`X-?)/σ/?n~N(0,1)。(由正态分布`X~N(?,σ2/n),转换成标准正态分布(`X-?)/σ/?n~N(0,1)的具体推理过程,请见连续型随机变量——正态分布)已知给定置信度为1-α,则随机变量落在(-Zα/2,Zα/2)区间的概率为P(-Zα/2<(`X-?)/σ/?nα/2) =1-α


经变换可得P(`X-Zα/2*σ/?n<?<`X+Zα/2*σ/?n) =1-α


即为的置信度1-α 为的双侧置信区间。以上即为由样本参数推断总体置信区间的过程。


置信度与置信区间的关系

在估计总体参数时,一般都会给出一个较高的置信度,如95%或99%等。但是,当样本容量n为一定时,置信度越高,置信区间就越大,也即估计的参数的相对精度就会越低。反之,置信度越低,则精度相对就会越高。解决这一矛盾的方法就是增加样本容量n。

热点标签
实验室设计 实验室建设 实验室认可 实验室工艺咨询 实验室规划 实验室装修 实验室施工 实验室家具 实验室监理验收 CNAS认可 CMA认证
返回列表
在线咨询 拨打电话