浅谈置信度与置信区间差异与关系

作者：发布时间：2017.10.30 浏览量：7314

工作中很多人提问：置信度和置信区间是什么意思，能通俗易懂的讲一下吗？

置信度：以测量值为中心，在一定范围内，真值出现在该范围内的几率。一般设定在2σ，也就是95%，95%是通常情况下置信度（置信水平）的设定值。

置信区间：在某一置信度下，以测量值为中心，真值出现的范围。我们在论文里经常看到CI，CI是置信区间，一定概率下真值得取值范围（可靠范围）称为置信区间。其概率称为置信概率或置信度（置信水平）。

真实数据往往是实际上不能获知的，我们只能进行估计，估计的结果是给出一对数据，比如从1到1.5，真实的值落在1到1.5之间的可能性是95%（也有5%的可能性在这区间之外的）。区间是由抽样的数据根据大样定律结合查表得来的。区间越小精度越高，区间越大置信度越高。

打个比方，我们猜小妮子的年龄，你给出区间是25-35，这个区间很小置信度很低但精度就很高，你说在8岁到80岁之间，那是百分百的置信度了,不过精度太低毫无意义。的确99%准确度高于95%，但是它的精度（精密度）就低于95%。95%的置信度是一般通用的。

更专业的解释:

置信区间的定义

首先我们先定义一些区间估计的概念。

θ：待估计的总体参数

θ_L：由样本确定的置信下限

θ_U：由样本确定的置信上限

α：大于0，小于1的数值

1-α：置信度

如果由样本确定的两个统计量θ_L和θ_U满足P (θ_L<θ<θ_U)=1-α, 就称随机区间(θ_L,θ_U) 是θ 的置信度为1-α 的置信区间。θ_L和θ_U分别称为置信度为1-α 的置信下限和置信上限，1-α 称为置信度。我们估计小学生的平均身高是在1.40m和1.50m之间，可靠程度为95%。现在可以用公式将以上的叙述表达出来，即

P(1.40<? <1.50)=95%

式中的?表示小学生的平均身高。(1.40<? <1.50)是置信区间；95%是置信度，1.40m和1.50m分别是置信下限和置信上限。

置信区间的分类

双侧置信区间：上例中的(1.40<? <1.50)属于双侧置信区间。

单侧置信区间：在有些场合下，我们只关心总体参数的某一侧界限。例如，对于产品的寿命来说，消费者只关心其寿命的下限，对其上限则希望越长越好；而对于许多成本，则正好相反。

区间估计的原理

下面我们以估计总体参数为例，说明区间估计的原理。设有总体X～N(?,σ²)，σ²已知，估计?的置信度为1-α的双侧置信区间。从总体中随机抽取样本容量为n的样本，样本均值为`X。所以样本随机变量可以表示为`X～N(?,σ2/n)。（由总体随机变量X～N(?,σ2)，样本容量为n，样本均值为`X，得到样本随机变量为`X～N(?,σ2/n)的具体推理过程，请见连续型随机变量——抽样分布）

根据样本随机变量`X～N(?,σ²/n)，经过变换可得随机变量(`X-?)/σ/?n～N(0,1)。（由正态分布`X～N(?,σ2/n)，转换成标准正态分布(`X-?)/σ/?n～N(0,1)的具体推理过程，请见连续型随机变量——正态分布）已知给定置信度为1-α，则随机变量落在(-Z_α_/2,Z_α_/2)区间的概率为P(-Z_α_/2<(`X-?)/σ/?n_α_/2) =1-α

经变换可得P(`X-Z_α_/2*σ/?n<?<`X+Z_α_/2*σ/?n) =1-α

即为? 的置信度1-α 为的双侧置信区间。以上即为由样本参数推断总体置信区间的过程。

置信度与置信区间的关系

在估计总体参数时，一般都会给出一个较高的置信度，如95%或99%等。但是，当样本容量n为一定时，置信度越高，置信区间就越大，也即估计的参数的相对精度就会越低。反之，置信度越低，则精度相对就会越高。解决这一矛盾的方法就是增加样本容量n。

上一篇：实验室装修施工之洁净室空气处理机组的选择下一篇：化学实验室建设要求以及注意事项

推荐新闻

热点标签

实验室设计实验室建设实验室认可实验室工艺咨询实验室规划实验室装修实验室施工实验室家具实验室监理验收 CNAS认可 CMA认证实验室仪器维修实验室搬迁

返回列表