地球之外有生命存在吗?人类对于这个问题的探索从未停止,希望能知道自己在宇宙中是否孤独,却始终没能找到地外生命的确凿痕迹。不过就在一个月前,天文期刊 Astrophysical Journal 发表的一项新研究带来了突破。 报道称,天文学家在124光年外一颗名为K2-18b的行星上找到了“生命痕迹 ” ,确定度达到了99.7%!
艺术家描绘的K2-18b(图片来源:wikipedia)
看到这个新闻,你的第一反应可能是兴奋——难道人类终于找到了地外生命?但紧接着,你或许又会好奇:天文学家是如何得出99.7%这个数字的?它的真正含义是什么?
遗憾的是,即使确定度高达99%以上,这项研究仍不能作为地外生命存在的决定性证据。要理解这一点,我们得搞清楚这个“确定度”的具体含义。
什么是标准差?
让我们先从实验数据的测量说起。假设你有一把直尺,需要去测量一支笔的长度,它的真实长度是15.00cm。因为受到读数误差、直尺精度等因素影响,你每次测量的结果都会有所不同,比如14.95cm、15.00cm、15.10cm等等,结果有时偏小,有时偏大。
如果想要得到更准确的测量值(同时还有足够的空闲时间),你可以进行100次、1000次测量。根据统计学规律,测量的次数越多,测量值的平均值就会越来越接近笔的真实长度。
(图片来源:Worksheets)
你还可以将每次测量的结果作为横轴,数据出现的频数作为纵轴,绘制出一张数据分布图。随着测量次数增多,分布图会逐渐呈现出中间密集、两边稀疏的图样,就像寺庙里倒扣的大钟。
在理想情况下,当测量次数趋近于无穷大,分布曲线会收敛为一个平滑的钟形图样,这就是正态分布。
nload="this.removeAttribute('width'); this.removeAttribute('height'); this.removeAttribute('onload');" />
正态分布曲线,图中百分数表示数据点落在不同标准差范围内的概率(图片来源:wikipedia)
正态分布(又称高斯分布)是一种在自然界和社会现象中极为常见的连续概率分布,核心特征是数据呈现为钟形曲线,且具有对称性,其峰值称为平均值。在上文测量的例子中,平均值也就是笔的真实长度。
正态分布有一个非常重要的参数是标准差,用希腊字母σ(sigma,念作“西格玛”)表示。标准差表示数据偏离平均值的程度,在图像上可以直观理解为“胖瘦”。你的尺精度越高、测量的长度越准,标准差就会越小,偏离平均值的数据量减少,正态分布就会变尖、变“瘦”;反之精度越低、测得越不准,正态分布会变宽、变“胖”。
nload="this.removeAttribute('width'); this.removeAttribute('height'); this.removeAttribute('onload');" />
不同形状的正态分布图像(图片来源:statology)
是不是新发现,概率说了算
标准差σ看似只是在统计学中用来描述数据离散的程度,但在科学研究中,它却是判断一项科学发现是否真实可靠的重要参数。
科学实验的数据有时会出现异常值,这些异常可能是重大发现的信号,也可能仅仅是随机误差的体现。为了区分这两者,科学家引入了统计显著性的概念。它通过计算观测数据与零假设(“无真实效应”的假设)之间的偏离概率,来评估实验结果是否超出了随机波动的合理范围,从而判断该结果是否具有统计学意义。
举个例子,你有一个骰子,怀疑它被人动过手脚。为了验证这一猜想,你决定不停地扔骰子。掷一次,得到的点数是6点,这很正常;但是你紧接着掷了第二次、第三次,掷到第八次,结果见鬼了——每次骰子都落在6点!
对于正常的骰子,这种情况发生的概率只有nload="this.removeAttribute('width'); this.removeAttribute('height'); this.removeAttribute('onload');" />
≈ 0.00006%,几乎不可能发生,因此你做出了判断:骰子有极大可能被人动过了手脚。
nload="this.removeAttribute('width'); this.removeAttribute('height'); this.removeAttribute('onload');" />
这就是一个验证统计显著性的例子:
1.对于一个可能存在的新现象(骰子被动过手脚),假设现象不存在(骰子一切正常);
2.收集大量实验数据后,发生了概率极低的事件(骰子连续8次6点),或者发现数据和理论预期存在明显偏离;
3.有充足理由推翻零假设,说明新现象具有统计显著性,可以被认定为真实存在的效应(骰子被动了手脚)。
问题来了:要发生概率多低的事件、数据和预期存在多大的偏离,才能确定统计显著性呢?科学界采用的标准方法是使用标准差σ的倍数来衡量观测数据与理论预期(零假设)之间的偏离程度。具体而言,不同σ值对应的统计显著性水平如下:
nload="this.removeAttribute('width'); this.removeAttribute('height'); this.removeAttribute('onload');" />
置信度是指统计结果的可信程度,计算方式就是1减去第二列的概率。置信度越高,说明新的实验现象越可能是真实存在的,而非偶然误差。
用扔骰子的例子来理解,数据和预期偏离3σ的概率是0.0063%,比连续5次投中6的概率还要小;偏离5σ的概率只有0.000057%,更是相当于连续8次投中6!
在科学研究中,如果实验数据和理论预期的偏差在3σ以下,那只能说明“找到了新现象存在的迹象”;达到3σ,则意味着“找到了新现象存在的证据”;而达到5σ以上,科学家们就可以比较放心地认为“发现了新现象”。
nload="this.removeAttribute('width'); this.removeAttribute('height'); this.removeAttribute('onload');" />
正态分布图中距离平均值的距离和置信度的对应关系(图片来源:Dirk Mallants)
5σ:粒子物理学的“黄金标准”
通过统计显著性来判断是否存在科学新发现,这在粒子物理学的研究中尤其常见。
粒子物理学的研究对象是比原子还要微小的粒子。在大型粒子加速器的实验中,每秒会发生上百万次粒子对撞事件。面对海量数据,粒子物理学家必须依靠统计学的方法,才能排除背景噪声、实验设备缺陷等因素导致的实验误差,发现可能的新粒子或新物理现象。
欧洲核子中心的大型强子对撞机,每次碰撞可以产生上百万次粒子对撞事件(图片来源:欧洲核子中心)
粒子物理实验的数据分布图上常常会出现一些凸起的小鼓包,这一般是由随机的统计涨落引起的。随着数据量变大,统计涨落的影响越来越小,这些小鼓包也就会随之变得不再明显。
然而,如果分布图里观测到一个明显凸起的小鼓包,数据量变大时仍稳定出现,并且这个结构在现有理论下无法得到解释,那就可能预示着新物理现象的发现。
如何判断这种小鼓包是否确实代表新物理现象呢?这就需要借助统计显著性来分析。粒子物理学领域中有一条“黄金标准”:只有实验数据与背景假设(即“无新物理现象”的假设)之间的偏差达到5σ,才能确认发现了新物理现象。
以欧洲核子中心(CERN)发现被称为“上帝粒子”的希格斯玻色子为例,研究人员很早就在125GeV能区观测到了一个异常信号,但一直等到数据量积累到统计显著性达到5σ的黄金标准,才正式宣布希格斯玻色子的重大发现。
双光子衰变过程在能量为125GeV,附近发现的小鼓包就是希格斯粒子(图片来源:欧洲核子中心)
为什么是5σ?
5σ对应的置信度约为99.99994%,观测结果是由随机统计涨落导致的概率仅有0.00006%,这样的新发现被认为确凿无疑。事实上,在大多数使用统计分析的研究领域,5σ的统计显著性标准太过严苛了。例如在生命科学领域,通常3σ的显著性(对应99.73%的置信度)就足以支持重要发现。然而,粒子物理学对精确性的追求尤其苛刻,毕竟物质基本性质的研究是人类认识宇宙的基石,任何微小的误差都将带来非常重大的影响。
严苛的标准还来源于惨痛的教训。粒子物理史上曾多次出现“假信号”的案例,例如2015年欧洲核子中心曾报告观测到质量约为750GeV的“新粒子”,显著性大于3σ,在当时引起了巨大轰动。但是后续随着实验数据的积累,“新粒子”的信号逐渐消失不见,最终被证实为统计涨落引起的“假信号”。
nload="this.removeAttribute('width'); this.removeAttribute('height'); this.removeAttribute('onload');" />
750GeV左右凸起的鼓包最终被证实源于统计涨落,而非新粒子的信号(图片来源:欧洲核子中心)
更何况,即使实验数据的显著性达到5σ的黄金标准,仍有可能被后续研究推翻。2023年,美国费米国家实验室宣布了一项重大发现:μ子反常磁矩的测量值偏离粒子物理标准模型的理论预言,置信度达到了5σ。这一结果引起了学术界的极大关注,很多人相信这是存在“新物理”的实验证据。
时间到了2025年6月初,在积累更多数据之后,费米实验室把测量精度提高了4倍。与此同时,理论物理学家们重新审视了计算过程,对理论预期值进行了重要修正。令人意外的是,原本5σ的显著偏差在理论值修正后竟然消失了,实验测量与理论预言重新达成一致,让粒子物理学家发现“新物理”的梦想再次破灭。
nload="this.removeAttribute('width'); this.removeAttribute('height'); this.removeAttribute('onload');" />
μ子反常磁矩的测量结果,理论值和实验值已经趋于一致(图片来源:费米实验室)
著名物理学家卡尔·萨根说过,“超凡的主张须有超凡的证据”。5σ标准不仅是统计学上的严格筛选,更是粒子物理学对科学真理极端审慎态度的体现。它平衡了探索未知的雄心与避免误判的理性,确保每一次“发现”都能经受住时间和实验的反复检验。
为什么还不能断言发现了地外生命?
介绍完通过统计显著性来判断物理新发现的方法,让我们回到文章开头关于地外生命迹象的研究。
研究人员借助詹姆斯·韦伯望远镜的中红外相机(MIRI)观测了K2-18b这颗行星,在大气光谱中找到了二甲硫醚(DMS)或二甲基化二硫(DMDS)的信号。在地球上,这类分子几乎完全由生命(主要是海洋浮游生物)制造,因此在地外生命搜寻中被视为潜在的生命特征分子。
然而,此次发现的DMS/DMDS信号的统计显著性在2.9σ到3.4σ之间,这确实可以称得上“找到了证据”,但距离5σ的标准还有很大差距。一些新闻报道中提到的数据“确定度高达99.7%”实际上指的是显著性为3σ时对应的置信度。
MIRI拍摄的K2-18b的大气光谱(图片来源:参考资料[1])
即使随着实验数据积累,DMS/DMDS存在的统计显著性能提升到5σ的水平,研究人员也仍然不能确信这类分子在星球上只能由生命体产生。只有通过后续的观测和实验室模拟,彻底排除未知的化学或地质过程产生这些分子的可能性,才能最终将它归因于生命活动。
事实上,2024年天文学家就曾在一颗名为67P的彗星上发现了DMS的存在。这颗彗星由尘土和冰组成,表面没有空气,无法支撑生命活动。这在一定意义上已经证明地外行星的DMS并不能作为生命存在的直接证据。
彗星67P上发现了DMS的痕迹(图片来源:ESA)
因此,尽管此次研究对于认识K2-18b是一个重大突破,但断言这颗124光年外的星球存在生命迹象还为时尚早。对于地外生命的探索仍需我们带着耐心、严谨和热情继续前行——当然,还有一些统计学的知识。
K2-18b和地球的大小对比示意图(图片来源:Walk In The Clouds)
参考资料:
[1] Madhusudhan, Nikku, et al. "New Constraints on DMS and DMDS in the Atmosphere of K2-18 b from JWST MIRI." The Astrophysical Journal Letters 983.2 (2025): L40.
[2] https://phys.org/news/2025-04-indicators-alien-life-astrophysicist.html
来源:科学大院
原标题:发现外星生命痕迹,确定度99.7%!——等等,这是怎么算出来的?
编辑:潇潇雨歇
转载内容仅代表作者观点
不代表中科院物理所立场
如需转载请联系原公众号