作者 | 刘洋洲
来源 | 转自知乎专栏《万物皆数也》,“数学英才”获授权转载,在此感谢!
1问题引入
三年前,朋友ZZN和我讨论如何在维球内撒点。当时我有一个很朴素的想法,三维球内均匀分布的点在视网膜看来并不是“均匀”的,而应该是中间密,边缘疏。向左滑动下图,依次是三种情况:维球面中的均匀分布的点投影前两个坐标,即
图中越是颜色深的点,就越接近球心。不过这并不意味着图中圆心附近就没有高维实心球边界附近的点,它们只不过是被深色的点遮挡而已。
<<< 左右滑动见更多 >>>
上图代码如下(R语言):
f <- function(n=3, N=1000, color="#00CCFF")
{
par(mai=rep(0,4), oma=rep(0,4), bg=color)
plot(0, 0, type="n", xlim=c(-1.5, 1.5), ylim=c(-1.5, 1.5),axes=FALSE, xlab="",
ylab="")
a=runif(n*N, -1, 1)
b=matrix(a*a, n)
a=matrix(a, n)
c=apply(b, 2, cumsum)[n,]
b=which(c<=1 & c>0.75)
points(a[1,b], a[2,b], pch=19, cex=0.3, col="yellow")
b=which(c<=0.75 & c>0.5)
points(a[1,b], a[2,b], pch=19, cex=0.3, col="orange")
b=which(c<=0.5 & c>0.25)
points(a[1,b], a[2,b], pch=19, cex=0.3, col="red")
b=which(c<=0.25)
points(a[1,b], a[2,b], pch=19, cex=0.3, col="purple")
b=which(c<=1)
print(length(b))
}
f(10,12000000)
沿着这个想法,继续追问:如果是高维球中的点投影到低维(比如一维直线上),是否也会有这样的现象呢?它的概率密度函数是怎样的呢?
付诸行动,我在维单位球内撒了万个点,并将点投影到一维区间上,然后将划分为个小区间,统计投影点落入各小区间的频率,画出频率分布图。
看到这样的钟形曲线,谁不会蠢蠢欲动呢?
2问题论证
一个点出现在某一小区间内的概率,与所决定的维球的“切片”的体积成正比。所以这个问题本质上是一个重积分的问题。
命题:考查将维单位球内均匀分布的点(充分多),投影至一维区间,探究其投影点在此区间上疏密分布之状况。
3解:
由重积分的定义,我们可以写出投影点落入区间的概率:
是维球的体积;是——
(类比的情况,即是维球的切片维球,也就是圆, 圆的半径由圆心所在坐标决定的。) 令
于是
做一个有益的变换:
上面这个变换意味着,我们将原先的分布函数横向拉长倍,纵向压缩倍,于是曲线下方面积保持不变。我们转向研究概率密度函数,
先对系数进行估计:由维单位球体积公式,
以及公式估计的系数:
于是有
这就解释了上面的曲线为什么一幅正态模样。更进一步, 将同自由度为的分布相比较,显然有
因为这是替换两个等价变量的结果,
4结语
当我第一次看到正态分布的概率密度函数时,那个时候我还是一个初中生,但是它带给我的陌生感、怪异感一直延续至今。每次见到它,我心中总是嘀咕着,为什么它会是这种形状?,,,这些数字都是哪里来的?如果说方程联接了个重要常数,那么正态分布则是体现了这几个数字的可怕,它统治着万事万物从亘古以至于未来;如果说欧拉公式体现的是简洁与和谐之美,那么高斯分布体现的是哥特式的惊人魅力。方程是虚幻的,几何却能给予人切实的掌控感。我觉得一个美的方程背后必定蕴藏着几何的宝藏,而我以上所写的关于正态分布的几何模型,就是这份宝藏中的亿份之一吧!
数学英才
中学生英才计划
数学学科官方公众号
推送数学微慕课和学习资料
如若转载,请注明出处:https://www.dawenbi.com/5422.html