A 什么叫量子化(基本知识:线性代数,概率的基本知识,一些基本的量子力学常识,理论力学基础)距离量子物理蓬勃发展的二十世纪初已经接近百年。百年前,多种新型现象的发现,促使了相对论和量子力学两道惊雷,撕破天上的乌云,摧毁经典世界的根基,以摧枯拉朽之力重建了新的世界。百年后的我们,回顾前人的工作,总有一条重要的任务,那便是重新利用我们的逻辑,厘清物理理论建立的脉络。
这个原因当然是,真正的科学工作的创新往往伴随着偶然与运气成分,有时错误的出发点能得到正确的结论,有时跳跃的灵感代替了严格的推理。而作为一个经历百年沧桑屹立不倒的根基性理论,量子理论应该能够通过更加严谨、规整的方式被我们所认知。
而这里我们要谈论的问题,就是量子化。
量子化,或者全称为,“经典理论的量子化”。他的含义是,通过一定的手段,让我们根据一个经典理论,去构造一个具有量子特性的物理理论。
那么,这里的关键就在于两点:1 经典理论是如何被描述的。2 量子理论应该具有怎样的特征。A.1 经典理论
我们熟悉的经典理论,无非是指两类。一类是经典力学理论,一类是经典场论理论。力学(mechanism)与场论(field theory)二者的区别在于自由度上,我们暂且按下不表。我们不妨取出两个例子——牛顿力学与电磁学两种。
我们最熟悉的描述方法应该是基于基本物理量+方程的描述。比如牛顿力学,定义好运动学量(位移,速度,加速度)与动力学量(力)之后,依靠牛顿三定律建立他们彼此之间的联系。再比如电动力学,定义好了各种各样的场强(电场,磁场)与产生电磁场的源头(电流,电荷)后,依靠麦克斯韦方程建立彼此的关联。
此外,如果读者接触过一点理论力学,就会知道,这些经典理论还有两个常见的表述,即Lagrange表述与Hamilton表述。我们只用很简单的语言大概描述一下这两种表述是怎样的。
Lagrange:整个系统的动力学特征由拉氏量(Lagrangian)决定,一切的动力学方程都是一类被叫做“欧拉—拉格朗日方程”的方程特殊形式。得到这一方程的背后原因在于最小作用量原理,也即体系演化的情况(力学:空间中的路径;场论:场位形空间的轨迹)应使得其上定义的作用量取极值。我有的时候跟同学开玩笑说,之所以最小作用量原理成立,还是因为老天爷喜欢最省事的世界。
Hamilton:整个系统的动力学特征由哈密顿量(Hamiltonian)决定,一切的动力学方程都是一组叫做“正则方程”的方程具体形式。其上有定义好的泊松括号,使得我们可以利用其计算各种各样的力学量随时间演化的关系。Hamilton形式与Lagrange形式之间可以相互转换。当然,对于对理论物理,或者是对几何理论很熟悉朋友,应该会知道,其实Lagrange理论与Hamilton理论本质上是两个不同的几何理论。Lagrange理论对应于微分几何理论,Hamilton理论对应于辛几何的理论。这一部分的理论就很深刻,详情可以参考Arnold的理论力学。
A.2 量子特性什么样的理论才能叫做拥有量子特性的理论呢?这个问题事实上是经历了极其漫长过程才得以解决的。
早期的量子理论,以Lorentz黑体辐射开始,经过爱因斯坦的光子假说,玻尔的原子跃迁模型,再到索墨菲半经典量子化条件为止,他们认为一个能让传统意义上连续取值的物理量出现离散化的特征即有量子特性。
这一说法虽然不能算错,但流于量子理论的表面。
举一个简单的例子。
我们知道位置/动量不确定性关系。
可是事实上,在量子力学里面,动量与位置其实可以存在连续取值的情况,用更加数学化的语言表达,即连续谱在量子力学里面可以存在。
事实上,熟悉固体物理的朋友也知道,能带论里的每条能带都可以连续取值(当然这个例子并不好,因为事实上能带里存在的是非常细密的不连续的分离能级,这里提到只是为了说明,这样的连续取值的能级与量子力学并不会起说明冲突)。
所以,当量子理论进入到量子力学的发展阶段,随着概率解释,不确定性原理,薛定谔方程,态叠加原理的建立,量子力学最基本、最核心的特征才被真正挖掘出来:
a,量子力学的所有描述都要依赖概率。
(概率诠释)
b,量子力学的状态能够被线性叠加。
(叠加原理)
c,量子力学里存在大量不可交换的操作。
(不确定性原理)
d,物理量的取值在一些条件下(已被实验测定的情况)应当能取离散值
(为什么不加薛定谔方程的限制呢?
这是因为一旦进入相对论性量子力学里面,基本方程就不再是薛定谔方程这样不具备洛伦兹不变性的方程了。
)
依靠abc三条,我们能推测出哪些量子理论需要拥有的数学特点呢?
a:
量子理论里需要有一些量被解释为概率。
这意味着,当计算结果是一个概率时,其必须保证概率积分为1,即存在归一化。
b:
量子理论应该是一个线性理论。
量子理论的基本方程应当是一个齐次线性微分方程。
c:
量子力学里应该能够定义出大量的非零的对易子。
如果我们讲两个操作相继进行定义为乘法,那么不确定性关系等于说,这两个操作(A,B)的乘积顺序交换后,计算结果会不一样,即AB与BA不相等。
d:
物理量的取值不能做强行规定,而是应当具有某种机制,使得本来可以连续取值的物理量在这一情形下可以分立取值。
我们可以注意到,这三条里面,第二条与第三条是对数学结构很强的限制,而第一条应该是一条将数学计算转变为物理结果所需要的手段。
至于第四条,则是提醒我们要关注经典的物理量在量子理论中的行为。