维恩用经典热力学证明了黑体辐射曲线形状不随温度而变化,只是长高变宽.但是,热力学方法没有明确得出实际的曲线.1893年,维恩基于实际测量数据猜测出一个公式:
$$\rho \left( f \right) = \alpha {f^3}{e^{ - \frac{{\beta f}}{T}}}$$α,β是常量.这个公式似乎意味着基尔霍夫的挑战已经实现了.但是在长波、低频率部分与实际测量值不是非常精确地吻合,并且随着改进了的红外测量技术被引进后,最低频率部分的ρ(f)是${f^2}$而不是${f^3}$,并且这些低频率的辐射能量强度与绝对温度成正比.因此维恩的公式不正确,基尔霍夫的挑战依然存在.
1898年,普朗克40岁了,是柏林大学久负盛名的理论物理学家.他的早期工作在化学物理领域,将热力学应用于该领域,他取得了极大的成功.他坚信热力学是最深程度地理解自然本质的关键.并且花了好几年时间清理热力学第二定律的各种障碍(熵一直增加).他相信热力学第二定律非常严格地正确,并且最终可以以更基础的理论加以证明.
现在,热力学通过斯特芬定律和维恩位移定律,已经在分析黑体辐射上开了一个好头.看起来似乎热力学非常可能导出黑体辐射曲线.他感觉这个曲线是理解电磁辐射与物质相互交换能量的关键.这在物理学里是非常基础的问题,具有明显的技术上的重要性.并且,实际上,当时他所在的学校里,实验物理学家们正在将黑体辐射曲线的测量数据的精确度提升到一个新的水平.
(玻尔兹曼已经在分子水平分析了气体的特性,将热力学定量关系与微观粒子的分布联系起来.普朗克对此方法不太看好,因为那个方法暗示热力学第二定律仅仅是统计上的,只在大的系统中适用(比如有大量气体分子).尽管如此,他对玻尔兹曼的工作还是非常熟悉的,玻尔兹曼教过普朗克几次课,讲了所有的观点.然而普朗克甚至并不确信是否有原子和分子这种东西.)
但是怎么开始用热力学分析黑体辐射呢?实验物理学家们使用的炉子是一个令人生畏的复杂系统:炽热的炉壁内含有大量微小的带电振动微粒(振子),从这些加速运动的带电微粒产生的电磁辐射就是火炉内的光和热.与此同时,这些振子又通过这些振荡的电场补充能量.换句话说,温度不变时,火炉内的辐射和炉壁内的振子处于热平衡态,彼此之间不随着时间的变化而出现能量的增减,但是小分量的能量在每一个振子之间连续地来回传递.
幸运的是,基尔霍夫很早以前就证明了,2个同温度的火炉如果在某些频率上具有不同的辐射能量强度,那么能量可以从一个火炉流向另一个火炉,且与火炉的材质无关,这违反了热力学第二定律.因此普朗克可以将他的火炉看做最简单的可以与辐射相互作用的材料:他考虑了一种最简单的简谐运动振子(一维的,质量为m,线性回复力为$ - m\omega _0^2x$).作为预先的练习,他用单频振荡电场$E\cos \omega t$代替杂乱无章(频率之间没有关系)的热辐射来驱动振子,这些振子模型带有电量e,在电磁波理论中已经证明了加速运动的带电体会以辐射的形式失去能量,有效的drag force是
$$\left( {\frac{{2{e^2}}}{{3{c^3}}}} \right)\frac{{{{\text{d}}^3}x}}{{{\text{d}}{t^3}}}$$振子的运动方程就是
$$\eqalign{ & m\frac{{{{\text{d}}^2}x}}{{{\text{d}}{t^2}}} + m\omega _0^2x - \left( {\frac{{2{e^2}}}{{3{c^3}}}} \right)\frac{{{{\text{d}}^3}x}}{{{\text{d}}{t^3}}} \cr & = eE\cos \omega t \cr} $$对于受迫振动振子(做阻尼运动的振子受到外力作用)(driven oscillator),普朗克指出
$$\frac{{{{\text{d}}^3}x}}{{{\text{d}}{t^3}}} = - {\omega ^2}\frac{{{\text{d}}x}}{{{\text{d}}t}}$$并给出了一个标准的经典力学问题:具有黏性阻尼的受迫振动振子的问题.对这个问题,普朗克找到了以驱动电场大小表示的振子能量(详细推导见参考资料).
普朗克接下来用温度为T,处于平衡态的火炉内复杂不相关的辐射场代替单一的电场(the single driving field).这是完全不同的场景,对于单一驱动电场,最初的瞬态行为后,振子稳定在一个与驱动力相适应的固定的振幅和相位上,但是当驱动电场为复杂不相关的电场后,即便是最重要的那些振子的运动频率也趋于自身的固有频率了,运动不再类似钟摆,更像是挂在门口糟糕天气里的篮子.尽管如此,普朗克还是在思考能量交换,他对振子运动的详细描述不感兴趣;振子的能量等于驱动电场的平方(the energy in the oscillator goes as the square of the driving field),当有很多不相关驱动电场时,振子的总能量等于各个电场的平方之和(交叉项将平均为0(cross terms will average to zero)).
普朗克根据自己的分析(见参考资料),证实了炉壁内振子的平均能量U(f,T)与辐射场的单位频率能量强度$\rho \left( {f,T} \right)$之间的关系:
$$\rho \left( {f,T} \right) = \frac{{8\pi {f^2}}}{{{c^3}}}U\left( {f,T} \right)$$ 这里值得强调的是,这是一个经典结果:唯一的输入是经典动力学和麦克斯韦的电磁理论.注意,振子的带电量e并没有出现在上式中:结果是与振子和辐射之间的耦合强度无关的,耦合强度只需要确保热平衡即可.有了一个振子的能量与黑体辐射曲线的联系,普朗克认识到,从维恩的辐射定律
$$\rho \left( f \right) = \alpha {f^3}{e^{ - \frac{{\beta f}}{T}}}$$他可以完整地导出一个振子的热力学.根据他的热力学第二定律,最自然的方法就是看看熵随着能量如何变化.根据上面的两个方程,能量如下:
$$U\left( f \right) = \frac{{\alpha {c^3}f}}{{8\pi }}{e^{ - \frac{{\beta f}}{T}}}$$相应的熵为
$$S = - \frac{U}{{\beta f}}\ln \left( {\frac{{8\pi U}}{{\alpha f{c^3}}} - 1} \right)$$练习:证明TdS = dU.
热力学中一个重要的定量关系是熵的二阶导数,这与热力学第二定律密切相关:二阶导数为负能保证如果系统被干扰,熵将增加倒回平衡状态.
他发现一个非常简洁的结果:
$$\frac{{{\partial ^2}S}}{{\partial {U^2}}} = - \frac{1}{{\beta fU}}$$二阶导数是负的,他被这一简洁感到吃惊,以为自己已经接近很深的热力学真相.他分析到,这暗示着热力学第二定律和位移定律很可能唯一地决定黑体辐射的曲线,然而他错了.
统计力学应用于一个振子可以给出它的能量为kT已经被人们熟知多年了,为什么普朗克完全没有注意到这一点?他虽然很熟悉玻尔兹曼的工作,但是似乎并不关注统计力学.他是一个旧热力学支持者.
1900年10月,柏林的Rubens and Kurlbaum宣布了一些新的实验发现:辐射强度在低频部分是随着${f^2}$变化不是${f^3}$,而且低频的辐射强度与温度成正比.
这使普朗克感到震惊.对于一个振子,他得到的简单结果
$$\frac{{{\partial ^2}S}}{{\partial {U^2}}} = - \frac{1}{{\beta fU}}$$在高频部分非常接近真相了,但是在低频部分不正确(equipartition was holding).振子的能量是
$$U = kT$$联立
$$dU = TdS$$立即得到
$$\frac{{{\partial ^2}S}}{{\partial {U^2}}} = - \frac{k}{{{U^2}}}$$这意味着他之前认为黑体辐射曲线唯一地由
$$\frac{{{\partial ^2}S}}{{\partial {U^2}}} = - \frac{1}{{\beta fU}}$$决定是不正确的.放弃那些最深入的热力学事实,他决定最好是赶紧做出修改.你怎样才能在低频部分得到
$$\frac{{{\partial ^2}S}}{{\partial {U^2}}} = - \frac{k}{{{U^2}}}$$而在高频部分得到
$$\frac{{{\partial ^2}S}}{{\partial {U^2}}} = - \frac{1}{{\beta fU}}$$呢?有一个简单的办法:
$$\eqalign{ & \frac{{{\partial ^2}S}}{{\partial {U^2}}} = - \frac{k}{{U\left( {hf + U} \right)}} \cr & \frac{{{\partial ^2}S}}{{\partial {U^2}}} = - \frac{k}{{U\left( {\beta kf + U} \right)}} \cr} $$(我已经在1式参数中放入正确的值:k是玻尔兹曼常数,这个参数对于符合低频等式是必须的,维恩公式中的β变换为普朗克常数除以玻尔兹曼常数$\beta = h/k$
这当然是完全没有验证的猜测,但是接着,两次积分得到熵:
对此,
$$\eqalign{ & \frac{{dS}}{{dU}} \cr & = \frac{k}{{hf}}\left[ {\ln \left( {1 + \frac{U}{{hf}}} \right) - \ln \frac{U}{{hf}}} \right] = \frac{1}{T} \cr} $$(右边是绝对温度的热力学定义),得到
$$U = \frac{{hf}}{{{e^{\frac{{hf}}{{kT}}}} - 1}}$$从而导出黑体辐射曲线:
$$\rho \left( {f,T} \right) = \frac{{8\pi {f^2}}}{{{c^3}}}\frac{{hf}}{{{e^{\frac{{hf}}{{kT}}}} - 1}}$$k是玻尔兹曼常数,h是一个新的常数,现在被称为普朗克常数.
普朗克的这项工作非常出色,它在高频部分与维恩公式相符,在低频部分与T成正比.并且更好的是:在整个频率范围内,它在最小的测量误差内与最精确的测量相符.
这令人吃惊的好消息使普朗克拼命地寻找理论上的理由!一如既往地,他聚焦于熵:
这个形式的表达式应如何解释?这里事情发生了意想不到的转变.他对于玻尔兹曼关于气体原子的熵的分析的了解提供了线索,尽管普朗克自己还怀疑原子的存在性.玻尔兹曼对熵的表达式是
$$S = k\ln W$$其中W是对应于给定宏观变量的微观状态总数,k是玻尔兹曼常数.(实际上,这个在玻尔兹曼墓碑上的公式是普朗克第一次写上去的.)
1877年,玻尔兹曼确实分析了一个原子系统并得到了一个与普朗克发现的这个表达式非常相似的熵的表达式.玻尔兹曼的模型只允许原子具有整数倍于某一个非常微小固定能量ε.他于是发现原子的可能的状态数与给定的总能量一致,这种组合(排列组合)的分析,结合斯特林的公式
$$\ln N! \cong N\ln N - N$$给了他一个熵的表达式,最终,玻尔兹曼得到了ε的极限.
对于简谐振动的振子,相似的分析如何实施呢?再一次,玻尔兹曼的其中一个想法起作用了. 在温度T时具有平均能量U的一个振子的熵与振子被热噪音相互作用而产生的状态总数相关.1884年,玻尔兹曼已经引入了一个全体的概念:对于振子,这个全体就是具有随机状态但是相同U和T的N个振子的集合,因此在某一瞬间,整个集合将呈现单个振子在所有时间内的可能的状态.
全体就具有熵NS,其中S是单个振子的熵.全体的熵就是
$$NS = Nk\ln W$$现在,
N个振子的可能的不同排列数意味着:总能量NU分配给N个振子,有多少种不同的方式?这就是W的含义.实际上,普朗克认识到,或很可能记起了玻尔兹曼的工作,W的表达式非常类似于一个众所周知的组合表达式:将M个物体分配到N个盒子里,有多少种分法,如果假设M个物体都是不同的?答案是
$$W = \frac{{\left( {N + M - 1} \right)!}}{{M!\left( {N - 1} \right)!}}$$对于N,M的大数值,使用斯特林公式
$$\ln N! \cong N\ln N - N$$,这变为
于是,和前面的公式对比,对于普朗克而言,就有
$$\frac{U}{{hf}} = \frac{M}{N}$$或
$$NU = Mhf$$这就是说,普朗克的N个相同频率振子排列的总能量NU等于Mhf,关键地,这个熵的表达式告诉我们,这个能量是一份一份地分配到这些振子中,每一份等于hf.
也就是将总能量NU分成了M份,每一份是hf,即某一时刻,总能量NU是以离散不连续的份量hf分配给各个谐振子.熵的表达式告诉我们,能量在谐振子中的分配是离散不连续的,每一份是hf.
普朗克在看到新的实验数据后,觉得有必要修正他的曲线,在紧张地工作了2个月后,于1900年12月得到上述结论.但是他依然半信半疑,毕竟他的推导的第一部分中,辐射场中的一个谐振子的能量是经典力学的:他假设了能量的发射和吸收都是连续的.然而,他突然做了改变,使用了完全非经典力学的概念,谐振子只能一份一份地失去或得到能量.(他不认为辐射是量子化的,他将这种量子化纯粹地看作是炉壁上谐振子的一种属性).结果,尽管他的曲线的精确性被大家广泛地认可了,并且视为是量子力学的诞生,然而没有任何人,包括普朗克本人在接下来的好几年里都没有理解这一点.
1905,爱因斯坦结合普朗克的理论(普朗克常数)使用光子的概念对光电效应给出一个解释.