引言:迄今为止还没有一种CPU散热系统能保证永不失效。失去了散热系统保护伞的“芯”,往往会在几秒钟内永远停止“跳动”。值得庆幸的是,聪明的工程师们早已开发出有效的处理器温度监控、保护技术。以特殊而敏锐的“嗅觉”随时监测CPU的温度变化,并提供必要的保护措施,使CPU免受高温下的灭顶之灾。在我们看来,探索这项技术如同开始一段神秘而有趣的旅程,何不与我们同行?
微处理器功耗和温度随运行速度的加快而不断增大,现已成为一个不折不扣的“烫手山芋”。如何使处理器安全运行,提高系统的可靠性,防止因过热而产生的死机、蓝屏、反复重启动甚至处理器烧毁,不仅是处理器所面临的困境,也是留给主板设计者的一个重要课题。为此,Intel率先提出了温度监控器(Thermal Monitor,以下简称TM)的概念,通过对处理器进行温度控制和过热保护,使稳定性和安全性大大增加。
但是,由于电脑爱好者和普通用户对处理器温度监控系统了解不多,而且介绍这方面知识的中文资料也难以获得,遇到相关问题时会感到不知所措,所以有必要将处理器温度监控技术系统地介绍给大家。
一、温度测量:从表面深入到核心
建立微处理器温度监控系统,首先要选择一种合适的温度测量器件。能够测量温度的器件有很多种,如热敏电阻、热电偶和半导体温度传感器等。电脑中最早使用热敏电阻作为测温元件,微处理器插座下竖立的球状或带状的小元件,就是热敏电阻(如图1)。

图1 注∶处理器插槽下的热敏电阻
热敏电阻(Thermal Resistor ,简称Thermistor)体积小、价格低,使用方便,但用于检测微处理器温度时存在着先天不足:
1.热敏电阻是接触式测温元件,如果热敏电阻与微处理器接触不够紧密,微处理器的热量不能有效地传送到,所测量温度会有很大误差。有些主板上采用SMD贴片热敏电阻去测量微处理器温度,其测量误差比直立式热敏电阻误差更大,因为这种贴片元件很难紧密接触到微处理器。
2.微处理器的核心(die)发出热量由芯片封装向外部散热,微处理器的表面温度和核心温度之间约有15℃~30℃的温差,同时因芯片封装形式不同,及环境温度的不同而难以确定。至今还没有一种技术能够把热敏电阻埋进芯片内部去,导致现在热敏电阻只能测量微处理器的表面温度,而无法测量核心温度。
总之,热敏电阻不仅测量精度难以保证,更重要的是无法检测到热源的真实温度。
由于热敏电阻先天不足带来了一个十分严重的问题∶表面温度不能及时反映微处理器核心温度变化,用专业术语说就是存在一个时间滞后的问题。因为核心温度变化之后要经过一段时间才能传送到微处理器表面。图2反映了采用核心测温方式下保护电路起作用的情况,当核心温度达到微处理器极限温度T2时,控制电路及时切断微处理器的供电,否则只需几秒钟时间便会到达烧毁温度T3。相比之下,表面温度反应十分迟钝,其升温速度远不及核心温度,当核心温度发生急剧变化时,表面温度只有“小幅上扬”。Pentium 4和Athlon XP等最新的微处理器,其核心温度变化速度达30~50℃/s,核心温度的变化速度越快,测量温度的延迟误差也越大。在这种背景之下,如果再以表面温度作为控制目标,保护电路尚未做出反应,微处理器可能已经命归黄泉了。

图2 注∶表面温度的时间滞后特性
为了解决热敏电阻无法测量微处理器核心真实温度的问题,Intel在Pentium Ⅱ和Celeron处理器中植入了热敏二极管(Thermal Diode,或简称作Thermodiode)直接测量处理器核心温度,开创了半导体测温技术的先河。此后的Pentium Ⅲ和Pentium 4芯片中都植入了热敏二极管,AMD在Athlon和Duron处理器中也植入了热敏二极管。现在许多主板都在监控芯片内设置有热敏二极管,用于检测芯片所在位置的环境温度。
- 小知识∶如何知道BIOS或测试软件显示的微处理器温度是表面温度还是核心温度?
就目前来看,无论使用Intel还是AMD的微处理器,已很少使用热敏电阻测量微处理器表面温度了,所以BIOS与检测软件所显示的微处理器温度都是指微处理器的核心温度。而在Pentium Ⅱ以前,微处理器温度通常是指表面温度;Pentium Ⅱ及以后的微处理器内都集成有热敏二极管,所测量温度就是核心温度。不过,在过渡期内许多主板上仍在微处理器插座下面保留了热敏电阻,这样就同时能检测到两个不同的微处理器温度值,通常BIOS中显示的是微处理器的外部温度,而检测软件所测试的是核心温度。
热敏二极管又叫热敏PN结(Thermal PN junction),基于硅基PN结正向电压和温度的关系,其测温范围在-55℃~+150℃之间。与热敏电阻一样,热敏二极管属于变阻器件,其等效电阻值是由其工作温度所决定。
二、温度监控:从单纯显示到温度监控
在热敏电阻为主要测温手段时期,测得的微处理器表面温度经放大器将微弱信号放大后经A/D转换,将模拟信号转换成数字信号后再通过数据线发送给BIOS芯片(如图3),数据进入BIOS芯片后,BIOS或监控软件就能在屏幕上显示了。

图3 注∶温度信号处理电路
温度显示系统是一种被动的体系,无法对温度进行调节。一旦测得微处理器温度超出设定温度,电脑可以发出声光报警,以提醒电脑用户进行人为干预。这种系统用于目前发热量大的微处理器基本上没有安全可言。如果散热系统发生问题后,没等用户反应过来,微处理器就已经烧毁了。因此,Intel提出了温度监控的概念,让系统具有自我调控能力,一旦微处理器温度超出所设定的极限温度,系统将通过降低供电电压、降低芯片工作频率和加强冷却等手段进行主动降温,甚至自动关机,以确保微处理器安全。
温度监控技术有两个鲜明的特点∶
- 一是微处理器内置热敏二极管直接测量核心温度。
- 二是主板上设置监控芯片(如图4)。
Intel首先在Pentium Ⅱ及Celeron微处理器中植入热敏二极管,并公开了具有温度监控技术的主板设计指南,这一举措得到主板制造商的积极响应,各具特色的所谓的“智能主板”如雨后春笋,一时精彩纷呈。一些有实力的主板制造商还自行开发监控芯片(如MSI的CoreCell等),温度监控技术在短短几年内便有了很大进步,不断完善温度监控功能。

图4 注∶各种硬件监控芯片
实际监控系统所采取的主动降温措施中,哪种方法更有实际意义呢?下面我们进行一个简短的分析。
芯片的功耗(发热量)由静态功耗和动态功耗两部分组成(如图5),静态功耗是因为漏电流引起的