最近在工作中,有时会遇到解释CPU Turbo频率,以及温度和功耗控制的问题。我发现有的同行朋友在这块的认识存在一些误区,倒不是说技术原理上有多难,可能是因为对Intel这几年CPU的性能/热设计了解的还不够吧。
正好我在散热领域还有些粗浅的经验,测试工作中也有一定的积累。所以就整理了2个图表,顺便讲解一下分享出来,也欢迎读者朋友们点评指正。
短时Turbo散热设计策略
首先我评估了4个技术指标维度:
– Turbo(超过TDP)时间;
– 峰值功耗/ 性能;
– 温度控制;
– 风扇静音
下表中,我拟定了A/B/C三款对比机型,可能是来源于真实的某个或某一类产品,但又不希望对号入座。同时我还假设大家配置相同的CPU(如:Core i7-10700或11700)以及散热器硬件。
注:图表中的评分1-3,数字越大代表在该项目上表现越好。
首先,A机型属于典型商用机的静音散热策略,同时遵循Intel PL1、PL2功耗设计。比如65W TDP(热设计功耗,通常等于PL1)的i7-11700,短时Turbo自动超频的功耗可达200W以上,接近PL2规范。
关于Power 和2的定义可参考下表:
在短时Turbo阶段,A机型的CPU散热器风扇转速不会立即提到很高。如果是持续的全核压测,会达到或接近100℃,触发CPU自身的频率节流机制。在这里我想解释3点:
Tips 1、100℃这个规格来自哪里?
上图引用自:
在去年写的《Xeon CPU跑到90℃了:为什么风扇转速还不提高?》中,我介绍过T 这个温度值。指的是来自CPU内部传感器的核心温度读数,比金属顶盖的表面温度要高。
Tips 2、达到或者接近100℃、触发需要担心吗?
我们用一些软件看到的也是这个温度,还有些朋友觉得8-90℃已经很高了,其实早在十几年前的笔记本CPU就支持100℃最高温度。只是当年功耗/频率控制技术还没有今天这么成熟,所以大家习惯认为就是降频保护。当然今天仍然是为了避免过热的保护机制,只不过已经成为常规散热控制动作中的一部分了。
上图点开后可放大,引用自:
Tips 3、全核Turbo频率跑到多少合理?
如下表,-11700的基础频率为2.5GHz,最大Turbo Boost 3.0频率为4.9GHz(这个是指单核)。Intel官方似乎没有像Xeon服务器CPU那样,公布一个明确的全核Turbo频率。当然从实测情况来看,如果散热上能一直控制住温度,在PL2功耗时限(Intel默认28/56秒)内可以跑到较高的全核频率。
扩展阅读:《推荐一款Linux下监控CPU温度、频率、功耗的工具:s-tui》
而一旦运行到65W的PL1平稳状态,全核频率就不可能再那么高了,一般来说i7-10700不低于2.5GHz就是正常的。如果您在压测时跑AVX-512浮点计算,或者同时跑集成显卡的测试,有些情况下低于基础频率一点也是正常的。这种“功耗墙”的情况,在15W TDP的笔记本CPU上出现的更多。
相比之下,的i7-基础频率3.6GHz就高出不少。如果是长时间全核满载计算或者渲染类的应用,常规情况下(没有人工超频)肯定是比11700要好很多。
让我们回来看A机型的后续动作:当发生之后,CPU风扇会晚一点做适当加速。随着CPU逐渐降到65W PL1功耗,风扇转速又会降低到比较静音,因为只需要维持合理温度即可——如果此时我们看到CPU内核80℃左右也属于正常。
简单总结,在短时Turbo阶段,A机型的特点就是静音设计好、峰值功耗/性能基本满额设计,而Turbo(特别是功耗偏高的Turbo)时间相对不长,温度控制合格(在该项目上1分定义为合格)。
这里我还想加一个Tips4:CPU风扇能否做到瞬间(如秒级)响应CPU的温度变化?
表面上看这样做能有效抑制高温,不过从噪声控制的效果来看,短时Turbo长度和是否维持在较高的功耗对商用PC、工作站来说不是太重要。首先单线程应用一个CPU核心Turbo到最高时,功耗一般还在TDP范围内;如果每次出现几秒的全核满载,CPU风扇就“呼”地一下高速运转,通常也没这个必要。
而服务器等数据中心设备则考虑不同,Xeon 中高端型号本身TDP就比桌面CPU功耗高,在较高密度的1U/2U机箱内,风道前后还有其它配件。这种情况下,为了满足跑到TDP而温度又不超标的基础条件,风冷散热就不太可能像桌面PC那样静音了。(本文暂不讨论液冷)
———END———
限 时 特 惠:本站每日持续更新海量各大内部创业教程
站 长 微 信:chuangyedemao