
关于CPU功耗的讨论,我绝对比IT人员更. 关于这个微博: 最近真的是空的. 我看到有人在玩x86与手臂功耗性能比较,然后是一篇简单的功耗科学文章. (可能需要10分钟才能完成阅读. )既然已经提到了功耗比较(从功耗到性能功耗比,效率和其他指标),有必要再次提醒一些功耗比较的先决条件,说这是另一个提醒,因为实际上很都知道这个问题,但是经常在使用中无意中忽略了这个问题,我会在这里写一些更多的信息,希望大家会更深刻地记住它. 这只是一个博客聊天,我不会验证详细数据,让我们解释一下这个概念. 核心问题是: CPU功耗指标一团糟,运行不同软件时CPU的功耗也不同. 那么,您如何称呼标称功耗指数?每个公司的功耗值如何测量?谁都知道,英特尔一直将TDP功耗数据用于标称CPU功耗. 所谓的TDP,英文全称Thermal Design Power,实际上是指散热设计功耗,即系统设计中必须具备的散热能力值. 换句话说,英特尔告诉他的客户,我的CPU可能产生的最大热量(即功耗)将达到该值. 因此,Intel提供的功耗数据是一个极高的上限,这是CPU在极度满负荷运行时的功耗.

我估计,如果有人测量的功耗大于英特尔的标称值,那么他们应该可以向英特尔索赔. 在CPU IP行业中,由于各种条件和限制(例如,在IP交付时尚不知道具体的过程实现),习惯使用其他功率测量方法,不仅是ARM,MIPS和其他CPU. . 知识产权公司也是如此. 只要找到一个更通用的程序来运行,然后在这种情况下报告功耗数据即可. 多年以来,根据不成文的规则,业内每个人都使用Dhrystone作为测试软件. 这种可怜的Dhrystone在被所有人使用时遭到所有人的责骂. 它的最新版本2.1也是在1988年. 显然,即使是作者,也失去了对其进行维护的兴趣. 奇怪的是它仍然如此长寿且惯性. 功率!回到功耗主题,由于我们讨论了Intel和ARM的功耗,因此我们以ARM为例. ARM的所有标称功耗值均指: (1)(2)片). 运行Dhrystone程序的过程中内核的平均功耗;除非另有说明,否则测量是在计算机模拟环境中进行的(因为ARM不出售芯片,也不具有诸如实际芯片和系统的实际功耗之类的功耗数据. 显而易见的是,由于运行的程序不同,因此功耗肯定也不同.

问题是,在正常情况下,实际功耗是大于还是小于ARM标称值?我不敢在这一点上得出绝对的结论. 我只能说在正常情况下,实际功耗会大于标称功耗!功耗变化的原因很多,例如(但不完整): (1)不同ARM芯片的物理实现本质上是不同的(从前端约束到后端设计再到处理),即使相同的内核,不同的家族芯片的功耗性能也将相差很大. (2)Dhrystone是一个相对“更轻”的程序(这就是为什么它被批评为不适合用作现代CPU的测试向量的原因). Dhrystone在CPU上的负载很小,因此自然而然相应的功耗也相对较小; (3)特别是Dhrystone自己的指令和数据太小,基本上都安装在L1高速缓存中,因此CPU在操作过程中基本上不需要与内存进行吞吐量交互,这一点无论从性能测试或功耗测试,这是一个很大的不足. 我们知道,CPU和内存之间的交互一直是现代CPU的性能瓶颈和主要的能源消耗. 但是,这种功耗数据并不是ARM旨在美化其低功耗的声誉. 实际上,MIPS和其他同行也这样做. 它们都应在各自的材料中以小字体标记,哈哈. 作为“参考”指标,这不是问题,但是每个人都应该记住,这只是一个相对的“参考”指标,而不是绝对值.
因此,使用它时要小心. 与大多数实际应用方案相比,Dhrystone测试对CPU的压力较小. 通常,在实际系统中,芯片公司不会提供单个CPU的功耗值,但意义不大. 有所有芯片,您只关心整个芯片的功耗. 在许多评估报告中,ARM官方网站的性能和功耗值直接应用于Tegra等芯片. 这是非常错误的. 无论功耗或性能如何,ARM提供的仿真数据与芯片的实际数据都会有一定的差异. 例如,A9性能的官方评级为2.5 DMIPS / MHz. 据我所知,没有A9芯片可以实际达到2.5 DMIPS / MHz. 2.3是我到目前为止所看到的最高测量分数. . 原因与功耗测量中的问题有些相似. DMIPS / MHz正是此Dhrystone测试向量所做的. 在Dhrystone测试中,高分和低能耗是一种非常普遍的现象-指DMIPS / MHz运行非常高的分数,但是实际的处理器性能是中等的. 有关Dhrystone的两个问题每个人都需要注意: (1)(2)Dhrystone自身的设计缺陷;欺骗性优化. 关于Dhrystone的缺点的短篇文章很多,主要有以下内容: (1)Dhrystone仅涵盖有限的整数运算和字符串处理,这对于现代CPU测试显然是不完整的,甚至可以说非常不足. 从技术角度来看,应该早日消除它; (2)Dhrystone的大小太小,程序仅约10KB,数据约10KB. 已经安装了当前处理器的L1缓存配置,这已经绰绰有余,完全没有测试过CPU的内存系统,也没有接触过L2.
所谓的欺骗性优化是因为Dhrystone本身是一块开源代码,没有任何独立的第三方设置以及认证测试方法和结果,并且所有人都在谈论它. 这样,在将源代码编译成可执行代码的过程中,有无数的技巧可以美化Dhrystone测试结果. 无论使用库函数代码有多花招,仅在编译器上,现代RISC编译器就可能具有数十或数百个优化组合. 相同的代码以不同的优化趋势进行编译,并且某个索引可能很差. 增长50%. 例如,对于具有不同优化的同一CPU内核,其DMIPS / MHz可能会降低50%. 在正常情况下,使用Dhrystone的一个不成文的约定是可以使用一些优化选项,但不能使用太多(细节未显示). 因此,同一家公司自己产品系列的测试结果的相对性应该具有比较价值,而不同公司产品之间的比较却很奇怪,因为许多比较的前提可能不一致. 因此,真正的科学比较应该采用实际的硬件平台,并对直接PK使用相同的测试向量. 但这很难做到. 另外,最后一点是功耗指标本身不是很合适. 使用能源或效率更为科学;但是出于同样的原因,由于功耗数据更易于获取,更直观,更受欢迎,因此更加受欢迎.
功耗和能量(功率与能量)的观点很容易理解. 具有低功耗指标的处理器,如果效率不高且完成计算所需的时间太长,那么从能源角度来看,它并不是真正的“低功耗”. 与性能测试中的欺骗性优化类似,单侧功耗测试中还有欺骗性优化的空间. 上一张图片显示了欺骗性低功耗优化的更极端示例. 我希望您不要反感: A是它比B更高效,更节能,但是,如果仅查看功耗指标,不幸的是B看上去比A更好. ”,这似乎帮助英特尔说出了许多好话,但确实不能帮助他们在移动市场上的表现. 在特定的应用中,能源效率很重要,但总功耗是另一条红线. 英特尔,快去吧,来吧.
本文来自电脑杂谈,转载请注明本文网址:
http://www.pc-fly.com/a/shoujiruanjian/article-294801-1.html
他的意思他是有钱人