ARM Cortex-A15的性能
预计 Cortex-A15 MPCore 处理器的移动配置所能提供的性能是当前的高端智能手机性能的五倍还多,是基于 ARM 处理器的基础结构平台的总性能的 10 倍还多,同时还具有 ARM 标志性的低功耗特性。预计的特定于应用的实现方案示例在下面列出: 智能手机和移动计算使用范围:1 GHz - 15 GHz 单核和双核配置
设备特性:灵活的性能: 即时 Web 浏览、高带宽操作
提高媒体和浮点浮点性能
最佳功耗: 扩大了低功率范围并延长了电池使用寿命
更丰富的体验: 控制台品质的游戏、导航、增强现实应用 数字家庭娱乐使用范围:1 GHz - 2 GHz 双核或四核配置
设备特性: 高端性能: 通用和媒体性能
密集流
媒体、图形和计算工作负载。
最佳功耗、散热: 无风扇操作、energyStar
更大的物理内存: 附加内存大于 4GB 家用服务器和 Web 20 服务器使用范围:15GHz-25 GHz 四核配置
设备特性:高性能: 高端高能效单线程和 MP
高扩展性: SoC 一致性,确保高性能和高能效。
虚拟化支持: 支持高效虚拟机和访问 4GB 以上的物理内存 无线基础结构使用范围:15GHz-25 GHz 四核、八核或更高配置
设备特性:性能: 高端整数、浮点数性能
可伸缩性: “大集成”> 4 个核。TCO 更低。
大内存设备: 支持最高 1TB、硬件虚拟化支持
可靠性: 错误纠正、软故障恢复、监视设备完整性 Cortex-A15 MPCore 体系结构 ARMv7-A Cortex 多核 单处理器群集中的 1-4X SMP
通过 AMBA® 4 技术实现多个一致的 SMP 处理器群集 ISA 支持 ARM
Thumb-2
TrustZone® 安全技术
NEON™ 高级 SIMD
DSP & SIMD 扩展
VFPv4 浮点
Jazelle® RCT
硬件虚拟化支持
大物理地址扩展 (LPAE) 内存管理 ARMv7 内存管理单元 调试和跟踪 CoreSight™ DK-A15 Cortex-A15 MPCore 主要功能 Thumb-2 技术 可为传统 ARM 代码提供最高性能,对于存储指令占用的内存,最多可节省 30% 的空间。 TrustZone 技术 确保安全应用的可靠实现,适合从数字版权管理到电子支付等应用。获得技术和行业合作伙伴的广泛支持 NEON NEON 技术可加速多媒体和信号处理算法(如视频编码/解码、2D/3D 图形、游戏、音频和语音处理、图像处理技术、电话和声音合成) DSP & SIMD 扩展 增加高性能应用中 ARM 解决方案的 DSP 处理能力,同时通过便携式、电池电源设备提供所需的低功耗。DSP 扩展经过优化,适用于范围广泛的软件应用,包括伺服马达控制、VoIP 和视频音频编解码器。 浮点 对半精度、单精度和双精度浮点算法中的浮点操作提供硬件支持。Cortex-A15 处理器的浮点功能增强了下一代消费类产品(如 Internet 设备、机顶盒和家用网关)中使用的浮点算法的性能。 Jazelle RCT 最多可使即时生产 (JIT) 和提前编译的字节码语言的代码大小缩小 3 倍,以便提高传统虚拟机的速度 硬件虚拟化 Cortex-A15 MPCore 处理器是首个融合了针对数据管理和仲裁的高效硬件支持的 ARM 处理器,通过此方式,多个软件环境及其应用程序将能够同时访问系统功能。这样,就实现了可靠、具有相互隔离的虚拟环境的设备。 大物理地址扩展 (LPAE) 大物理地址扩展 (LPAE) 的引入允许处理器可访问最大 1TB 内存。 优化的 1 级高速缓存 性能和功率优化的 L1 高速缓存结合了最低访问延迟技术,可以在最大程度上提高性能和降低功耗。高速缓存中的 32KB 用于指令,32KB 用于数据。还为实现高速缓存一致性提供了增强处理器间通信的选项或支持富 SMP 功能操作系统的选项,以便简化多核软件开发 集成、可配置大小的 2 级高速缓存控制器 在高频率设计或需要降低与芯片外内存访问关联的功耗的设计中,最多可对 4 MB 高速缓存内存提供低延迟、高带宽访问 可靠性和软故障恢复 Cortex-A15 处理器内的所有 RAM(包括 L1 和 L2 高速缓存)都受奇偶校验和 ECC 错误纠正功能的保护。此机制可纠正单位错误、检测双位错误和日志错误。ECC 支持不会影响常见情况(无错误) AMBA® 4 高速缓存一致性互连 (CCI) CCI 提供符合 AMBA 4 AXI™ 一致性扩展 (ACE) 的端口,以在多个 Cortex-A15 MPCore 处理器之间实现完全一致,可以更好地利用高速缓存并简化软件开发。此功能对于高带宽应用是必需的,包括需要一致的单核和多核处理器的群集的游戏、服务器和网络。CCI 与 ARM CoreLink™ 网络互连和内存控制器 IP 相结合,提高了系统性能和能效。 Cortex-A15 NEON 媒体处理引擎 (MPE) Cortex-A15 MPE 提供了一个引擎,该引擎可同时提供 Cortex-A15 浮点单元的性能和功能以及 NEON 高级 SIMD 指令集实现,以便进一步提高媒体和信号处理功能的速度。MPE 扩展了 Cortex-A15 处理器的浮点单元 (FPU) 以提供一个 quad-MAC 以及附加的 64 位和 128 位寄存器集,在每个周期 8 位、16 位和 32 位整型以及 32 位浮点数据量的基础上支持一组丰富的 SIMD 操作。 Cortex-A15 浮点单元 (FPU) FPU 提供了与 ARM VFPv4 体系结构兼容的高性能的单双精度浮点指令,该体系结构是与上一代 ARM 浮点协处理器兼容的软件。高级多核功能 该处理器还利用得到广泛认可的 ARM MPCore 多核技术,支持性能可伸缩性并可控制功耗,超过现今类似的高性能设备的性能,同时能够在严格限制移动电源的情况下维持运行。多核处理功能为任何四个组成处理器提供了在不使用时关闭的功能,例如,当设备处于待机模式时关闭以节省功耗。当需要更高性能时,将利用所有处理器以满足需求,同时仍分享工作负载以保持尽可能低的功耗。侦测控制单元 SCU 负责管理互连、仲裁、通信、高速缓存之间的传输和系统内存传输、高速缓存一致性以及处理器的其他功能。Cortex-A15 MPCore 处理器还向其他系统加速器和非缓存 DMA 驱动的外设公开这些功能,以便提高性能并降低系统范围内的功耗。这一系统一致性还可降低在各个操作系统驱动程序中维持软件一致性所涉及的软件复杂性。 加速器一致性端口 SCU 上的此 AMBA 4 AXI™ 兼容的辅助接口为主机提供了一个互连点,这些互接点更易于直接连接 Cortex-A15 处理器。该接口支持所有标准读写事务,而没有其他一致性要求。但是,针对一致的内存区域的任何读事务都会与 SCU 交互,以测试信息是否已存储在 L1 高速缓存中。SCU 将在写入数据转发到内存系统之前强制其保持一致性,并可能将该事务分配到 L2 高速缓存,从而消除了直接写入对片外内存产生的功耗和性能影响 通用中断控制器 实现标准化、基于架构的中断控制器后,GIC 可提供内容丰富、使用灵活的方式来中断处理器间通信以及路由系统中断和确定其优先次序。在软件控制下,最多支持 224 次独立中断,每次中断均可在 CPU 之间分布,经过硬件确定优先级,然后在操作系统和 TrustZone 软件管理层之间路由。借助虚拟机监控程序,此路由灵活性以及支持虚拟化操作系统中断这一特性赋予了增强解决方案功能所需的其中一个主要功能。 Cortex-A15 MPCore 处理器融合了各种各样的 ARM 技术并由这些技术提供支持,包括系统 IP、物理 IP 和开发工具。此技术由来自 ARM Connected Conmmunity ™ 的各种不同 SoC 和软件设计解决方案、工具和服务提供补充,为 ARM 合作伙伴提供了一个涵盖全功能开发、验证和生产的通道,增加了设备的吸引力同时显著缩短了上市时间。
你也说了,简单的单片机,而ARM内核本身就比简单的单片机还复杂,所以,以ARM为核构建的单片机首先需要汇编初始化内核,然后才进入单片机轨道,类似51的,其内核不复杂,所以无需启动初始化内核
要选好一款处理器,要考虑的因素很多,不单单是纯粹的硬件接口,还需要考虑相关的操作系统、配套的开发工具、仿真器,以及工程师微处理器的经验和软件支持情况等。微处理器选型是否得当,将决定项目成败。当然,并不是说选好微处理器,就意味着成功,因为项目的成败取决于许多因素;但可以肯定的一点是,微处理器选型不当,将会给项目带来无限的烦恼,甚至导致项目的流产。
1 嵌入式微处理器选型的考虑因素
在产品开发中,作为核心芯片的微处理器,其自身的功能、性能、可靠性被寄予厚望,因为它的资源越丰富、自带功能越强大,产品开发周期就越短,项目成功率就越高。但是,任何一款微处理器都不可能尽善尽美,满足每个用户的需要,所以这就涉及选型的问题。
(1)应用领域
一个产品的功能、性能一旦定制下来,其所在的应用领域也随之确定。应用领域的确定将缩小选型的范围,例如:工业控制领域产品的工作条件通常比较苛刻,因此对芯片的工作温度通常是宽温的,这样就得选择工业级的芯片,民用级的就被排除在外。目前,比较常见的应用领域分类有航天航空、通信、计算机、工业控制、医疗系统、消费电子、汽车电子等。
(2)自带资源
经常会看到或听到这样的问题:主频是多少有无内置的以太网MAC有多少个I/O口自带哪些接口支持在线仿真吗是否支持OS,能支持哪些OS是否有外部存储接口……以上都涉及芯片资源的问题,微处理器自带什么样的资源是选型的一个重要考虑因素。芯片自带资源越接近产品的需求,产品开发相对就越简单。
(3)可扩展资源
硬件平台要支持OS、RAM和ROM,对资源的要求就比较高。芯片一般都有内置RAM和ROM,但其容量一般都很小,内置512 KB就算很大了,但是运行OS一般都是兆级以上。这就要求芯片可扩展存储器。
(4)功 耗
单看“功耗”是一个较为抽象的名词。这里举几个形象的例子:
①夏天使用空调时,家里的电费会猛增。这是因为空调是高功耗的家用电器,这时人们会想,“要是空调能像日光灯那样省电就好了”。
②随身的MP3、MP4都使用电池。正当听音乐看视频时,系统因为没电自动关机,谁都会抱怨“又没电了!”
③目前手机一般使用锂电池,手机的待机和通话时间成了人们选择手机的重要指标。待机及通话时间越长,电池的使用寿命就可以提高,手机的寿命也相对提高了。
以上体现了人们对低功耗的渴求。低功耗的产品即节能又节财,甚至可以减少环境污染,它有如此多的优点,因此低功耗也成了芯片选型时的一个重要指标。
(5)封 装
常见的微处理器芯片封装主要有QFP、BGA两大类型。BGA类型的封装焊接比较麻烦,一般的小公司都不会焊,但BGA封装的芯片体积会小很多。如果产品对芯片体积要求不严格,选型时最好选择QFP封装。
(6)芯片的可延续性及技术的可继承性
目前,产品更新换代的速度很快,所以在选型时要考虑芯片的可升级性。如果是同一厂家同一内核系列的芯片,其技术可继承性就较好。应该考虑知名半导体公司,然后查询其相关产品,再作出判断。
(7)价格及供货保证
芯片的价格和供货也是必须考虑的因素。许多芯片目前处于试用阶段(Sampling),其价格和供货就会处于不稳定状态,所以选型时尽量选择有量产的芯片。
(8)仿真器
仿真器是硬件和底层软件调试时要用到的工具,开发初期如果没有它基本上会寸步难行。选择配套适合的仿真器,将会给开发带来许多便利。对于已经有仿真器的人们,在选型过程中要考虑它是否支持所选的芯片。
(9)OS及开发工具
作为产品开发,在选型芯片时必须考虑其对软件的支持情况,如支持什么样的OS等。对于已有OS的人们,在选型过程中要考虑所选的芯片是否支持该OS,也可以反过来说,即这种OS是否支持该芯片。
(10)技术支持
现在的趋势是买服务,也就是买技术支持。一个好的公司的技术支持能力相对比较有保证,所以选芯片时最好选择知名的半导体公司。
另外,芯片的成熟度取决于用户的使用规模及使用情况。选择市面上使用较广的芯片,将会有比较多的共享资源,给开发带来许多便利
2 ARM公司及相关产品介绍
ARM公司于1991年成立于英国剑桥,主要出售ARM IP的授权。目前,ARM处理器(即采用ARM IP核的处理器)已遍及工业控制、消费类电子产品、通信系统、网络系统、无线系统等各类产品市场。ARM处理器应用占据了32位RISC微处理器很大的市场,ARM技术已渗入生活的各个方面。
目前市面上常见的ARM处理器架构可分为ARM7、ARM9、ARM10、ARM11以及Cortex系列,每个系列又包括很多种IP内核的产品。ARM 也是嵌入式处理器中首先推出多核架构的厂商。生产ARM芯片的厂家很多,主流半导体厂商的产品比较齐全,供货也相对更有保障。Samsung、NXP、 Cirrus Logic、Atmel、Freescale、TI、ST、Winbond等主流半导体厂商的ARM芯片产品列表见本刊网站,其中有些产品已供货,有些正在样片阶段,有些正在开发,还有许多产品不支持外部存储器的扩展。
Cortex-A9处理器能与其他Cortex系列处理器以及广受欢迎的ARM MPCore技术兼容,因此能够很好延用包括操作系统/实时操作系统(OS/RTOS)、中间件及应用在内的丰富生态系统,从而减少采用全新处理器所需的成本。通过首次利用关键微体系架构方面的改进,Cortex-A9 处理器提供了具有高扩展性和高功耗效率的解决方案。利用动态长度、八级超标量结构、多事件管道及推断性乱序执行( Speculative out-of-order execution),它能在频率超过1GHz的设备中,在每个循环中执行多达四条指令,同时还能减少目前主流八级处理器的成本并提高效率。ARM MPCore技术 被广泛选用的对ARM MPCore技术提升了性能的可拓展性以及对功耗的控制,从而在性能上突破了目前类似的高性能设备,同时继续满足了苛刻的手机功耗要求。迄今为止,ARM MPCore技术已被包括日电电子、NVIDIA、瑞萨科技和萨诺夫公司(Sarnoff Corporation)在内的超过十家公司授权使用,并从2005年起实现芯片量产。 通过对MPCore技术作进一步优化和扩展,Cortex-A9 MPCore多核处理器的开发为许多全新应用市场提供了下一代的MPCore技术。此外,为简化和扩大对多核解决方案的使用,Cortex-A9 MPCore处理器还支持与加速器和DMA的系统级相关性,进一步提高性能,并降低系统级功耗�9�7刻的250mW移动功耗预算条件下为当今的手机提供显著的性能提升的可综合ARM处理器。在采用TSMC 65纳米普通工艺、性能达到2000 DMIPS时,核逻辑硅芯片将小于15平方毫米。从2000 DMIPS到8000 DMIPS的可扩展性能,比当今高端手机或机顶盒高出4-16倍,将使终端用户能够即时地浏览复杂的、加载多媒体内容的网页,并最大程度地利用Web 20应用程序,享受高度真实感的和游戏,快速打开复杂的附件或编辑媒体文件。 Cortex-A9多核处理器是首款结合了Cortex应用级架构以及用于可扩展性能的多处理能力的ARM处理器,提供了下列增强的多核技术: 加速器一致性端口(ACP),用于提高系统性能和降低系统能耗 先进总线接口单元(Advanced Bus Interface Unit),用于在高带宽设备中实现低延迟时间 多核TrustZone® 技术,结合中断虚拟,允许基于硬件的安全和加强的类虚拟(paravirtualization)解决方案 通用中断控制器(GIC),用于软件移植和优化的多核通信 在由业界领先的嵌入式微处理器基准协会(EEMBC)开发的多核基准框架的发展进程中,Cortex-A9 MPCore多核处理器在多种基准下都表现出近线形可扩展性,与添加的处理器单元一起提供高达四倍于类似单核处理器的性能。 完整的系统解决方案 两款ARM Cortex-A9处理器都包含ARM特定应用架构扩展集,包括DSP和SIMD扩展集和Jazelle® 技术、TrustZone和智能功耗管理(IEM�6�4)技术。此外,ARM已开发一整套支持新处理器的技术,以缩短设计时间并加快产品上市时间。这一完整的系统解决方案包括: �6�1 浮点单元(FPU):Cortex-A9 FPU提供高性能的单精度和双精度浮点指令。 �6�1 媒体处理:Cortex-A9 NEON媒体处理引擎(MPE)提供了Cortex-A9 FPU所具有的性能和功能,以及在Cortex-A8处理器中首次推出的用于加速媒体和信号处理功能的ARM NEON 先进 SIMD指令集。 �6�1 物理IP:提供在Cortex-A9处理器上实现低功耗、高性能应用所需的众多标准单元库和存储器。标准单元包括功耗管理工具包,可实现动态和漏泄功耗节省技术,例如时钟门控、多电压岛和功率门控。还提供具有先进的功耗节省功能的存储编译器。 �6�1 Fabric IP:Cortex-A9处理器得到广泛的PrimeCell® fabric IP元件的支持。这些元件包括:一个动态存储控制器、一个静态存储控制器、一个AMBA® 3 AXI可配置的内部互连及一个优化的L2 Cache 控制器,用于匹配Cortex-A9处理器在高频设计中的性能和吞吐能力。 �6�1 图形加速: ARM Mali�6�4 图形处理单元及Cortex-A9处理器的组合,将使得SoC合作活动能够创造高度整合的系统级解决方案,带来最佳的尺寸、性能和系统带宽优势。 �6�1 系统设计:ARM RealView® SoC Designer工具提供快速的架构优化和性能分析,并允许在硬件完成以前很长时间即可进行软件驱动程序和对时间要求很严格的代码的早期开发。RealView系统发生器(RealView System Generator)工具为基于Cortex-A9处理器的虚拟平台的采用提供超快建模能力。Realview工具中关于Cortex-A9处理器的基于周期的(cycle based)及程序员视角的模型将于2008年第二季度上市。 �6�1 调试: ARM CoreSight�6�4片上技术加速了复杂调试的时间,缩短了上市时间。程序追踪宏单元技术(Program Trace Macrocell technology)具有程序流追踪能力,能够将处理器的指令流完全可视化,同时配置与ARMv7架构兼容的调试接口,实现工具标准化和更高的调试性能。用于Cortex-A9处理器的CoreSight设计工具包扩展了其调试和追踪能力,以涵盖整个片上系统,包括多个ARM处理器、DSP以及智能外设。 �6�1 软件开发:ARM RealView开发套件(ARM RealView Development Suite)包括先进的代码生成工具,为Cortex-A9处理器提供卓越的性能和无以比拟的代码密度。这套工具还支持矢量编译,用于NEON媒体和信号处理扩展集,使得开发者无需使用独立的DSP,从而降低产品和项目成本。包括先进的交叉触发在内的Cortex-A9 MPCore多核处理器调试得到RealView ICE和Trace产品的支持,同时也得到一系列硬件开发板的支持,用于FPGA系统原型设计和软件开发。
0条评论