英伟达 Tegra K1处理器深度解析

在今年的CES展上,Nvidia为我们带来了Tegra系列移动芯片当中的最新成员——Tegra K1。这款芯片将会把Nvidia苦苦挣扎的移动处理器业务和更为成功的桌面显卡部门联合在一起。根据Nvidia的说法,Tegra K1将会为移动设备带来“下一代家用机的游戏图形性能”,但功耗仅有2W。Nvidia是如何办到这一切的呢?科技网站Android Authority日前就撰文对Tegra K1进行了深度介绍。文章内容如下:

Tegra K1
大量的CUDA核心Tegra K1总共拥有192个显卡处理核心(Tegra 4为72个),这无疑是这款芯片的一大亮点。显卡的“血统”要比核心数量更为重要,而在这一点上,Tegra K1也没有让我们失望。不同于Tegra 4,Nvidia直接把Kepler架构用在了Tegra K1身上,让后者和GTX 680,Titan和780Ti这些桌面显卡站在了同一水平线上。

虽然Nvidia并没有对Tegra K1的Kepler架构进行多少改动,但把它和上面这些顶级桌面显卡放在一起比较的确有点不公平。Tegra K1只有单独一个Nvidia SMX单元,其中包含了192个CUDA核心,8个纹理单元,4个光栅处理单元,这和Nvidia的顶级显卡系列相比明显少了很多。就拿GTX 680为例,这款显卡拥有1536个CUDA核心,128个纹理单元,32个光栅处理单元。

Tegra K1 Graphics Core

Nvidia并未提及Tegra K1核心的时钟频率或者是带宽,但在CES的展示当中,他们的确给出了Tegra K1的着色器性能峰值:365 GFLOPS。目前还很难去测算这款芯片的实际性能,但我们还是可以进行一些比较。比如说,定位低端的OEM版本GT630拥有192个CUDA核心,其着色器性能峰值为336 GFLOPS。

比较应该已经足够了,那么Nvidia是如何把这一切放进一枚功耗仅有2W的芯片当中的呢?

从彼此独立的芯片转向单独一枚SoC会带来节能性上的明显提升,而大幅缩减核心和光栅处理单元的数量也得以让Tegra K1的功耗能够低于Nvidia的Kepler记本芯片系列(已经在20W以下了)。更大的128KB L2缓存也降低了消耗在片外存储器访问上的能源。

对于效率管理能耗的低级别优化也应该被给予特别的关注。门控电源和门控时钟会快速识别出闲置的GPU核心,并降低时钟频率或者是彻底封闭这些区块,以此达到降低功耗的目的。对于ASTC纹理压缩的支持也会帮助降低UI和3D渲染的工作量。

无论是从图形性能还是节能性上面,Tegra K1都是巨大的进步。但并非所有的提升都来自于硬件部分。

下一代API

要说在移动设备上提供下一代游戏体验这方面,Tegra K1最显著的新功能就是全面的图形API支持了。也许你还记得,Tegra 4并不支持OpenGL、CUDA和DirectX 11这些常见的API,只是对部分游戏进行了优化,这还要取决于开发者。Tegra K1在这方面得到了改善,带来了对于OpenGL 4.4,微软DirectX 11.2,OpenGL ES 3.0和Nvidia自家CUDA 6的全面支持。

新的API自然也带来了图形性能上的新提升,比如对于FXAA和TXAA抗锯齿和Nvidia PhysX物理加速引擎的支持,还有Compute Shaders所带来的一整套高级特效(比如环境光遮蔽)。Tegra K1同时也是市面上首款支持硬件曲面细分的移动显卡,不过高通正在开发的Adreno 420同样也会具备该功能。

 

这所带来的好消息就是,PC和家用机游戏的开发者现在可以把自己的作品进行压缩,然后放到移动设备上让Tegra K1运行。考虑到这款芯片的性能据称是要强过PlayStation 3和Xbox 360,所以跨平台移植也不是没有可能。Nvidia在展会现场已经展示了Unreal Engine 4、《英雄萨姆3》和《三位一体2》的移植版,Tegra K1运行起来毫无问题。

两种CPU设计

Tegra K1共有两种CPU版本,针脚设计完全兼容,这也就意味着厂商可以轻松在两者之间进行互换。第一种是我们所熟悉的四核+Cortex A15排布,架构和Tegra 4几乎完全相同。而第二种加入了Nvidia自己的双核ARM CPU。

和Tegra 4一样,Tegra K1的CPU共有4个满速A15核心,用于处理繁重任务,额外的一个低性能A15“附属核心”就负责一些简单任务。每一个核心还可以被封闭以降低能耗,只有在需要时,额外的核心才会开启。但K1和Tegra 4之间有一个细微的差别,那就是前者的CPU是基于新的第三版ARM Cortex A15核心设计。

Tegra K1 CPU Versions

第三版Cortex A15主要对门控时钟进行了封闭,从而达到了提升节能性的目的。转换到28nm HPM制程工艺也进一步降低了能耗,Nvidia也将时钟速度提升了20%,从1.9GHz提高到了2.3GHz。

Tegra K1的A15处理器也要比Tegra 4的稍快一些,但提升程度并没有Kepler显卡那样大。但是,这种久经考验的四核设计意味着Nvidia可以很快开始Tegra K1的生产,OEM厂商预计会在本季度收到供货。

Tegra K1 vs Tegra 4

而代号为“Denver”的第二种CPU设计就完全不同了。Nvidia彻底放弃了附属核心这种设计,而选择了更加传统的双核配置。这两个核心基于新的ARMv8架构,同时支持64位和32位。Denver的最高时钟频率锁定在2.5GHz,同时具备更大的128KB L1指令缓存和64KB L1数据缓存。不过遗憾的是,目前有关Denver的信息还非常有限,不过Nvidia放弃流行的四核设计而选择双核的举动值得玩味。

丰富的多媒体功能

Nvidia同时赋予了Tegra K1许多额外的功能。这款芯片的图像信号处理器(简称ISP,负责多种图像任务)得到了升级,数量也增加到了两个。

每一个ISP都具备14位输入下6亿像素/秒的处理能力(Tegra 4为10位下4亿像素/秒),降噪能力得到了提升,同时还能支持1亿像素图像感光元件。双ISP的加入也让双摄像头操作成为可能,我们也已经在其他设备上看过了类似功能。和Tegra 4一样,K1同样支持通过HDMI输出4K视频内容,但它的GPU能否处理4K 3D游戏让人怀疑。

结语

Tegra K1终于体现出了Nvidia的真正实力,但从这一点上看,它就是一款让人非常兴奋的产品。K1也很有可能被加入到下一代Nvidia Shield当中。

对于Nvidia来说,摆在面前的最大障碍依然是找到足够大的消费者基础。在移动设备上获得家用机的游戏质量还不是普罗大众所追求的。再过几年后,像Steam OS这样的项目可能会推动游戏在Linux平台的发展,到那时,Android平台的一款强大游戏芯片可能会更加诱人。

从技术角度看,Tegra K1很强大,但在休闲游戏所主导的移动市场,它可能并没有看上去那么开创性。我们还需等待开发者们能够利用Kepler给我们带来些什么,以及Denver有没有什么新内容。

英伟达 Tegra K1处理器深度解析:等您坐沙发呢!

发表评论

您必须 [ 登录 ] 才能发表留言!