日前,飞腾已经完成FT-2000plus服务器CPU的研制工作,飞腾公司的合作伙伴正在积极研发相应的整机产品。FT-2000plus这款芯片是以FT2000为基础的改进版本,虽然在单核性能上和Intel还存在一定差距,但在多核性能上,已经达到Intel服务器CPU E5 主流产品的水平。

据传,国防科大正在研发的1000P超算天河3号(性能指标是神威太湖之光的8倍),其原型机的CPU或将采用FT-2000或其后继产品作为主控CPU。考虑到在天河2A上,国防科大已经用自主研发的加速器矩阵2000取代Intel的Xeon Phi计算卡。从今往后,天河系列超算也将和神威系列超算一样,彻底告别国外CPU或加速器,实现芯片的全国产化。

(网传天河3号原型机计算节点,板上有2片FT-2000,业内专家告诉笔者,这是误传)

FT-2000系列芯片是厚积薄发的结果

近年来,国内某些企业热衷于“走捷径”,先后与Intel、IBM、ARM、高通等国外芯片巨头技术合作或合资,有的公司把国外的CPU IP授权买回来做集成,就宣传是自主知识产权,甚至还有公司将国外的芯片包装一下变成国产芯片。

虽然这种走捷径的做法可以在短时间内拿出性能不错的芯片,但由于国外公司始终怀有“教会徒弟、饿死师傅”心理,不会将最先进的技术授权给中国,而且国内单位在拿到国外技术授权后,容易陷入知其然,不知其所以然的困境,不具备技术发展的可持续性,在国外公司开发出下一代产品之后,只能再次引进国外技术。

相比之下,飞腾选择了较为困难的自主研发道路,虽然发展会慢一些,但更具后劲。早在十多年前,飞腾就基于IA-64指令集设计CPU,之后又以Sparc开源代码为基础设计了FT-1000和FT-1500两款CPU,FT-1000被用于天河1号超算,FT-1500被用于天河2号超算。在2012年前后,飞腾选择了ARM阵营,获得了ARM指令集授权,可以基于ARM 64指令集设计自己的CPU。并在数年时间里先后开发出了FTC660、FTC661两款CPU核,以及FT-1500A/4、FT-1500A/16、FT-2000、FT-2000plus等CPU。

FT-1500A/4被用于PC和笔记本,采用28nm制造工艺。集成了4个FTC660CPU核,主频1.5GHz—2.0GHz,集成了2MB二级cache和8MB三级cache,集成了2个DDR3-1600存储控制器,可提供25.6GB/s访存带宽,最大功耗为15W。

FT-1500A/16被用于服务器,采用28nm制造工艺。集成了16个FTC660CPU核,主频1.5GHz,集成了8MB二级cache和8MB三级cache,集成了4个DDR3-1600存储控制器,可提供51.2GB/s访存带宽,最大功耗为35W。

FT-2000采用28nm制造工艺,可被用于超算计算节点和高性能服务器。集成了64个FTC661处理器核。工作主频1.5GHz—2.0GHz。集成了32MB二级cache,扩展支持128MB三级cache。支持16个DDR3-1600存储控制器,可提供204.8GB/s访存带宽。

最新的FT-2000Plus采用了台积电16nm制造工艺,主频为2.0GHz—2.4GHz,集成了64个FTC661处理器核。为了提高集成度,抛弃了L3cache,将DDR4内存控制器集成到了片内。目前,飞腾系列CPU已经形成了一个家族,可满足党政军多个领域的实际需求。

足以和Intel主流服务器抗衡CPU在国内ARM服务器CPU中处于领跑位置

根据实际测试FT-2000在2GHz主频下,采用GCC4.8编译器,SPEC2006的测试成绩分别为SPECint_rate2006:570、 SPECfp_rate2006:482,与Intel Xeon E5-2695v3相当。

而最新的FT-2000Plus因为删除了L3导致在SPEC测试中某些子项分数下降,把集成DDR4等改进带来的提升抹平了,使FT-2000Plus在同主频下与FT-2000的性能相差不大。那飞腾公司为何要这么做呢?原因应该是为了商业化,提高FT-2000plus的集成度可以方便主机厂,降低开发FT-2000plus整机产品的成本。不过,在使用了更好的台积电16nm制造工艺之后主频可以最高稳定到2.4G,使FT-2000plus相对于FT-2000还是有不小的性能提升,能够满足高端服务器和超算主控CPU的性能要求。

近年来,不少厂家都开始着手开发ARM服务器CPU。在国内,华为和华芯通也在着手开发ARM服务器CPU。不过,就目前而言,飞腾的ARM服务器CPU在性能上处于绝对领先地位。

华芯通是中国大陆与高通成立的合资公司,从高通手中获得了源码并基于该源码设计自己的CPU。不过,由于华芯通北京研发中心启用时日尚短,正式商用产品问世尚需时日。

相比之下,华为研发ARM服务器CPU的时间要早得多,而且在北京和美国都有研发中心,已经有产品Hi1612问世。虽然在宣传上,华为声称Hi1612是“自主研发”,“除存储单元外均具有完整知识产品”,但其实上,这款服务器CPU采用台积电16nm制造工艺,其内核是ARM Cortex A57。

标签: none

评论已关闭