转载丨神威E级超算正式运营 申威助力网安存储国产替代
发布时间:2018-08-06

不久前,2018自主可控计算机大会在北京召开。在本次大会上,一大批参会专家针对我国自主可控计算机及基础软硬件产品研发、行业应用、产业链整合等提出建议和对策。来自申威的胡向东老师也对申威自主可控实践做了介绍。

image.png

8月5日,神威E级超算原型机正式投入运营。

经过十多年的实践,申威已经开发出了三代十余款处理器,并建立了一支比较成熟、专业完备的CPU研发团队,掌握了完整的CPU研发能力。制约申威产业化的最大短板,并非CPU性能不行,而是缺乏软件生态,很少有客户愿意把申威芯片用起来。而要解决这个短板,则需要无数仁人志士去主动使用申威芯片,并帮助申威完善软件生态。

申威十五年自主可控之路

image.png

申威起步于21世纪初,从2003年至2006年,江南所致力于组建设计团队、验证团队、软件研发团队、系统研发团队,并形成了一整套CPU软硬件设计环境、设计验证方法学、物理设计方法学、设计流程与规范。经过多次流片,在不断"试错"中积累、提高,终于完成了申威第一代CPU核与申威1芯片的研发,完成了从"0"到"1"的艰难跨越,为后续的发展奠定坚实的基础。

从2008年至2011年,申威形成自主指令系统,增加SIMD扩展指令集,实现256位SIMD加速计算。开发出了第二代CPU核与申威1600等芯片的研发,申威1600成功应用于神威蓝光超算。

image.png

至2017年末,申威又研发了申威410、申位1610、申威411、申威26010、申威421、申威1621、申威221和申威111等一系列芯片,并被应用于超算、服务器、PC,以及一些特殊装备。

可以看出,十五年如一日的长期坚持和技术迭代演进才是自主技术的正常发展规律。一些CPU未经迭代演进,短时间就做出来,而且性能不错、可靠性好、兼容性好,并宣称自主研发、每一行代码都自己写,恐怕是违背技术发展规律的。

特别要指出的是,申威根据超级计算机发展趋势,选择在CPU架构上做突破,将高性能计算机多层次并行结构引入到CPU芯片内部,芯片内实现多层次并行:数据并行——指令并行——核心并行——核组并行。

通过SoC架构+自主设计,解决260个核心构成SoC芯片带来的各种挑战。申威26010单芯片集成数十亿晶体管、接近工艺极限的Die面积,自主设计实现同类芯片的最高工作频率,性能超过3TFlops,并实现批量生产与应用,使得"神威·太湖之光"连续四次在TOP500中排名第一。

7月,美国新超算"顶点"以实测峰值120+P的成绩超越了实测成绩90+P的申威。但新一代神威E级超算原型机在7越底正式组装调试,根据国家超级计算济南中心副主任介绍,预计在26日左右,(原型机)整个的安装全部调试完毕,正式进入试运行状态......(原型机)单个CPU的计算能力,是现有神威蓝光超级计算机的三到四倍。

据业内人士披露,这位副主任说的单个CPU的计算能力,其实指的是一个计算节点,而一个节点有数个处理器组成。也就是说,神威E级超算一个节点的算力有望达到9T至12T。

7月底,神威E级超算原型机开始组装调试。8月5日,神威E级超算原型机正式运营。

image.png

目前,申威已经完成了三代十余款芯片的研发,建立了一支比较成熟、专业完备的CPU研发团队,掌握了完整的CPU研发能力,形成了完善的CPU研发体系,在超算领域基本实现了自主可控目标,并取得了显著的成就。

制约申威产业化最大的问题,就是缺少软件生态和商业化应用。其实生态和应用是一回事,只要用申威的应用领域多了,客户多了,用的量大了,软件生态也就自然而然做起来了。在当下,应当选择一些对软件生态要求不高的行业应用作为突破口,不断扩展应用领域,以农村包围城市的方式完成产业生态的搭建。

下面,铁流介绍几家主动给申威做产业化的"勇士"。

网安设备和存储主控可能是申威现阶段产业化的主要突破口

2016年,捷世智通在上海高性能集成电路设计中心和地方政府的支持下设立成都申威科技公司,作为申威处理器的市场化平台,目前成都申威有50多人,其中三位为市场人员,其他为研发人员。

成都申威是一家从事申威处理器产业化推广的企业,业务主要为申威处理器为核心的一系列解决方案,包括申威处理器、小型超级计算机、服务器、PC、工控机,以及嵌入式板卡研发、生产、销售和服务。

image.png

目前,成都申威共拥有SW411、SW421/421M/221、SW1621等5款型号的申威处理器,并拥有SW421/421M/221产品的部分知识产权。这里介绍下几款CPU:

SW411、SW421、SW421M都是用于桌面的CPU,三款CPU其实可以算是同一代内核,SW411采用40nm,SW421更换了更好的28nm工艺,SW421M则是SW421的增强版。

SW1621也属于第三代申威CPU核,是一款16核服务器CPU,制造工艺为28nm,SPEC2006测试性能优于16核ARM Coretx A57。

SW211还是第三代申威CPU核,主要面向高密度计算型嵌入式应用需求。

根据媒体采访,成都申威的目标是"三年持平,五年实现盈利。"

image.png

(申威CPU+deepin 日常使用无压力,另外SW3232非常惊艳)

由于服务器、PC对软件生态的要求相对高一些,因而成都申威这类直接卖芯片、板卡、服务器、PC的企业在产业会道路上艰辛一些。而很多对生态和性能要求不高的行业,反而比较适合申威去突破。

在斯诺登事件和中兴事件之后,信息安全和产业安全问题已经不再是"迫害妄想症",而是一个非常现实的问题。在这种大背景下,如果防火墙等网络设备中使用国外芯片,就好比是花钱雇佣洋人保卫祖国边疆,这种做法是极其危险的。

目前,国内防火墙大多在软件上基本实现了国产化,但在硬件采用自主CPU的厂商却非常少,即便是华为这样具备很强技术实力的企业,在自己的防火墙上依然采用美国英特尔公司的CPU。只有少数几家公司基于申威和龙芯开发真正自主可控的防火墙。其中,中科网威则是自主可控防火墙的佼佼者。

image.png

中科网威开发出了基于国产申威处理器的万兆防火墙。中科网威自主可控万兆防火墙的CPU是申威1621,操作系统和应用系统全部是自己写,实现了软件和硬件全部自主研发。在实际测试中,其万兆防火墙小包吞吐达63%,基本达到同档次X86防火墙的水平,高于万兆防火墙国标。整机吞吐性能已经达到20-30G,而采用英特尔CPU的防火墙整机吞吐性能一般在20-40G,中科网威自主可控万兆防火墙可以替换同样整机吞吐量且采用英特尔CPU的防火墙。

类似的,存储也是信息安全的重中之重。

目前,固态硬盘取代机械硬盘已经是大势所趋,想必正是看到了这个趋势,西部数据不惜巨资收购闪迪,进而获得了NAND FLASH和固态硬盘的入场券。而在硬盘中,都存在一个非常关键的器件,那就是主控芯片,主控芯片一旦出现问题,硬盘中存储的信息就毫无安全性可言。在2017年,慧荣就被爆出,主控存在安全隐患。网友还爆料银监会曾经要求金融机构核查是否使用了慧荣科技主控芯片。

虽然在商业市场上已经出现了国产主控芯片,但这些固态硬盘主控芯片大多是基于国外CPU核二次开发的,比如华为和慧荣(中国台湾)等一批商业公司就基于ARM等国外公司的IP开发SSD主控。

更可怕的是,国内一些在洋人地基上造房子的主控芯片,媒体纷纷冠以"自主主控"之名,非常具有欺骗性。更吓人的是,像金融等行业就使用着这些固态硬盘,其中风险不言而喻。

image.png

最近,上海有一家固态存储公司,威固信息,据说这家公司核心技术团队来自国防科大、江南所等高校和科研院所,这些技术人员既做过飞腾,又做过申威,他们正准备做固态硬盘主控芯片,把ARM换成自主CPU核。

铁流猜测,该团队极有可能选择龙芯或申威的内核。毕竟龙芯是可以对外商业授权IP核的,海信和海尔等公司就购买了数百万套。龙芯不仅对外商业授权,还把GS232向高校开源,让高校学子更好的学习如何设计CPU。另外,申威也是可以对外授权IP,考虑到该团队成员的背景,采用申威的可能比用龙芯还要大一些。

根据威固官网信息,威固公司在研的下一代控制器代号为"宋",新一代控制器集成了国内自主研发的CPU核心和加解密算法,并具备存储数据盘上在线处理能力。"宋"控制器预计于2019年完成流片。

铁流由衷的希望,能在3年左右看见基于龙芯/申威开发的主控芯片+长江存储NAND FLASH的组合,制造出全国产的固态硬盘。


文末,附上神威E级超算原型机介绍

1.webp (1).jpg



400-0019-855