钱柜国际

首页 > 正文

中国高性能计算机发展与政策“曙光”之路的“三叉戟”

www.redtrojan.com2019-07-27
钱柜777手机版客户端

中国网络/中国发展门户网站新闻1964年,被称为“超级计算之父”的Seymour Cray开发的CDC 6600被引入美国利弗莫尔和洛斯阿拉莫斯国家实验室,开启了高性能计算技术与产业60年的不断发展与繁荣。超计算的宏观发展趋势是既有“顶级天堂”又有“现场”。 “天空”的意思是高性能和快速计算。对计算速度的需求永无止境,因此追求性能是第一推动力。 “网站”的含义是它具有广泛的应用和大量的单位。超级计算的本质仍然是高端计算设备。使用的设备越多,它就越能反映其价值,因此它进入各行各业。工业规模的形成是两轮驱动发展的又一轮。

高性能计算的60年演变可以很容易地分为两个阶段:Cray时代和多计算机时代(表1)。 1 Cray时代。从20世纪60年代初到90年代初,被称为“Cray时代”,由单一记忆向量机的技术创新引领,Cray在前30年定义并领导了高性能计算市场。前30年的发展是以“鼎天”为基础,只服务于国家战略部门。还有2个计算机时代。从20世纪90年代到现在的最后30年被称为“多计算机时代”。由于微处理器的出现以及大量工业标准硬件的激增,可以大规模扩展多个通用或商用计算组件的扩展。迄今为止,系统结构的技术创新主导着高性能计算的发展。经过30年的高性能计算机满足国家战略应用的高峰需求,“网站”已成为发展的主要目标,市场驱动和高性能计算应用的普及已成为第二个突出的特点相。

RVyNr5gI5VDmF5

美国Jack Dongrra教授于1993年推出全球超级计算机排名TOP500,成为高性能计算机开发的风向标。世界上最快的浮点机从1988年的2 Gflops增加到2018年11月的143 Pflops,增长了760亿次。高性能计算机被视为世界竞争的技术战略的制高点,它们是国家的重要工具。西方国家对中国施加了长期的技术封锁和市场垄断。历史上,巴统对中国进口电脑性能的限制以及玻璃房内电脑的进口都受到了外国员工的监督。事件。

目前,我国高性能计算机领域中未使用,不适用,不能使用的严重问题正在制约着国家的可持续发展。 1没有必要使用。正如李国杰院士曾经报道的那样,“虽然中国也开发?艘惶ɑ蛄教ǖ缒裕艿睦此担泄募扑慊铰浜罅耸嗄辍!痹诩扑阕试囱现夭蛔愕那榭鱿拢页浞址⒄沟母咝阅芗扑慊低呈坑邢蓿荒苈愎壹父鲋匾铰圆棵诺男枨蟆? 10年多来,其他用户可以获得的机器性能比国外差。 2不适用。可用系统主要是“专用”系统,例如大型机和大规模并行计算机(MPP)。这样做的目的并不是说它们只能运行应用程序,而是组件是专门设计的,例如CPU板,内存板,I/O板和操作系统,它们不能在其他系统中使用。结果,用户组很窄,并且它仅应用于科学计算的“象牙塔”。对各行业迫切需求的适应性很差,计算效率很差。 3不起。由于高性能计算机一直被视为国家的重量级人物,国内市场被小发猫等外国公司垄断,价格也很高。国内品牌的市场基本上为零。由于技术架构的原因,国内研究机构开发的高性能计算机系统数量有限,性价比高,无法广泛推广,无法形成产业。

作为中国高性能计算机发展的重要力量,中国科学院计算技术研究所,国防科技大学,江南计算机研究所等国内企业和机构一直坚持不懈自20世纪90年代以来,追求并超越美国和日本等西方国家。开发高性能计算机。中国科学院计算技术研究所在“863”计划306主题的支持下,建立了国家智能计算机研究开发中心(以下简称“智能中心”),重点发展性能计算机,需要“顶部”和“站点”。特别是,有必要克服应用的困难,单元的数量,以及高性能计算机工业的形成。专注于低成本效率架构和并行处理技术的开发,从共享存储对称多处理器架构(SMP),到大规模并行处理架构(MPP),最后开发集群架构,有效地实践“ 863“计划提出的”世界之巅“计划。为基础理论创新,关键技术突破,应用推广和产业化做出系统贡献。

“暮光之城”之路的“三叉戟”

当智能中心开始开发“曙光”高性能计算机(以下简称“曙光机”)时,它正赶上国际高性能计算发展的技术转折点。智能中心通过深入和反复的调查确立了两个基本点:1虽然计算机技术的发展日新月异,但已形成一系列国际工业标准。要开发一种能够满足市场需求并且能够“站立”的高性能计算机,它必须不符合行业标准。 2计算机行业的发展趋势是从纵向到横向。有必要为中国在增值链中选择最佳的创新增值链接,降低成本效益,缩短开发周期,以及机器启动时的市场竞争力。优先级因素。

在统一认识的基础上,智能中心明确提出要按照“863”计划中“高新技术,实现工业化”的宗旨,坚定不移地开发曙光机器。其内涵是:系统地开发集群结构的技术体系,使黎明机器的计算速度不断提高,适用的应用领域不断扩大,机器数量不断增加,即“三叉戟” “暮光之城”之路性能,应用和行业。 “黎明”团队的研究人员30年来一直坚持这一发展战略,并成功开发了几代高性能计算机:计算速度提高了1.2亿次,赶上了世界最高水平;应用领域涵盖46个行业。在石油勘探等重点行业打破国外厂商的垄断;国产品牌的高性能电脑从0的市场份额中实现领先。中国品牌连续八年排名TOP100排名第一,超越小发猫和惠普等国际巨头;中国在TOP500排名中的份额也超过了美国。作为一个大国,曙光机器部署在国家互联网应急中心和上海,深圳和中国科学院的三个国家超级计算中心。

通过突破低成本集群结构的关键技术,曙光机器开发了集群接入技术系统,并考虑了计算速度,应用广度和行业规模。

新的技术之路。

RVyNr63GGIZDBi

图1曙光机组规模的发展

该应用程序涵盖46个行业(图2)。与过去的国产系统一样,曙光机的开发过程也遇到了应用推广的困难:在国外购买的应用软件无法在曙光机器上运行。按照“做事,不做事”的原则,当国际机器组操作系统尚未形成行业标准时,公司率先实现了微内核单图像集群操作系统。机制,并在用户空间取得突破。该系统核心功能的关键技术使得在高性能国外机器上运行的工业应用易于迁移到国产机器,从而成功地为石油勘探行业移植了大量核心软件。同时,以网络和生物识别数据为代表的工业应用主要是数据密集型,数据量大,应用程序之间的计算特性差异大,计算速度快,功耗低。因此,扩展系统的规模非常低效并且将遇到功耗上限。通过突破基于计算 - 获取模式的负载加速技术,智能中心加快了许多行业进入行业的进程,使曙光机成为国家互联网应急中心等国家战略部门的核心设备。并将其部署到20个国内外许多城市云计算中心已成为中国公共计算基础设施的主要模式。

RVyNr6YHZMgKts

图2曙光集团应用产业展

中国TOP100排名第一(图3)。暮光机坚持不盲目地比较计算速度,总是想“站在天上”,“站在地上”。为了占领市场,曙光团队提出了SUMA [5]的系统设计理念,即可扩展性,可用性,可管理性和可用性;坚持关注集群系统。最具增值技术,如开发可扩展文件系统,零拷贝用户空间消息,单一IP登陆点和其他关键技术,不知道节点操作系统源代码的约束,实现数百个整个车队系统管理,资源管理,作业管理和文件管理,用于处理单元的单个图像。压光机可以按比例放大,以确保性能接近线性增长。同时,它确保当规模下降时,成本具有竞争力。车队的六个主要子系统是标准化的,支持规模工业化。除了公司首家以高性能计算机为主要业务的上市公司外,曙光还通过人员转移和技术辐射帮助联想,华为等公司支持中国高性能计算机产业的形成和发展。

RVyNr7CHdsuoUQ

图3 2018年中国TOP100排名中压光机的份额

超越中国高性能计算之路上的“三大山”

纵观中国高性能计算的发展,是中国研究人员艰苦奋斗和开拓进程。它突破了封锁(1956-1995),打破了垄断(1996-2015)和领先创新(2016年至今)。 “三大山”(表2)逐步缩小与国外研发的差距,最终在系统设计和关键技术方面取得了世界领先的成就。

RVyNr7Z51zKimu

打破封锁

件下,中国开发了一种特殊的高性能计算机,为“两弹一星”等国家重大战略需求提供支持。开发机器的主要应用是在国防和军事领域,以及传统科学计算领域。代表性系统包括管式计算机(如103台机器,104台机器,119台机器),晶体管计算机(如109 B机器,109 C机器),基于中小型集成电路的计算机(如DJS系列,757台机器) ,“Galaxy - I”)和基于超大规模集成电路的计算机(如“Galaxy-II”“曙光1号”“曙光1000”)。由于国内电子计算机技术的发展本身起步晚于国际水平,再加上西方国家的封锁和禁运,这些机器的发展只能采用“所有国产设备,依靠自身技术实力”的技术路线。其中大部分成本随着开发周期的长,开发成果不太可能商业化或工业化,但它们在打破国外封锁方面具有里程碑意义。 “暮光之城一号”诞生仅三天后,西方国家宣布取消对中国10亿台计算机的禁运。

打破垄断

件下探索开发高性能计算机的新途径的任务,以“同时成为天空之地”。 “。曙光集团高性能计算机市场的激烈竞争彻底改变了主要国际厂商制定的游戏规则,迫使大型外国公司采用“跳价”。在一段时间内,中国市场上小发猫服务器的平均折扣已经达到令人难以置信的94%,也就是说,售价100万美元的服务器的平均售价仅为60,000美元。正是由于技术和市场的力量才能与国际巨头竞争。对于许多行业来说,应用性能更高,价格更便宜,功耗更低。中科曙光已成为中国第一台高性能计算机。上市公司的主营业务。 “神威”和“天河”系列超级计算机还通过建立国家超级计算中心为大量高性能计算用户服务。目前,高性能计算基本上已在中国的科研单位和大学中普及。

领先的创新

由于高性能计算机的特殊性,中国的高性能计算机技术和行业水平开始受到产业链和技术的遏制。一方面,“卡颈”上的核心部件,如高性能处理器,高性能加速器,高性能互连芯片;另一方面,加速颠覆性架构和核心技术的发展。中国的高性能计算技术人员已经意识到这种严峻形势,并决心走上创新之路。 “Dawn”,“神威”和“天河”都开始独立开发高性能处理器和加速器,并以其核心组件构建世界上最快的计算机。 2010年6月,“曙光6000”系统位居世界第二。从那时起,中国的高性能计算机继续占据超级计算的前三名。基于Intel MIC异构多核“天河一号”“天河二号”系统和神威片上异构多核处理器,“神威太湖光”系统位居世界第一。基于“神威太湖之光”超级计算机系统的应用获得了戈登贝尔奖。基于海光处理芯片“星云-AI”的多个负载的测量性能也超过了世界上第一个峰会的排名。

在数据密集型,人工智能和生物基因测序等新应用中,智能中心开发了突破性的架构和关键技术。早在“曙光4000”系统的开发,智能中心就开始使用数据密集型应用程序作为重要负载。应用程序负载的内存不规则,访问时间不规则,计算访问率低。该问题为高吞吐量计算开发了基础理论,关键技术,核心芯片和整机系统。对于人工智能应用,已经开发出基于“寒武纪”神经网络处理器的智能超级计算系统,并且性能有望达到世界最高指数。

挑战

高性能计算机开发的挑战可分为如何在摩尔定律失败之前可持续地构建E级系统,以及后摩尔定律时代的革命性技术。

可持续地构建E级系统。高性能计算正处于E级时代(1018年),中国和美国都宣布了E级超级计算机的发展计划。虽然突破E级计算网关的相关技术路线基本上是明确的,但如何建立可持续的E级计算系统的技术路线,如数百个Eflops系统,仍然不清楚。在新设备成熟之前,最大的挑战是如何在高性能计算机体系结构和系统技术上进行创新,以及应对整个系统的组件复杂性和能耗问题,并继续开发数百个Eflops系统。

后摩尔定律时代的超级计算系统。随着集成电路进入后摩尔时代,器件特征尺寸趋于物理极限,目前的器件原理和结构难以满足未来Z类(1021)甚至更高性能Y类的要求( 1024)超级计算机。如何使用新设备是构建后E级时代超级计算系统的主要挑战,包括:基于光学计算原理和超导计算原理的新设备,基于硅光技术的新互连和量子计算机。

政策建议

作为技术战略的制高点,高性能计算机是“三导向”的典型代表。因此,以下是对中国高性能计算机发展的政策建议的讨论,重点是“世界科技前沿,面向国家的主要需求,面向国家的主战场”。经济”。

面向世界科技前沿。高性能计算机的发展代表了电子信息技术发展的前沿。推荐用于光学计算机,超导计算机,硅光集成技术以及用于Z级计算的集成存储器设备。在精神计算模型方面,基础前沿技术的颠覆性突破得到加强。

面对国家的主要需求。高性能计算机始终满足国家的主要需求,如核武器,航空航天,高能物理和气候模拟应用,高性能计算机已成为这些战略部门的基础设施。除了这些以科学计算为中心的应用程序外,围绕数据科学和智能计算开发的应用程序已成为国家的主要需求,为高性能计算带来了更高和更新的挑战。特别是,迫切需要为大数据科学和人工智能构建高性能计算基础设施。同时,有必要对高性能计算机系统的评估指标进行相应的调整。不能简单地使用Linpack指示器作为测量高性能计算机的唯一指标。相反,它必须快速和可数地计算。有必要研究一种多维测量系统。引导高性能计算机健康全面发展。

面对国民经济的主战场。回顾中国高性能计算的历史,高性能计算机推广和应用的过程比计算机的发展更难。 20世纪80年代,钱学森指出,超级计算机的发展必须首先解决并行计算问题,包括机器软件和计算软件。他严厉批评过去忙于制造机器。至于如何使用它,他曾在签名文章中尖叫:“必须在议程上提及这个问题,以便充分利用超级计算机的作用。”一方面,严重的问题应该充分重视软件的应用,另一方面,我们必须关注推动高性能计算普及的技术,如云计算,云计算并行编程等。 (作者:孙宁辉谭光明,中国科学院计算技术研究所《中国科学院院刊》饲料。)

热门浏览
热门排行榜
热门标签
日期归档