领跑世界的指挥员:记“天河一号”“副总设计师肖立权 _公安厅网
返回首页 原创联播 美丽中国·千城联播

      <kbd id='4GXxD'></kbd><address id='im3zf'><style id='7Hvlb'></style></address><button id='LE55k'></button>

          当前位置: 首页 > 网络日报 > 国际网络新闻 >

          领跑世界的指挥员:记“天河一号”“副总设计师肖立权

          点击:74220
            

            领跑世界的指挥员记“天河一号”“

            领跑世界的指挥员

            记“天河一号”“天河二号”副总设计师肖立权

            □ 本报记者   廉颖婷

            □ 本报通讯员 刘于蓝

            仲夏时节,湘江之畔的国防科技大学已进入暑期。校园里人影稀疏,不复往日热闹。

            矗立在东北方向的天河大楼里,机房内长达数十米的机箱整齐排列着,指示灯明暗交错,高速运转的机箱发出低沉的嗡嗡声。这就是我国六度称雄全球超级计算机500强榜单,让中国速度震惊世界的“天河二号”。

            此时,“天河二号”副总设计师、国防科技大学计算机学院计算机研究所所长肖立权,正带领着团队攻关新一代高性能计算机。正是他们,吹响了向新的中国速度发起冲锋的集结号。

            无惧挑战解决技术难题

            1997年,肖立权博士毕业留校后,成为国防科技大学计算机学院计算机研究所的一名科研人员。从那时起,他就与巨型机一起成长,参与了“银河”“天河”高性能计算机多代机型的研制,从一名普通的科研人员,一步步成长为今天国防科技大学超级计算机团队的核心骨干。

            “走别人没走过的路太难,但我喜欢挑战。”这是肖立权在接受采访时常挂在嘴边的一句话。

            上个世纪末,大规模计算机系统中通常采用的电互联技术传输速率低,且易受干扰,极大影响了系统的稳定性,成为我国研制千万亿次级超级计算机路上的一块绊脚石。

            如何搬开这块绊脚石?用光互联替代电互联是最优解,于是,研究所将这一任务交给了肖立权。

            这是一条别人没有走过的路,注定充满了荆棘和坎坷。

            2003年受领任务后,肖立权立即将科研准星瞄向了这一技术难题。然而,按照自己思路做出来的系统根本跑不起来。

            哪里出了问题?

            那个夏天,肖立权满脑子都在问为什么。就连午休闭上眼睛,他脑海里都是屏幕上滚动的实验数据。

            “没法睡,去实验室。”肖立权翻身而起,穿好衣服就往实验室跑。

            架起示波器、逻辑分析仪,他全神贯注地观察着,生怕一眨眼就错过了关键数据。

            解决的思路一次次提出,却又一次次被推翻。

            某天,正在做实验的肖立权突然冒出一个想法:是不是数据传输有问题?灵光乍现后,他找到了解决问题的钥匙,随即逆向思维反推,最终找到症结所在。

            这一刻,我国光互联技术在大规模计算机系统中得到有效验证,为后续这一技术在超级计算机系统中的应用奠定了坚实基础。

            此后,肖立权马不停蹄,瞄准这一技术领域,拿下了一个又一个拦路虎,解决了光互联替代电互联的系列技术难题,成功研制出我国首台采用光互联技术的并行计算机互联通信系统。传输速率从原有的400Mbps一路飙升为10Gbps,实现数量级飞跃。

            艰难闯关问鼎世界桂冠

            2010年11月,“天河一号”凭借优异性能登上世界超级计算机500强榜首,中国超级计算机首次问鼎世界桂冠,五星红旗飘扬世界之巅。

            2013年6月,“天河二号”以峰值运算速度每秒5.49亿亿次,持续计算速度每秒3.39亿亿次,轻松摘得世界超级计算机500强桂冠,我国超级计算机研制达到世界领先水平。习近平主席专门对“天河二号”研制成功作出重要批示。

            2013年11月,“天河二号”蝉联世界超级计算机500强榜首;

            2015年11月,“天河二号”六次问鼎世界超级计算机500强,中国速度继续领跑世界。

            作为“天河一号”“天河二号”的副总设计师,这些耀眼成绩的背后,是肖立权瞄准世界高性能计算机技术前沿,不懈探索创新的丰硕成果。

            高速互联通信是决定大规模并行计算机系统实用效率的关键,美国对中国严格封锁高速互联技术转让。当时,“天河一号”在国内首次创新性地采用了CPU+GPU异构融合体系架构,其内部数万个CPU和GPU需要通过互联通信系统实现信息交换,难度可想而知,组织并全面负责互联通信系统自主设计研制任务的肖立权倍感压力。

            寒来暑往,他不仅协助制定系统的总体技术方案、技术路线和设计指导原则,而且经常泡在试验一线,从原理验证到工程实践,一个环节都不放过。团队在他的带领下,开展关键技术、核心技术攻关,迅速打响了一场没有硝烟的战斗,成功将“天河一号”送上世界超级计算机第一的宝座。

            在大家眼里,肖立权是名副其实的拼命三郎。可用他自己的话说,和地下银河团队那些为了银河事业而牺牲奉献的先辈先烈相比,这算不了什么。

            自主创新攻克世界难题

            短暂的喜悦过后,肖立权又开始了紧张的工作,他早已将目标瞄准了运算速度更快的亿亿次超级计算机系统——“天河二号”。

            在原有基础上,他带领团队进行封闭攻关,“天河二号”高速互联通信系统性能得到提升,是当时国际商用互联系统的两倍。它可以把上万颗微处理器联系起来,共同解决同一个计算问题,解决了高效互联中微处理器越多效能越低的世界难题。

            研制“天河二号”期间,由于时间紧任务重,在接近1000天的研制周期中,肖立权只在两个春节各休息了3天。

            对于肖立权来说,这就是他的战场,他既要当项目指挥者,又要做一线战斗员。

            攻关关键期,肖立权带领所在团队采取三班倒方式夜以继日进行奋战,自己每天连续工作十几个小时以上,身体屡亮黄灯却无暇顾及。

            在这条自主创新的道路上,肖立权带领项目组在校外进行了长达一年的封闭设计工作,自主研制出互联通信系统最核心的两块芯片:路由器和网络接口。

            一台超级计算机系统好比一个大城市,互联通信系统就是城市的公路网,路由器就是立交桥,网络接口就是主干道出入口。一个城市公路网市政设施建设得再好,立交桥和主干道出入口不设计好,城市交通依然拥挤不堪。

            依靠自主创新,掌握了属于自己的核心关键技术,这是“天河二号”在发展迅猛、竞争激烈的世界超级计算机领域长时间保持领先地位的主要原因。

            正如国际TOP500主要撰稿人杰克·唐加拉所说:“中国自主研发了内部互联技术,这是买不来的,这是他们基于芯片、路由器及自主生产的交换器开发出来的。”

            “我们参加世界排名并不仅仅是为了第一。世界超算500强榜单其实是一个交流平台,只有在国际上有了声誉,别人才愿意和我们交流。”肖立权深知,只有自立自强,掌握自主核心关键技术,才能在国际上掌握发言权,让世界听到来自中国的声音,让中国更好的了解国际前沿发展趋势。

            作为计算机研究所领导,肖立权始终把人才培养作为科学研究的重中之重。在所内实施青年骨干培养计划,制定优秀人才个性化培养方案,让10多名年轻博士担任分系统设计师,组织一线骨干留学考察。

            目前,这个所入选国家和军队人才培养工程对象等高奖项的有38人次,平均年龄不到40岁。

            担任博士生导师和硕士生导师以来,肖立权累计指导博士生8名,硕士生15名。根据学生不同兴趣和爱好,在高性能计算机体系结构、高速互联网络结构、光互联与交换、深亚微米ASIC设计等方面,他以自身积累的深厚理论基础和丰富的实践经验为基础,引导学生广泛参与工程实践活动,在实践中培养学生的创新和科研攻关能力。

            眼下的这个暑假,对肖立权来说并不存在,他正忙着带领团队全力投入到新一代高性能计算机的研制攻关中。

            肖立权的目标,是摘取超级计算机的下一顶皇冠。

            图为肖立权(中)与团队科研工作者交流“天河二号”相关技术点。  欧阳登轶 摄

          顶一下
          (12301)
          踩一下
          (76753)
          ------分隔线----------------------------
          ------分隔线----------------------------
          热点内容
          1 2 3 4 5 6 关于我们  |  本网动态  |  网站地图  |  广告服务  |  版权声明  |  总编邮箱  |  联系我们  |  网站地图  |  返回顶部