本篇文章3038字,读完约8分钟

以大数据推进数字经济为主题的中国电脑大会( cncc )于10月25~27日在杭州市国际博览会中心( g20会场)隆重举行。 作为我国计算机行业规模最大、规格最高的学术、技术、产业交流盛会,这次大会有图灵奖获得者、美国工程院院士、中国科学院、清华、北大、东京大学、微软、Gogle、蚂蚁、标题等多项尼

【科讯】中科驭数鄢贵海:SDA服务DSA 让“性能”与“通用性”两者兼得

图灵奖获得者,美国计算机科学家robert e.kahn

其中,在25日下午的硬件安全论坛上,中国科学院计算所研究员、中科控数ceo邓贵海以“软件定义体系结构和计算结构安全属性的设计权衡”为主题,成为香港科技大学工程学院院长tim cheng, 分别与马里兰大学帕克分校电气和计算机工程系教授屈钢、香港中文大学计算机科学和工程系副教授徐强共享主题,在“从硬件安全到新闻系统安全”过去共同参加。

【科讯】中科驭数鄢贵海:SDA服务DSA 让“性能”与“通用性”两者兼得

中国科学院计算所研究员、中科控数ceo邓贵海有主题共享

半导体芯片的摩尔定律已经接近尾声,但数据摩尔定律才刚刚开始

邓贵海表示,自从英特尔创始人戈登·摩尔于1965年提出摩尔定律以来,芯片运算能力的原则每18个月翻一倍。 其中的贡献既来自过程的进步也来自架构的创新。 芯片制造工艺的进步带来的巨大贡献是,几乎不改变架构,只使用更微细的半导体工艺,就能带来大的性能提高。 此外,片上资源(如更高密度、更便宜的晶体管和布线)也为越来越多的架构设计提供了可能性。

【科讯】中科驭数鄢贵海:SDA服务DSA 让“性能”与“通用性”两者兼得

但是随着过程接近一定的物理极限,摩尔定律的失效成为必然。 数据显示,芯片晶体管的密度最近三年的年增长率仅为3.5%。 这似乎很难平衡传统的过程-体系结构这种二轮驱动的快速发展模式。 事实上,在2005年,单个解决方案核心的能效提高已经遇到了困难,多核解决方案体系结构也在迅速发展。 在这个比较直接的进化过程中,许多并行应用程序由此直接受益,但也有很多应用程序因使用多核解决方案而没有提高性能,没有特别明确的并行度,并行编译的优化

【科讯】中科驭数鄢贵海:SDA服务DSA 让“性能”与“通用性”两者兼得

半导体芯片摩尔定律已经接近尾声,数据摩尔定律才刚刚开始。 根据美国公布的“-2045年新兴科学技术趋势”,世界数据量从年开始每两年翻一倍。 随着应用行业的创新和数据的急剧增加,特别是人工智能、区块链、边缘计算等技术加强了计算能力的诉求,依赖以前传来的通用计算并不容易有效,专用计算体系结构起到很大的作用 此外,许多行业的市场容量足以支持一种专用体系结构的开发和应用。 例如,目前成为热点的行业,如人工智能和区块链等行业预计将承担万亿美元规模的市场。

【科讯】中科驭数鄢贵海:SDA服务DSA 让“性能”与“通用性”两者兼得

专用计算体系结构是百花齐放的,无法兼顾高性能和通用性

现在,面向专用计算的体系结构研究依然处于百花齐放的时代,从fpga、asic等具体基础实现的探讨到isa指令集扩展等硬件和软件的体系结构都涉及。 专用加速系统的设计方法也还没有达到统一的公式化。 以gpu (图形解决方案)为代表,与多媒体编码、解码相关的许多协作,如vpu (视频解决方案)、mpu (运动增强器解决方案)、apu (音频解决方案) 计算力的问题仍然是迫切需要处理的刚性。

【科讯】中科驭数鄢贵海:SDA服务DSA 让“性能”与“通用性”两者兼得

谷歌用于加速深度学习的tpu

以近年来受欢迎的深入学习为例,根据人工智能开放组织openai今年5月发表的解体,年以来,由于数据红利和深度学习的训练,人们对计算能力的诉求超过了30万倍。 大部分网络巨头都补充了自己的标准服务器cpu,并与特定应用程序的快速协作共同解决了大量数据。 例如,微软利用fpga加速该公司bing的各大搜索引擎,谷歌开发的tpu加速神经网络推理,阿里巴巴企业也是fpga硬件团队比较并加速具体的计算负荷等。 但是,面对应用程序的多样化、数据的多和复杂,高性能和通用性总是不能兼顾的。

【科讯】中科驭数鄢贵海:SDA服务DSA 让“性能”与“通用性”两者兼得

一个是大型硬件软件的全栈型研究开发,另一个是大部分企业别无选择

现在一些资深领域的人已经发现通过基础基础设施和上层应用程序全栈式的研究开发,定制不同的多元化处理方案将成为产业的重要组成部分。 但是,目前,以资本、技术为特征的大型企业在持续投资开发中,不仅适合其应用和数据的解决加速器,很多企业还只能选择以各种通用cpu为核心的服务器,利用率低,购买和采用高时

【科讯】中科驭数鄢贵海:SDA服务DSA 让“性能”与“通用性”两者兼得

这是因为定制专用计算体系结构具有很高的技术阈值,即使基于以可编程性和灵活性闻名的fpga的处理方案,很多企业的研究开发能力也是探索计算体系结构的水平。 对单一公司来说,成立专用架构的研究开发团队实际上也缺乏规模效果,由于研发周期长、技术难度高、价格高等因素,引起了很大的风险。 因此,当前计算体系结构的创新瞄准了这许多企业面临的中心问题。 利用高效的专用计算体系结构,提高企业的数据解决能力,更好地支持现有业务运营,为企业推进数据驱动的创新提供计算能力保障。

【科讯】中科驭数鄢贵海:SDA服务DSA 让“性能”与“通用性”两者兼得

专用、灵活,在软件定义体系结构中将整体计算效率提高100倍

作为中国科学院计算技术研究所产生的中科控数,为了迅速解决特定行业的大量数据解决问题,创新使用软件定义加速器的技术路线,从基础核心技术出发,以专用芯片架构为核心,协同硬件 其原始技术kputm (即核解决器,提交了备案)是为加速特定行业核心功能的计算而设计的协同解决器。 kputm以功能核为基本单位,直接抽象应用程序中的计算密集性应用程序,与上层集成,实现以应用程序为中心的体系结构定制。 一个kputm可以根据主张整合几十到几百个功能核心。

【科讯】中科驭数鄢贵海:SDA服务DSA 让“性能”与“通用性”两者兼得

中科御数用原创技术设计新协解决器kpu

与以往基于控制流计算模型的冯·诺依曼结构不同,kputm的各功能核是特定于某种功能计算的定制,与cpu、gpu、npu的大规模同质化核心不同。 通过数据驱动计算的方法,不仅实现了超大规模的计算并行化,还实现了真正意义上的多命令多数据解决模型。 与fpga在电路层改造的性能牺牲不同,kputm的核心技术是以编译器形式内置在功能核层中的功能核,实现了行业内硬件的统一,降低了规模限制的硬件价格和设计周期。 另外,可以通过软件编程实现不同功能的计算,特定的诉求只要增加功能核的种类和数量即可。 在整体计算效率提高100倍的前提下,仍然具有非常高的可扩展性和灵活性。 从某种意义上来说,中科控数的kputm技术路线有望突破以前传来的性能和通用性不能兼顾的设计极限,具有广泛的应用前景。

【科讯】中科驭数鄢贵海:SDA服务DSA 让“性能”与“通用性”两者兼得

大咖啡的评价:趋势明显,把握平衡,选择落地,都来远了。

论坛结束后,记者还就kpu相关技术向cncc现场特邀嘉宾香港科学技术大学工程学院院长、ieee fellow、tim cheng教授进行了咨询。 程教授早年在贝尔研究所工作,成立了ucsb计算机工程系、负责科学研究的副教务长。

论坛结束后,成教授与邓贵海和参加者交流了kpu

tim认为现在的计算能力诉求有爆发的倾向,dsa(domain specific architecture行业专用架构)是可以突破计算能力瓶颈的方向。 其特点是优化某行业的计算任务,大幅度提高计算能力。 但是,市场的诉求没有通用解决方案那么大,因此要求在dsa的开发价格和比较行业的诉求之间取得平衡。 基于中科控数发布的sda (软件定义架构)方法设计的kpu处理了dsa设计价格的问题,大幅降低了dsa的开发价格,扩大了dsa的采用行业。

【科讯】中科驭数鄢贵海:SDA服务DSA 让“性能”与“通用性”两者兼得

另外,tim非常赞同中科控数首先选择fintech行业开发kpu。 tim认为金融计算行业的市场仍然非常大,负载具有特殊性,是非常合适的dsa应用场景。 另外,tim表示dsa的方向可以帮助国家的科学技术帮助金融的长时间战术,都是重要且路途遥远的事业,前景非常广阔。

标题:【科讯】中科驭数鄢贵海:SDA服务DSA 让“性能”与“通用性”两者兼得

地址:http://www.miutrip.net.cn/news/1305.html