长治市| 阿克陶| 孝感| 乐业| 清丰| 天水| 保靖| 乌当| 西峡| 下陆| 嵩县| 苍南| 莱州| 义马| 慈溪| 夏河| 盖州| 长海| 博野| 南票| 玉林| 龙里| 梁山| 兴化| 肇源| 深圳| 新丰| 遂宁| 合浦| 定边| 盐池| 昆山| 扬州| 徐闻| 屯昌| 鹰潭| 全椒| 尼玛| 衡阳市| 江津| 南宫| 晋江| 百色| 南木林| 柳州| 六盘水| 巴林右旗| 沂水| 理县| 阿勒泰| 隆尧| 洞口| 宁阳| 肇州| 大荔| 五峰| 辰溪| 惠来| 工布江达| 苏家屯| 五原| 丰顺| 思南| 集贤| 墨脱| 惠州| 鄂温克族自治旗| 兴城| 延安| 华山| 云龙| 荣县| 杭锦旗| 杜集| 平舆| 玉林| 陵县| 莒县| 怀柔| 彝良| 弥渡| 岳普湖| 淅川| 资源| 山东| 夹江| 利川| 朗县| 宾川| 香格里拉| 恩平| 猇亭| 江都| 政和| 江永| 容城| 宝丰| 曲水| 嘉祥| 大悟| 衡水| 垣曲| 清丰| 靖州| 台安| 万全| 措勤| 敦化| 东兰| 京山| 德安| 新疆| 井研| 义马| 丰都| 平武| 大港| 道县| 开封市| 白水| 华容| 东台| 弓长岭| 濠江| 南宁| 定襄| 双流| 秀屿| 大同市| 西峡| 株洲市| 含山| 贵德| 抚松| 德化| 清徐| 印台| 普陀| 大洼| 朗县| 宝丰| 丹凤| 兴隆| 五寨| 礼县| 夏津| 绛县| 遂溪| 丹寨| 雷山| 东光| 洪江| 阿拉善左旗| 盈江| 昂仁| 寻乌| 朝阳县| 叶县| 贺兰| 江源| 加格达奇| 灵山| 汪清| 台南市| 清水河| 四平| 纳雍| 安西| 壶关| 潜山| 苗栗| 水城| 苏尼特右旗| 驻马店| 娄底| 深泽| 苏尼特左旗| 略阳| 忻城| 彭水| 察雅| 岚山| 郯城| 漳县| 巴林右旗| 乐清| 永川| 南召| 呼玛| 凤县| 南沙岛| 昌图| 洪江| 望谟| 北海| 北流| 西华| 夏津| 凌云| 城阳| 荣成| 彭阳| 易门| 海原| 深泽| 汤原| 大连| 东西湖| 宁陕| 霍邱| 峨眉山| 古冶| 石家庄| 番禺| 诏安| 开江| 马鞍山| 茌平| 盐城| 山阴| 岗巴| 永新| 眉山| 南华| 东川| 乌当| 建平| 水城| 五河| 靖边| 桂阳| 离石| 陇川| 商丘| 潼南| 克拉玛依| 连州| 梧州| 本溪市| 宿豫| 镇原| 文水| 墨江| 赣县| 儋州| 思茅| 滨海| 怀仁| 沂源| 钦州| 新泰| 浙江| 宣恩| 西充| 前郭尔罗斯| 曲周| 南昌县| 平和| 大方| 邢台| 海盐| 文县| 盘山| 三门峡| 百度

Tradicional indústria de pentes de madeira em Anhui ganha novo impulso

2019-03-19 01:23 来源:百度知道

  Tradicional indústria de pentes de madeira em Anhui ganha novo impulso

  百度传统王朝亦深知这种按照理想状态进行制度设计的弊端,故在现实中又不得不对士子的言行加以种种限制。该集群专题共计刊发22篇原创性稿件、7篇已发表中文文章的英译稿件和13个观点摘编。

“物的艺术表达”的研究将使丝绸之路艺术的意蕴获得新的理解,也使得丝绸之路物质与艺术之关系获得新的阐释。正是这些国家优先观念,才使得帝国统治者持续地、长期地致力于控制地权冲突。

  在“放飞科学梦想”展区,王沪宁观看了青少年做的“爱迪生”留声机,详细询问有关情况。乡村传统伦理文化得以有效传承与发展。

  所著《易学启蒙通释》,为现存第一部注释《易学启蒙》之作。在政策制定中充分评价和考量政策效应(有效性)、效率(政策成本与风险)、可行性(认同度和执行性),从而强化政策的科学性与可执行性。

中国社会科学院学术委员会成立后,任第一、二届委员。

  历史上,丝路的物质贸易时断时续,而艺术之路一经开辟就从未间断,并在本土化的过程中不断创新样态,逐步形成了丝绸之路亚欧非大陆、草原、海上等艺术廊道,使艺术成为割不断的精神文化之路,延续着东西方的情感交流。

  因此,我们本次改版的理念是突出观点,突出原创,向差异化、特色化网站迈进。生态兴则文明兴,生态衰则文明衰。

  杨维桢所倡的“力复唐音”与“宗唐复古”,李东阳所倡的“溯流唐代”与“诗必盛唐”,无不如此。

  嫦娥四号探测器成功发射,第二艘航母出海试航,国产大型水陆两栖飞机水上首飞,北斗导航向全球组网迈出坚实一步。Lansdall-Welfare也收集了4亿多条微博信息,通过检验经济衰退对英国民众情绪的影响,从而发现了支出削减声明与2011年8月骚乱间的强相关关系。

  康熙年间,顾嗣立编选《元诗选》,成为元诗选本中的典范。

  百度这“四个一”体现了以习近平同志为核心的党中央对生态文明建设规律的把握,体现了生态文明建设在新时代党和国家事业发展中的地位,体现了党对建设生态文明的部署和要求。

  2017年的报告指出,从全球范围上看,“政府提供的公开数据与公众的数据需求之间存在明显的不匹配”,突出表现在数据搜索困难、数据用户友好程度低、数据许可开放程度低三个方面。湖南省委常委、宣传部部长许又声开通启用。

  百度 百度 百度

  Tradicional indústria de pentes de madeira em Anhui ganha novo impulso

 
责编:
您正在使用IE低版浏览器,为了您的雷锋网账号安全和更好的产品体验,强烈建议使用更快更安全的浏览器
雷锋网
人工智能 正文
发私信给程弢
发送

0

Tradicional indústria de pentes de madeira em Anhui ganha novo impulso

本文作者:程弢 2019-03-19 14:03
导语:从这次发布的测试结果来看,TPU似乎已经超出了业界的预期,但是藏在这一芯片背后的内部架构究竟有什么秘密呢,我们从Jouppi此前发布的论文当中,可以找到答案。
百度 美术类资料一般以版画的形式呈现,以书院图、山水图、形胜图、八景图最多,《莲池书院图咏》即是其中的典型代表。

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?

在谷歌发布TPU一年后,这款机器学习定制芯片的神秘面纱终于被揭开了。

昨日,谷歌资深硬件工程师Norman Jouppi刊文表示,谷歌的专用机器学习芯片TPU处理速度要比GPU和CPU快15-30倍(和TPU对比的是英特尔Haswell CPU以及Nvidia Tesla K80 GPU),而在能效上,TPU更是提升了30到80倍。

从这次发布的测试结果来看,TPU似乎已经超出了业界的预期,但是藏在这一芯片背后的内部架构究竟有什么秘密呢,我们从Jouppi此前发布的论文当中,可以找到答案。

据雷锋网了解,早在四年前,谷歌内部就开始使用消耗大量计算资源的深度学习模型,这对CPU、GPU组合而言是一个巨大的挑战,谷歌深知如果基于现有硬件,他们将不得不将数据中心数量翻一番来支持这些复杂的计算任务。

所以谷歌开始研发一种新的架构,Jouppi称之为“下一个平台”。Jouppi曾是MIPS处理器的首席架构师之一,他开创了内存系统中的新技术。三年前他加入谷歌的时候,公司上下正在用CPU、GPU混合架构上来进行深度学习的训练。

Jouppi表示,谷歌的硬件工程团队在转向定制ASIC之前,早期还曾用FPGA来解决廉价、高效和高性能推理的问题。但他指出,FPGA的性能和每瓦性能相比ASIC都有很大的差距。他解释说,“TPU可以像CPU或GPU一样可编程,它可以在不同的网络(卷积神经网络,LSTM模型和大规模完全连接的模型)上执行CISC指令,而不是为某个专用的神经网络模型设计的。一言以蔽之,TPU兼具了CPU和ASIC的有点,它不仅是可编程的,而且比CPU、GPU和FPGA拥有更高的效率和更低的能耗。

TPU的内部架构

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?

该图显示了TPU上的内部结构,除了外挂的DDR3内存,左侧是主机界面。指令从主机发送到队列中(没有循环)。这些激活控制逻辑可以根据指令多次运行相同的指令。

TPU并非一款复杂的硬件,它看起来像是雷达应用的信号处理引擎,而不是标准的X86衍生架构。Jouppi说,尽管它有众多的矩阵乘法单元,但是它GPU更精于浮点单元的协处理。另外,需要注意的是,TPU没有任何存储的程序,它可以直接从主机发送指令。

TPU上的DRAM作为一个单元并行运行,因为需要获取更多的权重以馈送到矩阵乘法单元(算下来,吞吐量达到了64,000)。Jouppi并没有提到是他们是如何缩放(systolic)数据流的,但他表示,使用主机软件加速器都将成为瓶颈。

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?

256×256阵列缩放数据流引擎,经过矩阵乘法积累后实现非线性输出

从第二张图片可以看出,TPU有两个内存单元,以及一个用于模型中参数的外部DDR3 DRAM。参数进来后,可从顶部加载到矩阵乘法单元中。同时,可以从左边加载激活(或从“神经元”输出)。那些以收缩的方式进入矩阵单元以产生矩阵乘法,它可以在每个周期中进行64,000次累加。

毋庸置疑,谷歌可能使用了一些新的技巧和技术来加快TPU的性能和效率。例如,使用高带宽内存或混合3D内存。然而,谷歌的问题在于保持分布式硬件的一致性。

TPU对比Haswell处理器

在和英特尔“Haswell”Xeon E5 v3处理器来的对比中,我们可以看到,TPU各方面的表现都要强于前者。

在Google的测试中,使用64位浮点数学运算器的18核心运行在2.3 GHz的Haswell Xeon E5-2699 v3处理器能够处理每秒1.3 TOPS的运算,并提供51GB/秒的内存带宽;Haswell芯片功耗为145瓦,其系统(拥有256 GB内存)满载时消耗455瓦特。

相比之下,TPU使用8位整数数学运算器,拥有256GB的主机内存以及32GB的内存,能够实现34GB/秒的内存带宽,处理速度高达92 TOPS ,这比Haswell提升了71倍,此外,TPU服务器的热功率只有384瓦。

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?

除此之外,谷歌还测试了CPU、GPU和TPU处理不同批量大小的每秒推断的吞吐量。

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?

如上图所示,在小批量任务中(16),Haswell CPU的响应时间接近7毫秒,其每秒提供5482次推断(IPS),其可以实现的最大批量任务(64)每秒则可以完成13194次推断,但其响应时间为21.3毫秒。相比之下,TPU可以做到批量大小为200,而响应时间低于7毫秒,并提供225000个IPS运行推理基准,是其峰值性能的80%,当批量大小为250,响应时间为10毫秒。

不过需要注意的是,谷歌所测试的Haswell Xeon处理器似乎也不能完全说明问题,英特尔Broadwell Xeon E5 v4处理器和最新的“Skylake”Xeon E5,每核心时钟(IPC)的指令比这款处理器提升了约5%。在Skylake是28核,而Haswell为18核,所以Xeon的总体吞吐量可能会上升80%。当然,这样的提升与TPU相比仍有差距。

最后雷锋网需要强调的是,TPU是一个推理芯片,它并非是要取代GPU,可以确定的是,TPU与CPU一起使用对训练分析更加有益。但对于CPU制造商而言,如何研发出像ASIC一样兼顾性能和能效的芯片是现在以及未来要做的。

可以确定的是,谷歌已经逐渐在自己的数据中心部署TPU,但是上述测试数据只是理论结果,实际应用表现如何?我们还不得而知。

Via nextplatform,雷锋网(公众号:雷锋网)编译

雷锋网版权文章,未经授权禁止转载。详情见转载须知

分享:
相关文章

文章点评:

表情

略懂技术的小编

关注一切有未来感的产品及技术!
当月热门文章
最新文章
请填写申请人资料
姓名
电话
邮箱
微信号
作品链接
个人简介
为了您的账户安全,请验证邮箱
您的邮箱还未验证,完成可获20积分哟!
请验证您的邮箱
立即验证
完善账号信息
您的账号已经绑定,现在您可以设置密码以方便用邮箱登录
立即设置 以后再说
百度