��完成数十万个操作。
打个比方,传统CPU是逐行打印,而TPU芯片则能够做到影印效果。
如此种种特性,让它在神经网络计算收敛方面拥有非凡的效果,曾经几天才能训练出的成功,现在一小时不到就能够完成。
林奇不禁感慨万分。
难怪说站在巨人的肩膀上就是爽。
让他自己来设计,如何能够突破看似最简单的加法器这个关卡?
万丈高楼平地起,曾经的林奇开发CPU时,第一步入门选择完成的模块便是加法器,因为它的原理最简单,也是最容易实现的操作。
然而整个TPU芯片,居然本质上也是做加法器?
它的核心便是由乘加器组合形成的256×256的运算器阵列:乘法矩阵。
这种冥冥中的呼应,也让林奇有些哭笑不得。
芯片,本质上便是一个一个模块搭建而成,区别在于有的人是3010片的20周年海德薇限定版,而有的则是630片的普通版。
随着最为核心的乘法矩阵模块成型,它周围的模块也一步一步成型。
林奇这一次彻底看懂这种结构后,也忍不住摇头惊叹,难怪只要4块TPU训练出来的人工智能棋手便能够大杀四方,让人类都在围棋这项技艺上都黯然失色。
要知道一步几千块的旗舰机动辄5nm工艺,而TPU的工艺不过是28nm!
甚至主频也才700Mhz,这种频率甚至得去上个世纪的486机子里寻找。
但真的合适的时候,对方便是一切。
与此同时,林奇发觉脑海里中的记忆宫殿,开始浮现出几篇关键的专利——《NEURAL NETWORK PROCESSOR》、《COMPUTING CONVOLUTIONS USING A NEURAL NETWORK PROCESSOR》……
这些都是当初TPU所关联公开的专利。
甚至整个脉络都已经无比明了。
为了比GPU的计算还要快速,这款神经网络的专用处理器TPU,自然是越发极端!
它进一步牺牲处理器的通用性,只专注于一种——
矩阵运算。
自然他也无法如CPU般支持各种应用程序。
它唯一的用途,便是支持神经网络算法的大规模加减乘除运算。
而这个设计的精妙所在,便在于当参数
打个比方,传统CPU是逐行打印,而TPU芯片则能够做到影印效果。
如此种种特性,让它在神经网络计算收敛方面拥有非凡的效果,曾经几天才能训练出的成功,现在一小时不到就能够完成。
林奇不禁感慨万分。
难怪说站在巨人的肩膀上就是爽。
让他自己来设计,如何能够突破看似最简单的加法器这个关卡?
万丈高楼平地起,曾经的林奇开发CPU时,第一步入门选择完成的模块便是加法器,因为它的原理最简单,也是最容易实现的操作。
然而整个TPU芯片,居然本质上也是做加法器?
它的核心便是由乘加器组合形成的256×256的运算器阵列:乘法矩阵。
这种冥冥中的呼应,也让林奇有些哭笑不得。
芯片,本质上便是一个一个模块搭建而成,区别在于有的人是3010片的20周年海德薇限定版,而有的则是630片的普通版。
随着最为核心的乘法矩阵模块成型,它周围的模块也一步一步成型。
林奇这一次彻底看懂这种结构后,也忍不住摇头惊叹,难怪只要4块TPU训练出来的人工智能棋手便能够大杀四方,让人类都在围棋这项技艺上都黯然失色。
要知道一步几千块的旗舰机动辄5nm工艺,而TPU的工艺不过是28nm!
甚至主频也才700Mhz,这种频率甚至得去上个世纪的486机子里寻找。
但真的合适的时候,对方便是一切。
与此同时,林奇发觉脑海里中的记忆宫殿,开始浮现出几篇关键的专利——《NEURAL NETWORK PROCESSOR》、《COMPUTING CONVOLUTIONS USING A NEURAL NETWORK PROCESSOR》……
这些都是当初TPU所关联公开的专利。
甚至整个脉络都已经无比明了。
为了比GPU的计算还要快速,这款神经网络的专用处理器TPU,自然是越发极端!
它进一步牺牲处理器的通用性,只专注于一种——
矩阵运算。
自然他也无法如CPU般支持各种应用程序。
它唯一的用途,便是支持神经网络算法的大规模加减乘除运算。
而这个设计的精妙所在,便在于当参数
本章未完,请点击下一页继续阅读》》