腾讯企业邮箱多少钱一年_腾讯的芯事
本文编辑:proprieter时间:2022-08-17 14:46
事后想来,芯片验证工程师Lynda进腾讯有点“草率”了。“我们的仿真工具呢?”“没有,还在谈。”“验证环境怎么说?”“还没有。”“那……验证流程呢?”“也没有。“那是2019年1月。加入腾讯,Lynda正准备撸起袖子,大干一场,却劈面遭遇“一问三没有”。“我们是从零开始做芯片。”面试时,主导芯片设计工作的Henry给她打过心理预防针。Lynda正好想参与芯片研发的全过程,倒不怕从头开始。但她实在没料到,连仿真工具、验证环境、验证流程这些必备品都能 “三无”。
众所周知,芯片研发高门槛、高投入、高风险,而验证工程师就是守门员。软件开发尚可后期不断改bug,芯片如果设计问题没被前期验证发现,一旦流片,只能沦为一块“砖头”。因此,很多芯片公司对设计工程师与验证工程师的人员配比是1:3。而在蓬莱实验室,Lynda只有一个并肩作战的验证同事,和一行代码都没有的验证条件。这时候,Lynda才开始明白Henry口中的“从零开始”意味着什么,以及她面临着怎样一场艰难的战役。1一个差点解体的团队在腾讯云副总裁、云架构平台部总经理谢明看来,芯片这场战役,腾讯“蓄谋已久、势在必行”。这个团队肩负着QQ等国民级应用的后台架构,站在腾讯海量业务数据冲刷的前线,深刻地明白底层技术创新对上层应用的放大价值。2013年,QQ相册已经发展成腾讯最大的一个存储类业务。
让用户访问相册的速度更快、体验更顺滑,成了一个很急迫的需求。转化成相应的技术问题,就是图片能否更快地转码?能否在不损画质的情况下压缩?能否以更低的成本存储?他们反复地追问。伴随着软件架构上永无止尽的自我超越,团队敏锐地察觉到,只有在硬件上也作出创新,才能实现更深层次的突破。一个做软件出身的团队,怎么去做硬件?一圈研究之后,他们决定先拿FPGA(可编程阵列逻辑)试水。FPGA相比起芯片容错率高,但在吞吐率、延迟、功耗和灵活性等维度上都很平衡。尤其是在处理海量数据时,FPGA相比GPU具有超低延时的显著优势。事实验证了这种判断。2015年,团队集中力量研发的图片编码FPGA,取得了比CPU编码和软件编码更高的压缩率和更低的延时,也帮助QQ相册很大程度上降低了存储成本。
他们看到了在FPGA方向探索和深入的可能性。2016年前后,由AlphaGo引爆的AI热潮更把FPGA拉入了主流视野。团队通过FPGA对深度学习模型的CNN算法进行加速后,处理性能达到通用CPU的4倍,而单位成本仅为1/3。FPGA效果虽好,但技术门槛比较高,“如果把FPGA云化,是不是一个能够扩大应用的解决路径?”带着这样的期待,2017年1月20日,腾讯云推出了国内首款FPGA云服务器,希望以云计算的方式,将FPGA能力推广到更多企业。从效果上来说,在FPGA云服务器上进行FPGA硬件编程的企业,确实能将性能提升至通用CPU服务器的30倍以上,而只需支付相当于通用CPU约40%的费用。以一家著名的基因检测公司为例,传统用CPU需要检测一周的基因序列,FPGA可以压缩到数小时完成。
然而,残酷的现实给团队从头到脚浇了盆冷水,云化后的FPGA,没能如预期般迅速席卷整个行业。一方面,许多企业还是无法独立胜任FPGA开发,需要更加上层的服务;另一方面,GPU成本的迅速下降,也给FPGA造成了巨大的冲击。云端商业化的受挫,把团队的热情从巅峰一下子打到了谷底,同时也把一个问题赤裸裸地抛到整个团队的眼前:FPGA对业务的价值究竟有多大?FPGA还能继续做吗?受此打击,团队在2018年也近乎分崩离析,人员开始集中式地离开。2柳暗花明,“蓬莱”问世时间进入2019年。那是人工智能规模化应用的元年,内外部业务都提出了对AI芯片的强烈诉求。在FPGA云服务器受挫后,腾讯需要重新思考硬件之路要怎么走下去。AI芯片,要不要做?这个问题被提出来的时候,管理层有过反对的声音,担心技术人员只是头脑发热,只是为了追逐热点,只是看似自信的盲目自负,但也没有明令禁止小团队的探索。
以小规模、低成本、特定应用场景的方式先行试水,成了大家的共识。云架构平台部将第一款芯片敲定AI推理方向,取名“蓬莱”,希望这款芯片能像中国古代神话里的海外仙山一样,稳固地立于汹涌波涛之上。这支硬件突围小分队,也被正式命名为“蓬莱实验室”。经历过FPGA,蓬莱实验室对硬件编程语言已经相当熟练,也在标准接口、总线等方面积累了一些平台化的设计。然而,两者的研发要求,不可同日而语。如果说做FPGA是搭现成的积木,那么做芯片就是直接从原木着手来制造积木。FPGA出了问题可以重新编程,而芯片只有一次流片机会,一旦出错,付诸东流。
此外, FPGA的资源是现成固定的,芯片的资源却是由自己定义的。一个字,就是要“抠”:用最小的资源做最大的事。芯片架构工程师Rick用“装修”改“重建”来形容整个蓬莱项目。一开始,团队以为能把之前FPGA的技术较为简单地转成芯片。做着做着发现,以为终归只是以为——FPGA架构在芯片中能直接复用的并不多,团队只能把原来的架构整个拆掉,重写的代码量高达85%。像DDR存储器这样的重中之重,芯片厂商通常会有专门的验证人员负责,而刚起步的蓬莱实验室没这个条件,只能靠抢时间把功课补回来。2020年1月,蓬莱芯片流片完成,被合作方快递到深圳。
新冠疫情刚刚在全国范围内暴发,公司已经开启集体远程办公。 ●流片完成的蓬莱芯片被快递回深圳Henry戴着手套取到快递,用酒精仔细消毒后,带到空空荡荡的办公楼,大开着窗户和风扇,和几个同事一起开始点亮操作。所谓点亮,就是给芯片上电,首先看有没有短路冒烟,接着就是测试一些基本功能。是芯片还是“砖头”,成败在此一举。 ● 调试蓬莱芯片的时钟结果,芯片的时钟频率一直没出来。要知道,时钟频率是芯片的“节拍器”,没有时钟频率,芯片的不同模块等于没对好表,就无法协同工作
上述内容为转载或编者观点,企业服务社仅提供内容,不承担任何法律责任。如侵权请联系删除。