bob半岛在线登录我们花了20年终于结束了中国信息产业无芯的历史 张福新
半岛官网,2018年,我国中兴通信公司——一个年产几百亿的高科技企业被美国制裁bob半岛在线登录,差点就因芯片断供而直接休克。
直到2020年美国使出大招,说我们只要用了美国技术的企业,就不能给华为服务,直接切断了华为的生产渠道。
通过一次次的事件,大家能够看到芯片是多么重要,芯片是扎扎实实地被卡着脖子。
它的复杂度、性能要求是最高的,它是应用在我们个人电脑、服务器等最需要性能的场合的。
这就是我们做的几颗芯片的样子,它最大也只有几平方厘米,但是里面大有玄机。
如果我们把科研比作攀登高峰,那么做芯片可以说是在爬喜马拉雅山,做CPU就是爬珠穆朗玛峰。
国产芯片的市场情况是非常堪忧的,我们可以看到,各种领域里,国产芯片的占有率很多都是0,包括个人电脑和服务器里用的CPU。
第二,因为我们无法做芯片,就占不到产业的上游,真正的IT产业里最赚钱的企业,往往都是上游这些做芯片的。
我们整个电子信息产业中,百强企业的利润加起来还不如美国一家苹果公司的利润,
当然,这个情况不是没有人看到,比如为什么华为现在被美国制裁,仍然能够挺住它的攻击?
就是因为十几年前,它就已经意识到这个风险,开始启动了备胎芯片的计划,在内部悄悄地做了很多芯片。
在科学界,我们计算所的老所长李国杰院士,也是早在2000年前后,就在国家到处呼吁,说我们必须立项做CPU了。
当时专家们有很多意见,大家都觉得这个太难了,现在还不到时候,所以当时从国家没要到钱。
后来李所长就下定决心,从自己计算所有限的经费里挤了100万,先在所里立了一个内部课题,鼓励年轻人来做CPU,这时才有了我们龙芯课题组。
真正做起龙芯来时,我们才发现,做CPU不是爬一座山,而是爬N座山,这些山大概可以分成两个群。
一群是来自CPU里的,要做一个好的芯片,做一个性能很高的、用起来很快的芯片,有非常多挑战。
但是,即使做出这样一颗芯片,要放到市场上去能用起来,就意味着外面要打通一个产业链。
得有很多人愿意用龙芯,愿意给它做整机,愿意给它写软件,要有一个繁荣的产业生态,这一群山在某种意义上来说难度更大。
一根头发丝是80微米左右,5纳米就意味着能在头发丝里放16000根线,它能在头发丝这么小的地方走那么多。
一颗芯片里,现在典型的能够在里面放几十亿到上百亿的晶体管,这么多资源在里面怎么指挥,怎么组织分工协调,才能让它发出最大的效力?
还有很多其他的局限性,比如并不是堆得越多越好,它在工作时是会发热的,热到一定程度,它就无法再继续工作。
在这种限制下,又不能无限制地堆,但是又要极限地去追求性能,极限地压榨工艺的潜力,
做前端就是要研究把100亿个晶体管怎样分类组织,要放几个加法器,放几个乘法器,放几个做存储,放几个做寄存器。
这个线路要跟具体的工艺相匹配,比如是要到台积电的7纳米工艺上去做呢,还是在中兴国际的28纳米工艺上去做。
根据不同的工艺,它有不同的物理参数、物理特点,我们要把这两个东西很好地匹配起来。
这里面这么多线,这么多晶体管,只要任何一个出错,就有可能导致整个芯片无法正常工作,所以芯片设计里有很多挑战。
从最早开始,我的运气很好,在2000年进到计算所时,我的导师就是龙芯的总设计师——胡伟武老师。
那时胡老师也还年轻,刚刚开始带学生,当时他从所里揭英雄榜,把李所长立的100万做芯片的前期研究
这是我们最早做的龙芯1号。2000年课题组成立时,一共只有2个老师和十几个学生。包括老师在内,没有人做过CPU,一切从零开始。
但那时大家都非常振奋,非常激动,觉得有这么一个挑战机会非常难得,所以我们就没日没夜地看资料,去做各种设计讨论,然后调试测试。
我的印象特别深刻,因为当时我们在调试一些问题时,经常会发现,如果朝九晚五,下班到点就走,好像有些问题永远也解决不了,始终没有灵感。
这时熬上一天、两天、三天,经常在深更半夜,夜深人静时,一个灵感突然来了,问题就突破了。
所以那时,我们隔三差五地就会熬上一阵,碰到一根硬骨头,就把它熬出来。一年时间,我们就把一个原型性的芯片做出来了。
中科院的领导非常高兴,马上就给我们追加了500万的经费,使得我们能够继续往下做。
2002年8月10日凌晨6点08分,这个芯片正式调试成功启动。胡老师也很高兴,登录到系统里,输入了一段话。
大概意思就是说,今天我们中国信息产业无芯的历史结束了,在场的人们见证了这个过程。
现在我们回过头去看,这个芯片还是一个很粗糙的设计,但是重要的是那时能有去做这件事的勇气。
而龙芯一号出来后,大家信心大涨,我们从国家那边,从863项目又得到了支持,继续做龙芯2号。
那时国际上已经做了几十年芯片了,我们从零开始,还有很多有差距的地方需要追赶,
所以我们做了很多计划。我们把国际上先进的技术一个一个拿来研究,研究透一个做一个,就是用小步快跑的策略,做了一系列的芯片。
但是,我们一开始就碰到一个很大的挫折。龙芯的第一个芯片叫2A,它拿回来后是“半身不遂”的。
这个芯片只能在电压很小的范围内工作,高了不行,低了不行,一没达到我们的要求,就用不起来。
最后追究原因时发现,是我们对物理参数,对工艺的理解不够透彻,因为我们都是做计算机出身的,工艺更需要做微电子和做物理的人。
所以我们当时从微电子所引进了黄令仪老师和他们团队,就慢慢地把这块短版补上了
再接下去,就是把一个个先进的技术往龙芯2号里面堆,努力地去追赶国际先进技术前沿。
2007年,芯片863验收时,我们做出来的芯片已经比1号快了一个数量级以上,也就是10倍以上。
在龙芯2号做到一定程度时,我们觉得这个芯片已经差不多了,从很多参数来看,我们的确跟当时国际上最好的一些芯片相比,也没有很大差距了。
核高基就是核心电子元器件高端通用芯片和基础软件,就是为解决我们缺芯少魂的问题开设的。
我们从核高基那边拿到了两亿多元,看上去是一笔巨额的经费,然后就开始做龙芯3号。
就是我们在一个芯片里,同时摆好几个CPU的核心,让它能够同时独立地做好几个不同的程序,这样能够增加程序的吞吐力。
当时主流的个人电脑还是单核或双核,但我们上来就给3A1000就设计了四核,3B1500设计了八个核。
但是事实证明,我们走了一个很大的弯路。因为首先,多核芯片本身的技术很复杂,一下规模大增,各种测试验证的复杂度都大了很多。
但是这时拿到市场上一看,特别是桌面上的用户会说,感觉好像跟你三年前的龙芯2号也差不多。
然后我们一看,坏了,是我们的指标体系出了很大的问题,这就是我们做科研的一个毛病。
当时那些峰值指标确实已经是世界的领先水平了,但是,能表现出来的,在应用软件能享受到的,还只是其中的一个核。
那时很多软件是为单核写的,它用不起那么多核,就像有一堆小学生,也并不能做一个大人能做的事情。
3A/B2000,我们用完全一样的工艺,只靠设计,就把它的性能提高了三四倍,到今天最新的产品,已经足足提高了15倍以上。
我们也注意到,从用户能体验到的性能,比如打开一个很复杂的文档,在原来3A1000的时候要33秒,到3A/B2000的时候就只要6秒了,到现在鼠标一点就可以瞬开。
当然,目前我们离最新的国际最先进的技术还有点距离,但是很多距离是来自于我们用的工艺。
这是因为我国在工艺这块仍然是一个短板,我们不敢用国际上最先进的工艺,担心随时被掐。
但在这一块,应该说我们已经具备了一个很好的国际主流水平,进入了一个新的创新空间。
当时很多专家认为我们做不了芯片,不是说我们做不出那么一颗东西来,而是觉得这个东西无法把外面的产业生态做起来bob半岛在线登录。
简单地说分为两个部分,一个是得有人愿意来做你的芯片,就是他用你的芯片去做机器,然后去卖给用户。
另外一方面是电脑和别的东西不同,电脑上要跑软件,上面得有丰富的软件,用户觉得东西好用,他才会买。
所里2004年在江苏省建了一个龙芯产业化基地,2005年把我派过去,因为那个基地就在红色景区沙家浜旁边,所以我们叫南下沙家浜。
因为我原来是天天坐在实验室里的研发人员,到那边去要负责产业化,就是脱离了自己的舒适区。
我要去说服别人,展示龙芯有很多优点,让大家用,然后从别人那边收集反馈,有哪些方面不行,想办法去补。
作为芯片设计人员,我要想办法把我看到的问题反馈给芯片的改进团队,然后想办法帮助下游的企业,解决它的问题。
我还要去招人,要去管团队,这些工作对我来说都是勉为其难,赶鸭子上架bob半岛在线登录,但是既然做了,我们就一定要把它做成。
我们首先要在那里把要做的事情分为两步,一个就是我们把实验室的龙芯样品,变成一个可以稳定地批量生产的产品。
这一点并不容易,最早的芯片是研究所做的,很多时候研究所没有产业化的经验,想不到很多东西。
比如我们最开始拿芯片去找别人生产,别人说你给我一个手册,不好意思,手册还没写好。
这个东西稳定归稳定,但是如果慢得像蜗牛一样,或者乏善可陈,那也没有人买。
所以我们要想办法去找一个市场,可以体现出这个芯片的优点,能够让用户心甘情愿地买单。
我们走过一个很大的弯路bob半岛在线登录,如果当时我们对产品生态的理解能够更好一点,也许就不会走那么大的弯路,不至于在单核明明还有很大提升空间的情况下,就先放着了。
想单单在产业化基地里零敲碎打地找一些人来做合作,找到几个零碎的市场站住脚是不够的。
但是就在这个情况下,也有像苹果等公司,仍然有它的一席之地,它的MAC电脑很多人都爱用。
也在短短的几年内,做出一个自己的很大的移动生态,所有手机都用它的操作系统,它们是怎么做到的呢?
就像谷歌,它的很多软件都是开源的,源代码直接可以下过来,大家都可以用,包括它的移动操作系统。
所以所有厂家就蜂拥而上,大家都去用它的系统,一下就把诺基亚打成了过去时。
也有很多值得学习的地方,它十年前的电脑拿到现在,来也还能跑今天的软件,今天的电脑拿到十年前的软件,装起来也还能用。
这些东西很大地减少了整个产业链的损耗,这样产业链的人就会愿意用,因为这个东西不会总是改,不会浪费很多时间。
还有更重要的苹果,它的iPad很好用,但其实iPad在最早开始出来时,它的芯片论运算能力,其实和英特尔当时的好芯片差距还是很大的。
因为我们早期性能不太够时,也不得不去做很多各种软硬件协同的优化,然后发现这里面的空间非常大。
但是我们后来经过对软件对硬件,两个合起来做了优化后,速度提升了几十倍,用起来时,有时感觉比PC还快,这就是一个典型的例子。
围绕着这六字方针,我们足足花了20年的时间,一点点地把自己的生态从无到有建立起来,从有到越来越优化、越来越好。
前段时间,我听到一个同事在说,领了一台3A4000的笔记本拿来日常办公,都没想到有那么好用。
应该说我们从0%到1%,就是这两年发生的事情,这两年整个国产的链条都发展得非常快,龙芯从端到云,有一个产业生态体系。
我们2020年已经卖了超过100万颗龙芯的芯片,这些芯片很多都用在非常重要的领域。
我们已经走上了一条发展的快车道,我们耳熟能详的整机厂,像联想、同方、方正、浪潮、曙光,这些我国最大的厂商,现在都在卖它们牌子的龙芯电脑。
龙芯选择的是一个HARD模式,即非常难的一种模式,走的是高度自主的路线。
因为CPU有很多种做法,我们可以去买一个别人现有的设计过来bob半岛在线登录,只要花钱足够,也有人能卖给你一些CPU设计。
也可以买别人CPU的指令集授权,然后自己做芯片,买别人指令集的用处就是借用别人软件的生态,即别人已经做好的软件。
借助别人的东西,可以快速地达到一定的发展效果,但是最终要想实现自由,还是要掌握自己的能力。
在这一方面,我们付出了很大的代价,过了20年,才拥有一点点规模,相对于现在成熟的几千万一年的生态还是很小的。
有一个这样的起步,相信我们会走得越来越快,越来越能展示出我们的后发优势。
我们在什么地方都没有黑盒子,可以非常容易地解决问题。无论问题在哪个地方,都可以把它抓出来解决掉。我们还可以做各种创新。
我的导师的导师夏培肃院士,是整个国家计算机的创始人之一,她是做两弹一星的计算机的专家。
到我们这一代做龙芯,包括我们计算所做的其他的项目,比如曙光机等,都是这样,