第197章 山一样的压力

作品:《星金道长:我把行星当金矿

    “外面已经彻底疯了。” 吴军先开口,语气平静,却不再掩饰自己的焦虑,“CERN 主任在发布会上说,你一人把人类基础物理往前推进至少五十年。理论物理界把你捧成新时代的开创者,所有人都在等你下一步,等你拿出真正配得上‘剑仙院士’四个字的东西。”


    林野轻点鼠标,将完整的性能曲线、算力参数、功耗曲线全部铺开,为了这款 CPU,其它的设备比如新型室温超导材料的约氏环在显示器上的应用已经暂时放下,团队暂时无力顾及,只有少量几人在做,进度缓慢。


    他目前使用的还是传统显示器。


    “你刚刚分析的很明白,单颗性能达到现有 i9 的一千倍没问题,但再强也就那样了,极限的百万倍性能根本发挥不出来。想发挥出极限性能,只能按照传统超算方式搭建,它可以上万个堆叠、上万个扩展,再加上超导线路降低延迟,理论上算力超过现有数据中心一万至一百万倍不等。”


    吴军说到这里,林野也轻轻皱了皱眉,他很清楚,这不是世界想要的答案,因为不能马上用上。生产、装配、安装、调试,这样的超算想真正用上,又得等上至少一年。


    简单来说,这只是一个及格分,而不是一个优秀分。及格是因为算力确实强大了,运维费用也确实降低了,电费都要省不少。但是因为没有创新,用的成熟技术、成熟架构,远远算不上优秀。


    吴军看着那串漂亮到夸张的性能参数,没有任何责备,只是长长叹了口气,伸手揉了揉眉心。这一刻,师徒共担压力,一同发愁,虽然是给自己强行加担子的发愁,但他相信自己的感觉没错,此时林野也选择相信导师。


    “我知道。” 吴军声音低沉,“我比谁都清楚,这颗芯片已经足够强,足够支撑无限堆叠的超算集群。”


    “可林野,你我都明白一件事。这个世界,对你的期待从来不是‘足够用’。他们要的不只是可以无限堆叠的传统架构。不只是机房摆满机器,不只是集群扩张占地,那样的功能确实得有,但不够。他们等了一年,等的是:单机算力,直接超越一整座传统数据中心。”


    吴军调出全球三十七座顶级超算中心的并网逻辑图,每一座,都占地少则数百平米,多则数千平米,看着不大,其耗电量惊人,维护成本更是天价。


    “我们现在这颗芯片,就算堆到一万颗、十万颗,它依旧是传统超算的思维,只是更强、更快、更省电,但它没有跨入新时代。”


    “你我当初定下的目标是什么已经不重要了?外面的人等待着的,是单机顶一整个数据中心!是单机并行扩展之后,让整个人类算力文明,直接迈入三体级别的新时代。”


    吴军越说眉头皱得越紧,发愁的感觉也越来越重。这份愁,不是给林野压力,而是给自己、给团队、给整个项目强行加码。


    “我之前就跟你提过架构方向,二进制纯算一体化,三进制纯算一体化,都是为了实现单机极限算力。这些东西,是我们两个人一起在推进,一起在攻坚,不是你一个人的任务,是我们师徒,必须一起扛起来的东西。”


    “现在问题来了。这颗芯片的性能等同于 i9 的上千倍,强不强?强。能用不能用?能用。能不能堆超算?能无限堆。但配不上你,配不上星金科技,配不上搞出 200 万吨极限日产能的你,也配不上全世界一整年的等待。”


    说起来200万吨极限日产能,林野也是无奈,他当初搞出超导硬盘之后,迭代的任务就交给了研发部。他自己一向喜欢量大管饱,于是又回去埋头搞了一段时间晶格生产线,结合异能硬是把50种晶格的生产效率直接拉上了天。


    然后超导计算这边就给放下了,如果提前一年时间就搞出来这块芯片,就不会让外面的人误解,不会让人认为他是在憋大招,不会让人产生这么多的期待感。现在与国家谈好的三万亿投资方向已经完成,但细节还没有全部谈好,面对舆论一个应对不好,后面就会横生无数枝节。


    “全世界现在都觉得,你锁死商用专利、放开研究权限,是在憋神级架构。他们觉得你一出手,就是单机颠覆时代。结果我们拿出来的,是一颗可以无限堆叠、但依旧是传统思维的消费级芯片。”


    “一旦就这么发布出去,全世界不会惊叹,只会哭笑不得,只会说:哦,原来‘剑仙院士’憋了一年,就这?”


    吴军看向林野,眼神里没有太多责备,只有师徒之间共担风雨的沉重,


    “CERN 的物理学家要是知道,他们等了一年的算力救赎,只是一块千倍 I9,能当场气到原地转圈。国家科委的领导要是知道,战略注资星金科技,你先做了个电脑 U,能哭笑不得说不出话。全球超算中心的主任要是知道,你研究出 200 万吨极限超导产能、垄断专利,居然只做了个消费级芯片,能直接被你气笑。”


    本小章还未完,请点击下一页继续阅读后面精彩内容!“全世界都在期待你拿出神。结果你掏出来一个,特别厉害、特别强、特别能打,但依旧只是凡人级别的加强版处理器。”


    “外界把你捧成时代天才,你把超导产能提升到是产 200 万吨震惊世界,把超导计算相关的专利锁死让所有人以为你在憋大招,连我都准备陪你开创时代,可你在算力时代最重要的这一步,居然差点拿着一手王炸,先打出一张最小的牌。”


    吴军说着把调出全球超算中心的名单,上面密密麻麻排列着三十七行机构名称:欧洲核子中心数据中心、德国电子同步加速器数据中心、美国阿贡国家实验室超算中心、费米实验室算力集群、日本理化学研究所超算中心、中国银河超算中心、太湖之光超算中心、星金科技超导存储节点……


    “你现在知道了吧?” 吴军指了指光屏上的数据,“这就是你一直关心的 CERN、费米实验室、国内三组实验的数据处理现状。不是一两个机房,不是几台服务器,更不是你曾经以为的‘舍不得花钱开机、经费不够用’,而是全人类最顶级的算力集结在一起,处理一批两年前采集的存量全精度原始数据。”


    “你的超导硬盘确实打通了 IO 瓶颈,但核心计算速度没有本质突破,整体优化幅度杯水车薪,全套全精度结果出炉,依旧需要八到十二个月。”


    “你知道外面的同行私下怎么议论吗?他们说星晶科技手握室温超导,外加所有提前布局超导计算专利,手握这么大的王牌,居然一年多没有推出超导计算产品,一定是在研发跨时代的技术,一定是在做量子计算与超导计算融合的终极架构,一定是在等待一个颠覆世界的时机。”


    “你知道国科委的领导上次问我什么吗?他问,林野是不是对超导计算有什么顾虑,是不是遇到了什么技术瓶颈,要不要国家再追加资源支持。我当时都不知道怎么回答,我总不能告诉他:林院士没有瓶颈,林院士只是当时没想起来要做,现在在赶进度!”


    吴军说了好一会儿,林野听着头皮发紧。


    他内心构思了好一会儿,问了下吴军:“吴老师,英伟达那边的 cuda 指令集授权谈的怎么样了?”


    吴军按下心中的忧虑,说道:“授权已经谈好了,钱都已经给了,战略合作交叉持股还在等,因为国家那边还没谈完所有细节。”


    林野奇怪了:“那咱们先不说三进制,二进制存算一体架构您这边搞的怎么样了?”


    吴军心里还在发愁,只回答着林野的表面问题:“拿到授权之后,已经加入到架构之中,指令集方面也很容易兼容。虽然数量很多有几千个,但很多存储和读取的指令可以直接空运行,其它的也因为都是并行计算,其实相差不大,兼容起来很容易。”


    林野很奇怪:“吴老师,那你还在担心什么?有了这些我们马上就能搞出原型机来,我看过设计图,虽然有些大,但很多都是重复结构,甚至都不用像CPU一样搞三个月,因为结构更简单,优化起来更快,甚至都不用一个月。”


    “按您之前给我说的,每 2048 个比特就是一个小的原位存算小单元,负责:位运算、掩码、逻辑、定点、加法、乘法、数据搬运。然后每一百万个单元添加一个集中式 64位整数 + 2048 位定点强计算核心。这个架构太厉害了,实际测试时只需要多做几种不同的配置,比如到底是一百万个单元分配一个强计算核心,还是四百万个单元分配一个强计算核心,需要实际测试之后才能确定。”


    “如果这个架构再加上个控制器负责存取指令、译码、跳转、分支、控制上面那两个计算单元干活,再加上外设管理、中断、地址管理,还能当 CPU 用。这已经很bug了!”


    林野说着说着,思路都理通了,他感觉到了不对的地方:“吴老师,您想想看就您的这个架构,再搞成 100 层立体堆叠做成一个芯片,一个边长 10 厘米的立方体里面可以划出多少个这样的小格子来存放这些芯片?你再想想这样的一个东西计算能力该有多强?”


    吴军听着林野的话,缓缓点头,这是一个不复杂的计算问题。


    百层堆叠加上一个芯片的电磁屏蔽也就 0.2 厘米高,其实主要是基板要占 0.1 厘米也就是 1 毫米,百层堆叠的厚度只有几微米,加上简单封装确定为 0.2 厘米高。边长 10 厘米的立方体可以存 10 * 10 * 50 = 5000个这样的芯片,每个芯片使用自己的中高频时钟,芯片内部还可以分区域,区域内使用超高频时钟,立方体全局使用一个 3-10 GHZ 的低频时钟。


    这样的算力相当可怕,每个小芯片约有1万亿个约氏环,这样的一个立方体一共有 5000 * 1万亿 = 5000万亿个约氏环。换算下来,一共有约2.4万亿个小存算单元,根据不同的配置约有 60 - 240 万个强计算核心。再加上约氏环那可怕的皮秒级计算速度,这样的芯片已经足够形成桌面超算了!


    这章没有结束,请点击下一页继续阅读!一边说着,一边内心想着,林野觉得刚刚吴军说的太严重了,自己差点要被吓住。那个 CPU 确实不够格,但这个存算一体芯片一出来,前期直接拿现成的 CERN 的公开历史数据来测试基本功能和基本的稳定性。


    然后再交给 AI 科技公司试跑 AI 大模型推理、矩阵运算、向量数据库、高并发计算等拿到行业顶级认可和真实场景优化建议。


    最后开放给渲染、视频、游戏公司等进一步测试,然后就可以交给国家机构,比如搞气象、天文、基因、医药、国防等高性能计算,这个时候也就是可以商用了。


    然后再把这样的几十个小立方体组合在一起形成更强的超算,说不定可以达到准实时分析腾格里对撞机产生的数据,也就是只需要等待几分钟,当然这个时候系统的瓶颈就是网络了,毕竟现有的多线路并联光纤网络最大也只能每秒传输 PB 级的数据,整个系统花时最久的还是数据传输。


    吴军豁然开朗,他觉得自己最近肯定是压力太大了,居然也陷入了思维误区,他拍了拍林野肩膀:“好小子,你是怎么想到立方体结构的?”


    林野笑了笑,内心有些奇怪:“电影上看的,吴老师,您说超导材料不发热可以搞立体堆叠,但根据我的实际经验,没有支撑结构的立体堆叠做计算也就搞到百层左右,再高计算就不稳定了。倒是纯粹的存储只有简单读写线路,可以搞无脑堆叠,目前我本人在实验室已经在测试5000层堆叠了,还挺稳定。所以我就想着使用外部材料做成立方体的样子,给它上个外部支撑,最终的效果就像是在立方体中掏出一个个的小格子把芯片一个个的放进去,然后再加上线路!”


    吴军默认不语,自己还是被几十年的硅基思维给带偏了,居然想着芯片只能做平面,之前一直在想做成个一米长一米宽的芯片没办法对外交待。


    立方体思维是多么的合适,正好变小了还能轻松拿在手里,还不用平铺出来太大的面积,信号衰减还不算太严重!


    几个月前才说过张京的硅基思维惯性,还毫不客气的批评了对方一番,没想到自己居然也是这样!


    得到导师的又一次肯定,林野笑的很开心,这个结构目前还没有验证,因为传统硅基芯片都是平面结构,但是因为有散热风扇,做成这样的立方体正好还能兼容安装方式。


    做起来其实一点也不麻烦,这是对林野来说,真的不麻烦,立方体结构需要的亚微米级精密制造,正好是林野的强项。他在实验室里做原型,后面从兴航机械厂直接下单订货就行,那里有现成的多台八轴机床!说实在的,主要是平面结构组合成立方体,没有复杂曲面,根本用不着八轴。


    喜欢星金道长:我把行星当金矿请大家收藏:()星金道长:我把行星当金矿更新速度全网最快。