【知乎】聊聊为何不全面推龙芯以及龙芯占有率为何较低
聊聊国家为何不全面推龙芯以及龙芯占有率为何较低


你赞同过 TA 的内容
目录
收起
省流概括
一、国内有没有推广过龙芯?
二、国家推龙芯的意义何在?
三、龙芯自身存在的问题
3.1、夸大的性能宣传&低频下高IPC的意义不大
3.2、指令集知识产权问题
3.3、战略规划能力低下
3.4、坑合作伙伴和客户
3.5、龙芯胡老板喷友商
3.6、狂热的粉丝
3.7、对历史兼容性不负责任
针对知乎龙粉一直反复各种提问,典型的比如国家为什么不支持龙芯,为什么兆芯、飞腾活的那么滋润等等,针对这些问题本文主要对龙芯过去进行一个总结(截止2023.12),尝试解析下其中的一些问题。通过问题也希望3a6000出来后龙芯对自己已犯过错能有所改善,也希望国产CPU早日走出政务和信创的温室,能够真正参与市场竞争。
省流概括
1、国家实际上推广过龙芯,尤其在2020年及以前,信创市场刚刚起来的时候,给予了龙芯非常大的支持,一期二期信创市场占有率龙芯宣传达到70%(当然龙芯宣传可能有水分,但是占大份额是板上钉钉的)。国家予以支持的时候,龙芯做的并不好,主要出货以3a3000、3a4000为主,性能比较低下。简单概括就是给了机会,但是由于自身技术原因,没拿住。
2、目前芯片问题主要是芯片制造问题,而不是设计问题,而龙芯目前的出货量无法帮忙解决芯片制造问题(龙芯一年桌面服务器CPU也就百万级片芯片,甚至可能不到,也就一条芯片产线一周的量),龙芯也没这个能力去攻克芯片制造问题。而自研指令集难度并不大,比如RISC-V指令集第一个版本就4个人搞了3个月设计出来的,而且我们是世界工厂,全面推广LoongArch势必导致信息化类设备国际竞争力下降,国家推它意义在哪里?简单概括就是芯片行业核心问题龙芯无法也无能力参与解决,国家推他没意义。市场竞争来决胜负更有意义。
3、龙芯自身问题过多,主要包括:
(1)、龙芯性能存在普遍夸大的情况,包括3a6000,实际只有10代酷睿10100的75%性能,对外宣传达到10代酷睿水平(别急着反驳,后面有详细数据分析);其次x86翻译性能早年吹的80%指标迟迟无法兑现,实测翻译性能只有30%左右;性能唯IPC论,实际上CPU厂商一直有“头脑家(brainiac,高IPC)”与“速度魔(speed-demon高频)”之争,龙芯在频率极低的情况下过分夸大高IPC的实际意义;
(2)、虽然号称自研指令集,但是却是国产CPU厂商中指令集知识产权纠纷最多的厂商,2010年左右就涉及MIPS指令集纠纷,再到2019年和芯联芯的纠纷,最后新的LoongArch指令集直至今日,仍然不敢公开指令集卷2、卷3(主要涉嫌x86、MIPS指令集侵权问题);
(3)、战略规划能力低下,LoongArch一个新指令搞出新旧两套无法兼容的生态,其次明明新世界是未来,为了眼下利益,仍然主推旧世界;
(4)、其次很爱坑合作伙伴(典型的比如7A1000有三个电路都不兼容的版本;3a4000、3a5000的库存把合作伙伴坑惨了),整机、板卡等硬件厂商目前不太愿意推广龙芯;3a4000为MIPS生态、3a5000和3a6000存在不兼容的新旧世界生态,3个产品3种软件生态,坑软件合作伙伴,更坑用户;
(5)、龙芯老板老胡的那张大嘴巴,得罪太多人了(最经典的应该就是公开出书喷兆芯,把兆芯喷成买办无研发能力,喷的一无是处);多次公开撕兆芯和飞腾,但是按照龙芯标准,理论上应该海光最符合买办标准,但是这位胡老板居然不撕海光(答案可能是他们都是中科院下面的),如此双标,是否影响胡老板为人耿直的人设?
(6)老板老胡带头肆意攻击友商,导致粉丝有模学样,以一己之力,形成了龙芯VS其他国产芯片厂商(兆芯、飞腾、华为海思等)的局面;在龙粉嘴里,华为是买办(不知道菊花粉和米粉听了是什么感觉);
(7)过于频繁的技术侧调整,对历史兼容性不负责任;
一、国内有没有推广过龙芯?
答案是推广过,我们先来看一下2019-2023Q3各家公司销售额,在2019年,龙芯销售额是国产几家公司里面最高的,其中海光那时候主要还是以服务器为主。甚至那时候龙芯多次宣传自己在信创市场占有率高达70%。
从销售额上看,确实有可能,2019年龙芯销售额在国产厂商中占有率最高,而海光更多是x86服务器领域,所以实际上在信创市场尤其是桌面市场龙芯的占有率是非常高的。
2019年2020年2021年2022年2023 Q1-Q3海光3.79亿10.22亿23.1亿51.25亿39.43亿飞腾2.1亿13亿22.18亿16.3亿4.96亿 (H1半年)兆芯-----龙芯4.85亿10.82亿12.01亿7.39亿3.94亿
龙芯在信创市场2019年市场占有率70%的新闻稿有很多:



二、国家推龙芯的意义何在?
目前国内芯片核心问题为芯片制造,尤其是先进芯片制造工艺。先进芯片的产线投资在百亿级规模,龙芯目前资金过少,无力参与芯片制造业。目前主要参与芯片制造业的设计厂商只有华为海思,所以国家会优先扶持华为海思。
1、龙芯出货量稍,对芯片制造业意义不大:通过龙芯目前销售额预估,年销售LoongArch类CPU的数量应该是百万级规模(甚至可能不到,龙芯在上市前销售主力一直是MIPS芯片),其中3a5000 die面积为147mm^2,3a60000 die面积为120mm^2,换算成12寸晶圆大概是小几千片,占一条产线的一周的产能,整体规模过小,对国产芯片制造工艺提升意义不大。
2、自研指令集并没有想象的复杂,工作量也不大:而龙芯目前最引以为傲的是LoongArch自研指令集,先不说这个指令集存在知识产权风险的问题,就指令集设计本身来说,并不复杂,参考RISC-V:仰望星空:关于RISC-V技术发展调研报告

3、我们是世界工厂,全盘推龙芯会弱化国际化竞争力,信息化设备也是一个很重要的出口项,而全盘推广龙芯无异于自绝于世界,对我们出口是不利的。
国家不推广也并不意味着龙芯会消亡,国家目前对于国产CPU这一块实际上是以扶持为主,从龙芯财报看,国家也一直有资金扶持,另外目前的信创市场也是对国产CPU厂商的扶持,最后谁能胜出由市场竞争来决定更合适,而不是靠行政命令。
注意:这不代表龙芯没有存在的意义,LoongArch架构存在的意义是中国人也可以设计出一套合格的指令集,并且利用这套指令集自研出性能初步合格的芯片。
三、龙芯自身存在的问题
3.1、夸大的性能宣传&低频下高IPC的意义不大
1、3a6000真实性能
近期龙芯3a6000发售后,我对3a6000的性能也进行了比较详细的评估,总结几点:
详细参考我的另外一个回答:龙芯3A6000发布,性能各方评价不一,是谁在造谣?
(1)、诡异的10100跑分:发布会上3a6000的官方spec 2006 int speed成绩为43分,10100成绩确有两份,一份是龙芯官方的43分(3.6Ghz),另外一份为华硕的47.5分(4.3Ghz),龙芯官方和其粉丝极其擅长用这种很容易混淆的数据,一旦读者对10100实际性能不熟悉,就非常容易误认为3.6Ghz下的43分就是10100的真实成绩;
华硕Tony大叔在B站的视频,截屏显示10100 跑分为47.5:
国产最强!龙芯中科3A6000台式机CPU性能测试_哔哩哔哩_bilibili

龙芯发布会,同样是这个Tony大叔,跑分变成了43.6分,同时10100频率变成了3.6Ghz:
华硕主板助力龙芯3A6000发展((发布会切片)_哔哩哔哩_bilibili

接下去还有更精彩的,龙粉Guee居然用H510低端主板+风冷测出了10100 48.5分的成绩:
Guee承认上述链接是他自己的测试,在这个测试中,他承认上述链接是他测试的数据:
所以,龙芯可能只能用一句话形容:只要我性能造假不尴尬,尴尬的就是别人
(2)、夸大的3a6000成绩:guee分别通过开启微架构优化将35分的成绩提升到40.1分(这里不是说不能开微架构优化,而是如果龙芯开了微架构优化,其他CPU也应该开,如果其他CPU没开,那龙芯也不应该开微架构优化),再使用龙芯官方提供给测试机的spec将40.1分提升到42.9(spec是评测工具,是开源的,这种工具由厂商提供交付件不合适,打个比喻就是举重运动员举起杠铃后,杠铃多重不应该由运动员的教练提供的工具来称)

(2)、OpenBenchmark网站上20项测试分数显示3a6000只有10100的76%性能:Loongson-3A6000 vs. Intel Core i3-10100 Benchmarks
(3)、旧世界下不开启微构架优化3a6000的spec 2006 int speed为35分左右;在新世界下,3a6000使用开源的GCC12/13来评测,目前有多人进行了spec 2006 int speed评测数据,均低于35分(32-33分为主,新世界目前还没有la664微架构优化参数,所以也没法开启微架构优化):

2、夸大的x86翻译性能
比如龙芯在早期PPT过x86翻译性能要达到80%,但是实际执行的时候发现翻译效率只有30%


3、低频状态下高IPC意义被夸大
龙粉目前极其擅长的是夸大龙芯3a6000 高IPC的优点,认为龙芯设计能力直逼Intel酷睿12代,但是实际上高IPC和高频一直是CPU设计界的两个争议点,所以CPU领域形成了两派:“头脑家(brainiac,高IPC,以ARM、苹果为代表)”与“速度魔(speed-demon高频,以Intel、AMD为代表)”,当然国内实际上也有类似争议,比如龙芯高IPC,但是兆芯目前走高频路线。
两种方式实际上都可以提升芯片最终性能。但是ARM、苹果虽然是高IPC的代表,但是实际上频率并不低,比如苹果M3达到了4Ghz。同时我们研究苹果可以发现,苹果高IPC路线貌似越来越难走下去,如近期发售的M3在测试中发现综合IPC居然比M2下降了(频率从M2的3.5Ghz提升到M3的4Ghz,提升0.5Ghz,工艺从5nm提升到3nm):
通过微架构逆向分析,也可以发现比如M3的L1缓存从原先的3周期,变成了M3的4周期,高频设计带来部分设计项延迟加大,这个很难避免。所以回到龙芯,龙芯实际上也很难做到保持现有IPC的前提下大幅度提升频率,很可能也和苹果类似,后续提升频率时,为了高频放弃一些高IPC设计。
3.2、指令集知识产权问题
芯联芯的知识产权纠纷主要由两点:
1、龙芯招股书中说2021年前MIPS占销售额的70%,但是龙芯交给MIPS的专项授权费用过少


2、LoongArch指令集涉嫌MIPS指令集侵权
虽然官司胜了,但是也影响了龙芯的后续决策,最直接的就是LoongArch指令集的卷2、卷3直到现在仍然未公布。目前推测卷2和卷3指令集很可能涉嫌x86指令集侵权、MIPS向量指令侵权(芯联芯在公开采访中希望龙芯尽快公开卷2、卷3指令集,x86主要是翻译指令可能侵权)。龙芯在2022年曾经答复2023年开放卷2、卷3,但是从目前看,毫无疑问,放鸽子了。
所以从目前看,向量指令和翻译指令这一块仍然存在风险,不排除龙芯会再次调整LoongArch向量指令集。


3.3、战略规划能力低下
龙芯早期实际上是推广MIPS指令集的,并且宣传MIPS指令集自主可控,没有卡脖子的风险?所以这里就有问题了,既然无卡脖子风险,为什么要改指令集?目前推测唯一可能成立的应该是2019年和芯联芯的那场知识产权纠纷,导致龙芯仓促推出LoongArch指令集。

推出LoongArch指令从现在回头看,并不属于龙芯原有的战略规划,否则3a1000就应该是LoongArch。而在推广LoongArch的过程中,龙芯也没有非常好的规划去做这个事情,甚至前期适配LoongArch时,都是拿MIPS相关代码做修改适配,甚至发生合入Linux适配代码被内核开发者吐槽代码和MIPS的没区别,是MIPS的拷贝:
Re: [PATCH V3 08/10] irqchip: Add LoongArch CPU interrupt controller support
> > > We are preparing to add new Loongson (based on LoongArch, not MIPS)
> >
> > You keep saying "not MIPS", and yet all I see is a blind copy of the
> > MIPS code.”
也因为推出LoongArch指令集是临时行为,导致给后续生态埋了一个巨坑,LoongArch一份指令集产生了两套完全不兼容的ABI(龙芯官方写的那份基本可以理解是在MIPS的基础上魔改了下,开源社区无法接受这种行为),龙芯业内称为新世界和旧世界:
旧世界是指最早在龙芯中科内部适配的、随着 LoongArch 公开一并发布的那个 LoongArch 软件生态。 新世界是指龙芯中科与社区同仁一道,以典型开源社区协作模式打造的,完全开源的 LoongArch 软件生态。
旧世界是Linux老内核,GCC主要为8.3版本,新世界是开源维护的Linux新内核,GCC为12/13版本为主。所以毫无疑问,新世界代表未来,但是龙芯官方截止目前(2023.12)仍然坚守旧世界,这不仅仅给这个弱小的生态是个重大打击,也在给未来埋下一个巨坑(客户的软件基于旧世界改造,意味着有一天如果切换到新世界,所有东西要重新维护一次)
3.4、坑合作伙伴和客户
已知的有这么几个问题(部分行业人应该很有共鸣):
1、7A1000桥片多次改电路设计,总共存在3个不同的版本,甚至连电路都互相不兼容,把给龙芯做主板和整机的ODM、OEM厂商坑的半死;实际上7A2000也有好几个版本,但是情况没7A1000恶劣;
2、3a4000、3a5000一个是MIPS、一个是LoongArch,指令集的调整节奏过快,完全没有给市场反应时间,而初期LoongArch指令集生态极其糟糕(现在有改善),导致市场并不接受(从一期二期信创市场龙芯遥遥领先,到了后来占有率迅速下滑可以看得出来)。直接导致供应商手里囤积了大量的3a4000、3a5000(这个从龙芯近期的财报也可以看得出来,龙芯财报的库存一直是高位),所以到3a6000发售的时候,大品牌的整机厂商基本都不愿意主推龙芯了。
龙芯也开始捣腾白牌整机和白牌服务器,至于原先整机厂商的库存怎么办,显然龙芯也不愿意去解决这些问题。
商业市场的逻辑实际上很简单:合作伙伴能赚到钱,那么合作伙伴就愿意推你,你坑合作伙伴,合作伙伴为什么要亏本买你的芯片,压自己的库存?
对于客户侧,一样的,龙芯推出LoongArch指令集后,MIPS指令集成为了弃儿,龙芯官方人力本身就不是非常足,而重心全部调整到LoongArch后,MIPS相关软件维护能力必然下降,而2019-2021年5000出货前,卖的重头全部是MIPS,客户目前的处境就是3、4年前花了重金买的电脑硬件性能烂就算了(虽然那会大家都烂,但是耐不住龙芯那会卖的特别多啊,70%市场占有率),软件基本没人维护,可想客户体验是怎么样的。
所以如果你是之前的那批客户,你会继续选择龙芯吗?
3.5、龙芯胡老板喷友商
胡老板的嘴巴业内应该是人尽皆知,各种公开场合撕兆芯和飞腾,但是很少看到他撕海光,不知道是不是都是因为中科院的原因。实际上如果他撕海光我还看得起他,说明他为人真的正直,海光在几个国产CPU里面明显是外资比例最最高,甚至连IP都是AMD给的,明显应该最符合龙芯嘴里的买办的角色。
但是很是奇怪,这位胡老板就是不喷海光,如此双标实在让人怀疑他是否因为真的是为了国产CPU进步才撕兆芯和飞腾。
早年和兆芯因为核高基问题吵架,这位胡老板还为此专门出书。嘴炮实际上不是关键,关键是他自己的嘴炮实际上经不起推敲:
1、兆芯早期是有半人马的研发队伍,但是国内也是有研发队伍的,而且国外团队规模实际上并不大就100人左右,国内研发规模比国外要大的。但说兆芯不可持续实际上也有点以静止眼光看问题了;
2、对x86授权理解错误或者说故意带歪,虽然via和Intel的交叉授权2018年到期,但是这并不影响兆芯使用老的x86指令集,甚至都包括avx512,十年内足够用了,十年后兆芯要是水平上来了,完全可以通过再次签订交叉授权解决后续知识产权问题;
3、对自己过于自信,以静止眼光看待友商,比如3a2000出来后,老胡就发现对手频率比自己高了一倍,综合性能比自己强(这可能就是典型的说假话,把自己先骗了,他认知兆芯没有研发能力),3a2000不行后来是寄托3a3000了;




3.6、狂热的粉丝
在胡老板的带头下,龙芯粉丝也极其疯狂,日常撕兆芯、飞腾的我就懒得发了,几个贴吧天天吵架,知乎上也有无数帖子龙粉撕兆芯和飞腾的。我就发下华为海思的,来看看华为是如何被打为成买办的(我截图的基本都是龙芯吧活跃人员,可以从龙芯吧等级只管的看出来,而且这不是龙芯吧少数派观点,而是主流观点):

关键在于这帮粉丝除了日常辱骂,更是将造谣和歪曲事实发挥的淋漓尽致,典型的刚刚性能那一块打假过guee,此人极其擅长制造一些看着很真的谣言:
1、揭露Guee几个惯用的伎俩
(1)、比如关于10100的性能,他自己实际上也用低端H510主板+风冷测试出过spec 2006 int speed 48.5的成绩(性能那一块有链接),也用降频的方式测试出过43分,还用高端的Z490+水冷测试出过49.X成绩,但是对外数据只用43,被人质疑了就提中高端主板+水冷也可以测出49.X,绝口不提低端主板+风冷10100可以到48.5,比如贴吧被质疑10100,此人是如此回复的:

(2)、另外此人恶意丑化新世界GCC12/13编译器的问题(而且他本人实际上知道是怎么回事,而且字节对齐问题开启-mstrict-align现象就消失了),他经常用如下的一张图来告诉其他人GCC 12/13版本编译器对龙芯存在极大的负优化,但是实际上这就是个内存数据未对齐导致的数据要经过寄存器绕一圈,但是他的部分代码又被编译器认为是无意义代码,部分汇编又被编译优化掉,然后形成了极大的反差:

因为这本质是个编译器内存对齐问题,所以我可以用最简单的修改让LoongArch的汇编代码最少,如将4字节的float改成8字节的double或者8字节的long long,LoongArch汇编代码量就是最少得那一个:


关键此人用这张假图忽悠其他人,帖子被删,居然还发帖恶人先告状说回复被删:唉,某人测出3A6000只有三十几分,我就发个回复也被删。【龙黑吧】_百度贴吧
另外为什么我说他知道这个事情,可以参考帖子:回复:LA的GCC编译器还有极大的优化空间(高情商)【龙芯吧】_百度贴吧

(3)、又比如在知乎上反复造谣兆芯没有研发能力,结果2023.12.12兆芯发布了3.7Ghz的KX-7000,如果没有研发实力,不可能做得到KX-7000的迭代(形成鲜明对比的是龙芯6000频率和5000一模一样的2.5Ghz,连续3年没任何提升)
这一块知乎已经有人用技术文章进行打脸,确认兆芯是有CPU独立研发能力:有言以对默无声:兆芯X86 CPU架构的发展(国产CPU系列)
目前龙粉们还在继续造谣,认为KX7000是半人马CNS的遗产,造谣兆芯没研发能力。当然这个谣言能造的时间也非常有限了,等KH50000超线程出来相信会狠狠打这帮人的脸。
(4)、还比如反复造谣兆芯核高基获取了政府侧70亿资金,但是实际上核高基及上海政府资金兆芯拿到的是57亿,这57亿分三部分:核高基的15.6亿、上海政府15.6亿,剩余部分企业自筹。
所以关于核高基部分,guee最少有这么几处造假:
a、虚假抬高了总资金,从57亿抬到70亿;
b、故意漏掉企业自筹部分的25.8亿资金;
c、故意漏掉57亿资金还包括CPU、整机、操作系统(应该是中科方德)和工艺,兆芯实际上主要拿的是CPU部分的钱,所以实际拿到的比57亿小很多;


总结下就是:此人极其擅长用一些看着比较真的数据或截图来混淆视听,达到抬高龙芯贬低友商的目的。
3.7、对历史兼容性不负责任
龙芯在芯片的历史兼容性问题上做的极其糟糕:
1、之前提到过的7A1000,有3个不同电路版本的7A1000,完全不考虑下游板卡、整机厂商调整成本
2、3a4000 MIPS生态,3a5000、3a6000 LoongArch旧世界,开源是新世界,明明3a6000发布时有机会可以切换到新世界,但是为了短期利益,仍然选择旧世界。为后续客户埋下巨坑。
编辑于 2023-12-17 20:13・IP 属地浙江