AIGC的热度会下去一段日子吧?
OpenAI给出的微调模型价格足够便宜,是亚马逊的几分之一。又做出了多模态。又要令其能够访问网络。作为作坊应用、细分领域、消费市场什么的,都尽可以买来调用它了。然后大家又会经它培育的口味,反过来看待和要求其他大模型。总之,对于熙熙攘攘的小客户来说,可能是这么一种感觉:买有可用之余,以买菜心态、去挑捡看看更便宜的。大家合流在一起,买办思维一定是主流。
对于有专有知识的客户,不愿意将知识上传OpenAI这样的“外面”去微调大模型,那么就会重度运用向量数据库和AI应用框架。
两个问题。一个是做向量化步骤的那个模型,目前只做文字、文章这些的。对于专有知识来说,一样也需要声音、图像、视频都来向量化。否则有点限制了应用。
沿着第一个问题的方向想下去,有第二个问题,大致类似于知识碎片不容易统一的检索。能分别处理声音、图像、视频向量化的仨网络,他们的知识空间不同,产出的向量维度不一定相同。直接求取数学距离,就可能会张冠李戴、李代桃僵,甚至错过本应搜出的知识特征。
知识空间难辨别和统一,就又需要一批小模型或者layer去缝缝补补。一个特征,要经多道模型的“口口相传”去传译,这个技术路线做下去,会堆成模型的“屎山”。
其他,图像、声音向量化的“颗粒度”问题。与文字能明确的切分开再做对应不同,图像或声音的整体与细节越细越丰富,token长度不一。这种事情也是技术前沿的难题。在研发的技术,亏钱烧钱的风险是周知的。
于是,AIGC的热度会下去一阵子。几个方向的问题都在挡住应用落地。在专有知识的转化上,有困难。只适合于能文字化的知识做向量数据库。在应用上,有买办的枕头,动力也有但是不红。在投资方面,是继续面对只有高风险的研发,会逐渐重视资本而抑制技术热情,而成为又一个类似集成电路的赛道。地缘政治影响会吹来融资寒风。
怎么看怎么觉得我们现在做的事情是对的。盼望我们的芯片顺利开启一个好局面。