第153章 中美两个阵营,在这一刻彻底开始分道扬镳(第2页)
与孙伟一样,这个时候很多网友都训练和完成部署了属于自己的语言模型,并完成了第一句对话。
“这不对呀!”其中一位叫郜鸿宇的网友,是一位专业人士,原本就是从事ai训练相关工作的。
在得到了小沙的更新后,也是第一时间按照新手教程进行了相关的操作。
“郜神,怎么不对了这对话不是挺好的吗”一群人问道。
虽然大家都看出来了,这新训练的模型和小沙比当然差的很远,甚至别说些小沙了,任何一个能叫出来的名字的ai都比它要强。
但是,郜鸿宇是怎么训练出来这个东西的,大家可是都看着呢。
一共就一张英伟达rtx4090的显卡,训练的时间也不长,到现在也两个小时。
能流利对话已经不错了。
“就是这样才不对啊!”郜鸿宇说道:“你们没有训练过ai你们不知道,ai训练出来的第一个版本,对话那都是牛头不对马嘴的,因为每一个词都是根据概率算出来的。
“各种反馈决策精调,无数次的循环之后,才能达到现在这样的效果,可是这个,这才第一个版本啊!
“不管它接话怎么样,它说的话,我们能看的懂了你敢信”
“哦!”一众看直播的网友瞬间松了一口气,原来郜神说的太强,而不是太差。
有人当即就问了:“以往你们训练到这样的程度,那需要多少次循环”
“百万量级!”郜鸿宇没有说具体的数字,而是说了一个量级。
“嘶!”一众人都震惊了,这也差的太多了吧
“小沙小沙,为什么会这样呢”郜鸿宇干脆问起了小沙。【在呢,中文寓意丰富,相同数量的token能够表达更加丰富的语义。在ai训练中这是得天独厚的优势。
【仅凭此项,相比于语义贫乏的语种,就能节省30%以上的算力需求。
【而在小沙的专业能力增强下,基础模型的训练是几乎不消耗算力的。】
小沙的伊始郜鸿宇听明白了,这跟更新日志的描述也正好对上了——就是越简单的模型,节省的算力就越多。
80%的能力就只需要20%的算力。
自己训练的这个,那就是一个玩具,0.1%的能力都没有,那算力需求几乎就直接可以忽略不计了。
别说自己有一个4090的显卡,就算没有,集成显卡,甚至cpu里的运算器搞搞可能都够用。
……
可不止郜鸿宇一个人发现了这一点,国内外无数的专业人士、相关机构也都第一时间对小沙的这次更新进行了相关的评估。
评估的结果……
看看英伟达的股价走势就知道了:北亰时间10:30开盘下挫2.7%,这还算是正常的波动。
但仅仅十分钟后,小沙更新版本的消息发酵,虽然这个时候都还没有人知道这个新版本的具体性能,但影响已经出来了:
盘中直接崩了12%,两个小时后,小沙新版本的能力得到了验证,直接闪崩了17%,仅仅两个多小时,市值蒸近乎三分之一超万亿美元。
而这个时候,新自由党的第二次紧急会议仍然在进行,已经开了整整十几个小时。
黄仁勋和纳德拉一样,已经开始咬牙切齿了。
小沙的存在过往对英伟达的影响是不大的,甚至有些时候影响还是正面的。
毕竟小沙那么强,就算你知道它的训练成本很低,但是其他人是没有办法用的。
阿美莉卡这边要想超越,那就必须使劲儿加卡,像openai,这段时间光是买卡就给英伟达贡献了几百亿美元的营收。
但是,今天,这完全不一样了!
英伟达一直鼓吹的力大飞砖的方案彻底被戳破,好不容易讲的一个几万亿美元的ai故事,被白驹科技这么一搅和,也彻底的鸡飞蛋打了。
黄仁勋看了看阿尔特曼,而阿尔特曼此时也正好看向黄仁勋,两个人在此刻交换了一个眼神:怎么办
“我们是一定不会使用小沙的相关能力的。”阿尔特曼当即表态。
黄仁勋心说,你废话,用小沙的能力,别人也得让你用才行。
而且,小沙的能力也不是全部开放,利用小沙训练的ai,能力只能达到除小沙之外当今世界最先进水平的120%,这离小沙远着呢,甚至都远不如新人类。