第54章 我觉得纯扯!
推荐阅读:横推武道:从预知机缘开始 长生:我的修仙天赋能刷新 神话:刚成斯文败类,杨婵上门 极光兵魄 长生:皇帝祂疯了 LOL:我真没想决裂啊! 这什么奇葩按钮? 开局牛家村,我和嫂嫂相依为命 港综:我无敌你随意 繁花:阿宝你给我站住,还我钱
“你们怎么看?”
黄仁勋的话音刚落,就有一个声音传出来:“我觉得纯扯!”
说话的是英伟达高级技术官,克里斯·马拉乔夫斯基,他接着这么说道:“将小参数AI模型作为决策核心替代原本自由的神经网络节点,在理论上就不可能行得通。”
“如果说原本的模型是一个线团,我们跑的很顺,像这么一搞,完全成了一团乱麻了!
“训练效率不仅得不到提升,还造成了极大的困恼,就我目前的测试而言,百万参数模型训练时的损失已经高达70%。
“而且,模型越大,损失也越大。到GPT4的水准,能损失到只剩千分之一不到。
“换句话说,如果要用这种方式训练GPT4,要消耗原本一千倍的算力资源!什么狗屁的死思考模型?将一万个小参数模型放一起,就类比人了?扯淡吧!”
克里斯听起来怨气颇深,自从卷耳智能科技的一百二十多项专利申请披露以来,克里斯这几天那是没有睡过一个好觉,别说类思维了,他感觉自己都快没有思维了。
不过,他得出的结论跟黄仁勋的想法是不谋而合的。
“可是耳语……”但一提到耳语,他们又都沉默了。
因为耳语事实存在,效果他们都看到了,那么就一定存在一个方案能够做到。是选择相信纪弘的一番乱扯,还是继续无头苍蝇一般的乱撞,都不是一个好的选择。
“还是要做!我们别无选择不是吗?”黄仁勋如此说道。
“我们只是硬件供应商,这些东西让搞AI的头疼去不行吗?”克里斯如此说道:
“你现在不是在中国吗?是否考虑去见一见卷耳智能科技的创始人,论GPU,全世界没有任何一家公司能比得上我们,这不是天然的合作者吗?”
克里斯是葡萄牙人,他不懂国人的思维,而黄仁勋是懂一些的,心里也是不断的摇头,如果有可能,他早就去了。
但卷耳智能科技第一个找上摩尔科技的时候他就知道,英伟达肯定是没戏的。倒不如指望OpenAI能够知耻而后勇,赶紧赶上来。
“不过还是去见见吧,就算不成,也没有什么损失不是吗?”黄仁勋寻思,来都来了,这里离河州也不算太远。
……
别说英伟达这种业内企业了,就算是八竿子打不着的网友们,这个夜晚也都选择不眠。
时间已是深夜,科技圈还热闹的很,简直就像过大年。
而“今年”的“春晚”只有一个主角,那就是类思维模型。
“一百多项专利我全都整理了,纪大在河州大学智算中心项目的启动仪式上讲的那番话,我也反复琢磨过。
“据此,我设计了一套实施方案【从0开始训练一套类思维大模型】,源程序上传到Gitee码云上了,地址是:https:‖gitee.com|cla*****king。有兴趣的可以下载下来一起试试,共同探讨。”
“我试了,根本不行啊,这效率,还不如直接从0搭建GPT呢!”
“你废话,专利文件肯定不可能给你披露细节的,这需要你一点点一点点的慢慢去试去调整,才能达到最佳。”
“能达到吗?我怎么觉得这就是个坑呢?我用数学模型做了一下评估,所有条件都考虑进去,看多少参数的小模型替代神经网络节点,结果是多少你们知道吗?答案是1。”
专业的IT社区都是业内人士,尤其是今天,CSDNBlog人工智能分区更是一群AI领域大佬的聚集地。
答案是1代表什么意思,他们再明白不过了——那就是现有神经网络模型的效率就是最高的,任何改变都只会影响效率,而不会提高效率。
“把你的计算过程贴出来,我们一起看看……”
“好!”这个人名为孙博,毕业于信息科技大学本科,国科大硕士、博士,现为科学院自动化所人工智能基础前沿理论研究室研究员。
……
纪弘也在窥屏,他是CSDN的老用户了,也经常会在里面发一些东西,今天从河州大学回来以后,也是照例进来看了看。
正好就看到这群人在讨论类思维模型的事儿,也就一直在盯着。
当孙博把所有的计算过程贴出来的时候,他也是第一时间就下载了下来。
计算过程极为复杂,涉及到微分、积分、线性代数、离散数学、最优化理论、信息论等一大堆学科的交叉。
如果不是最近能力一直在+0.1+0.1的不断在提升着,这么复杂的东西他都有可能看不懂。
“这人不简单呐!”好久之后,纪弘才感叹着,不知道是哪位大佬,有没有机会挖过来?
这么想着,纪弘挑了一些纯理论且不涉及机密的东西给他私信了过去:“我看博主水平非常高,对这个方向有兴趣吗?有机会可以聊聊。”
发过去之后,纪弘就没再管他,又在窥屏了。
还别说,专业的论坛不太经常冒泡的还真有几个大牛,今天趁着这个“团圆夜”全都出来了,纪弘就看到好几个。
“看样子确实是的,这个理论行不太通啊!”一位名为“人工智能杂谈”的博主说话了:
“这样我就放心了,我还以为卷耳智能科技是傻的,这么机密的东西都敢往外放。原来是假的,那就对了!”
“也不尽然是假的,小模型肯定不行,但是如果能解决一个最优化理论的问题,用一个新的东西代替这位微模型,那……”
孙博对前沿理论的研究很深,总觉得类思维模型有点儿意思,而且跟自己思考的一个最优化理论问题有所牵连,说不定这就是他那个问题得到了解决的成功过。
不过,正敲着字儿呢,他突然反应过来,自己这不是在和同事探讨问题,而是在玩技术论坛。
这是玩儿High了呀!这东西可不能往外发,也是急忙删除了这段文字,并检查了一番自己的电脑。
最后回道:“嗯,确实是假的,不过就算是假的,不试一试,你心里不痒痒吗?”
“还真是!不管真的假的,耳语系统已经事实存在了,怎么来的?不试一试肯定不会甘心的,我先跑跑看,说不定效率虽然低,但是真实效果却非常好呢?数学计算出来的结果不一定就绝对符合事实!”
“嘿嘿……”
纪弘笑着,这就是阳谋。
在自己并没有其他思路的情况下,谁能不去试一试呢?哪怕明知道这是个坑!
相信英伟达啊、OpenAI啊,尤其是OpenAI肯定会试一试的——白白消耗他们一大批算力资源,不管是从哪儿挪来的,那也是好事儿一桩!
(本章完)
(https://www.kenwen.cc/book/469946/18275411.html)
1秒记住啃文书库:www.kenwen.cc。手机版阅读网址:m.kenwen.cc