第54章我觉得纯扯！

“你们怎么看？”

    黄仁勋的话音刚落，就有一个声音传出来：“我觉得纯扯！”

    说话的是英伟达高级技术官，克里斯·马拉乔夫斯基，他接着这么说道：“将小参数AI模型作为决策核心替代原本自由的神经网络节点，在理论上就不可能行得通。”

    “如果说原本的模型是一个线团，我们跑的很顺，像这么一搞，完全成了一团乱麻了！

    “训练效率不仅得不到提升，还造成了极大的困恼，就我目前的测试而言，百万参数模型训练时的损失已经高达70%。

    “而且，模型越大，损失也越大。到GPT4的水准，能损失到只剩千分之一不到。

    “换句话说，如果要用这种方式训练GPT4，要消耗原本一千倍的算力资源！什么狗屁的死思考模型？将一万个小参数模型放一起，就类比人了？扯淡吧！”

    克里斯听起来怨气颇深，自从卷耳智能科技的一百二十多项专利申请披露以来，克里斯这几天那是没有睡过一个好觉，别说类思维了，他感觉自己都快没有思维了。

    不过，他得出的结论跟黄仁勋的想法是不谋而合的。

    “可是耳语……”但一提到耳语，他们又都沉默了。

    因为耳语事实存在，效果他们都看到了，那么就一定存在一个方案能够做到。是选择相信纪弘的一番乱扯，还是继续无头苍蝇一般的乱撞，都不是一个好的选择。

    “还是要做！我们别无选择不是吗？”黄仁勋如此说道。

    “我们只是硬件供应商，这些东西让搞AI的头疼去不行吗？”克里斯如此说道：

    “你现在不是在中国吗？是否考虑去见一见卷耳智能科技的创始人，论GPU，全世界没有任何一家公司能比得上我们，这不是天然的合作者吗？”

    克里斯是葡萄牙人，他不懂国人的思维，而黄仁勋是懂一些的，心里也是不断的摇头，如果有可能，他早就去了。

    但卷耳智能科技第一个找上摩尔科技的时候他就知道，英伟达肯定是没戏的。倒不如指望OpenAI能够知耻而后勇，赶紧赶上来。

    “不过还是去见见吧，就算不成，也没有什么损失不是吗？”黄仁勋寻思，来都来了，这里离河州也不算太远。

    ……

    别说英伟达这种业内企业了，就算是八竿子打不着的网友们，这个夜晚也都选择不眠。

    时间已是深夜，科技圈还热闹的很，简直就像过大年。

    而“今年”的“春晚”只有一个主角，那就是类思维模型。

    “一百多项专利我全都整理了，纪大在河州大学智算中心项目的启动仪式上讲的那番话，我也反复琢磨过。

    “据此，我设计了一套实施方案【从0开始训练一套类思维大模型】，源程序上传到Gitee码云上了，地址是：https:‖gitee.com｜cla*****king。有兴趣的可以下载下来一起试试，共同探讨。”

    “我试了，根本不行啊，这效率，还不如直接从0搭建GPT呢！”

    “你废话，专利文件肯定不可能给你披露细节的，这需要你一点点一点点的慢慢去试去调整，才能达到最佳。”

    “能达到吗？我怎么觉得这就是个坑呢？我用数学模型做了一下评估，所有条件都考虑进去，看多少参数的小模型替代神经网络节点，结果是多少你们知道吗？答案是1。”

    专业的IT社区都是业内人士，尤其是今天，CSDNBlog人工智能分区更是一群AI领域大佬的聚集地。

    答案是1代表什么意思，他们再明白不过了——那就是现有神经网络模型的效率就是最高的，任何改变都只会影响效率，而不会提高效率。

    “把你的计算过程贴出来，我们一起看看……”

    “好！”这个人名为孙博，毕业于信息科技大学本科，国科大硕士、博士，现为科学院自动化所人工智能基础前沿理论研究室研究员。

    ……

    纪弘也在窥屏，他是CSDN的老用户了，也经常会在里面发一些东西，今天从河州大学回来以后，也是照例进来看了看。

    正好就看到这群人在讨论类思维模型的事儿，也就一直在盯着。

    当孙博把所有的计算过程贴出来的时候，他也是第一时间就下载了下来。

    计算过程极为复杂，涉及到微分、积分、线性代数、离散数学、最优化理论、信息论等一大堆学科的交叉。

    如果不是最近能力一直在+0.1+0.1的不断在提升着，这么复杂的东西他都有可能看不懂。

    “这人不简单呐！”好久之后，纪弘才感叹着，不知道是哪位大佬，有没有机会挖过来？

    这么想着，纪弘挑了一些纯理论且不涉及机密的东西给他私信了过去：“我看博主水平非常高，对这个方向有兴趣吗？有机会可以聊聊。”

    发过去之后，纪弘就没再管他，又在窥屏了。

    还别说，专业的论坛不太经常冒泡的还真有几个大牛，今天趁着这个“团圆夜”全都出来了，纪弘就看到好几个。

    “看样子确实是的，这个理论行不太通啊！”一位名为“人工智能杂谈”的博主说话了：

    “这样我就放心了，我还以为卷耳智能科技是傻的，这么机密的东西都敢往外放。原来是假的，那就对了！”

    “也不尽然是假的，小模型肯定不行，但是如果能解决一个最优化理论的问题，用一个新的东西代替这位微模型，那……”

    孙博对前沿理论的研究很深，总觉得类思维模型有点儿意思，而且跟自己思考的一个最优化理论问题有所牵连，说不定这就是他那个问题得到了解决的成功过。

    不过，正敲着字儿呢，他突然反应过来，自己这不是在和同事探讨问题，而是在玩技术论坛。

    这是玩儿High了呀！这东西可不能往外发，也是急忙删除了这段文字，并检查了一番自己的电脑。

    最后回道：“嗯，确实是假的，不过就算是假的，不试一试，你心里不痒痒吗？”

    “还真是！不管真的假的，耳语系统已经事实存在了，怎么来的？不试一试肯定不会甘心的，我先跑跑看，说不定效率虽然低，但是真实效果却非常好呢？数学计算出来的结果不一定就绝对符合事实！”

    “嘿嘿……”

    纪弘笑着，这就是阳谋。

    在自己并没有其他思路的情况下，谁能不去试一试呢？哪怕明知道这是个坑！

    相信英伟达啊、OpenAI啊，尤其是OpenAI肯定会试一试的——白白消耗他们一大批算力资源，不管是从哪儿挪来的，那也是好事儿一桩！

    (本章完)

　　(https://www.kenwen.cc/book/469946/18275411.html)

1秒记住啃文书库：www.kenwen.cc。手机版阅读网址：m.kenwen.cc

啃文书库

第54章 我觉得纯扯！

第54章我觉得纯扯！