芯的开始第48章新模型的威力_科技无垠最新章节_科幻小说_大家读书院

    “拒绝谈判？”

    太平洋彼岸，阿美瑞卡某处会客室，一名男子充满着完全不可置信的眼神。

    “我就说，他们绝不会答应进口核辐射地区的粮食的，他们跟我们不一样，他们是有底线的。”

    “鲍姆，不对。我们现在还没有开始谈条件呢，这些东西，我们要谈什么，他们现在不可能知道的。”

    “Jacks，那他们为什么拒绝的如此干脆？连谈都不愿意谈？究竟哪里出了问题？

    “难道是工业人工智能模型的未来不够诱人？还是他们已经发现了什么？”

    “不不不，”杰克斯摇头：“我们的专家评估了那么长时间才得出的确切结论，他们那落后那么多的水平，专家们即便是猜到了，也绝对不敢打包票作保证。”

    现在的人工智能训练，包括最强大的GPT4.0，都是一样的原理，就是海量语料和海量算力的堆积。

    语言模型，像ChatGPT，海量的语料获取非常容易，网络上爬取就是了，无非就是需要进行一番清洗，只要不在乎成本，可以无限堆积。

    哪怕是OpenAi和GitHub合作共同训练的代码机器人模型，那也有GitHub代码仓库里不计其数的代码做训练支撑。

    但工业模型训练呢？工业生产数据可不像语言和代码那样，全网都是，爬取就完了。

    哪儿来的那么多的工业数据来做训练支撑呢？

    且不说各家的工业数据都是核心隐私，根本不可能共享。就算能也没用。

    智库评估，哪怕把全美甚至全世界的工业生产数据全部撸来，也不够工业模型训练之万一的。

    换言之，就是这玩意不可能存在。

    ……

    “是的，不可能存在。”文国昌开完会，立刻就赶往了华州，他要见一见程旭，程旭也是直接了当：

    “文老，以现有的人工智能模型训练方式，至少十几二十年内，成熟的大型工业人工智能模型没有任何出现的可能。”

    “你说的这些，包括，现有工业生产数据根本不可能支撑大型工业模型的训练这种观点，很多专家也都说了。”

    文国昌问道：“但是，他们都不敢这么保证。你为什么就敢说十几二十年不可能？”

    “他们是你的智囊团，要对你的决策负责。”程旭笑道：“而我嘛，只是跟一个老朋友聊聊天，我有什么不好说的？”

    “小鬼头。”文国昌笑了笑，没有再纠结这个问题，这其中的道道，他比程旭明白。

    “你说十几二十年不会出现大型工业人工智能模型，我选择信你。”

    文国昌起身，郑重的说道：“这个决策，是我个人做出的，有我来负责。”

    “文老，您等会儿，”程旭立刻制止：“我什么时候说过了。”

    “你刚才不是说……”文国昌心中突然一惊，满脸疑惑的看着程旭。

    “文老，我说的可是，以现有的人工智能模型训练方式，是有这个前提条件的。”

    程旭笑道：“换言之，阿美瑞卡不会有，但我可没说我们不会有。”

    “价值判定方法？”文老询问道。

    “文老也知道价值判定？”

    程旭一惊，不过随后也就明白了，就现在的世界形势，这么重要的东西不关注反倒不正常了。

    文国昌点了点头，也没有瞒着：“我不想知道也得知道，从昨天到今天，价值判定这四个字儿都快把我的耳朵磨出茧子来了。各路专家分析来分析去，没有形成统一认知。

    “认为它好的，那叫一个夸，夸得天上有地下无的，开创人工智能训练新的时代，这评价，高的没边儿了。

    “也有人认为，它是有点儿突破，但也就那么回事儿，再怎么强也强不过阿美瑞卡。毕竟人家起步早，没有个三五十年怎么赶得上呢？还是建议得妥协。

    “现在，我想听听，你这个创造者对价值判定是怎么样的一个看法。”

    “文老，价值判定是什么我就不跟您讲了，相信专家们肯定分析过了，讲的肯定比我好。”

    程旭笑道：“我就给您说说，基于价值判定核心，出现的一种新的训练模型：我管它叫【条概模型】。”

    “现在的人工智能训练模型，不管哪一种，都是概率统计模型。”

    程旭说着，看文老有些懵，瞬间改了一种说法：“这就像什么呢，我们把人工智能当成一个牙牙学语小孩儿，我们教一个孩子学习语言。

    “现在的模型是怎么教的呢？给它一大堆的文章，成G成T的给它，它就会自己去拆解这些文章，统计字与字、词与词之间的组合和出现的概率。

    “计算是计算机擅长的啊，尤其是GPU，专有运算能力非常强大，海量的数据和算力堆积就形成了现在看似是思考和逻辑的语言能力，其本质还是统计概率。

    “而我的条件概率模型呢，开始的时候是不会给它海量文章的，它像孩子一样，先学识字、再学组词造句、再学词性分解。

    “训练了完了这些，再给它灌输中量的文章语料，去统计这些字这些词出现的境况概率和词性分解情况，慢慢的形成看起来具有一定思考和逻辑的语言能力。”

    “看起来本质还是概率统计啊！”文国昌笑道。

    “对，本质还是概率统计，”程旭也笑了：“它形成的东西，也只是看起来具有思考性和逻辑，它自己本身是没有这个概念的。

    “不过话说回来，如果它真的像孩子一样，慢慢的形成思维，那就不是强大，而是可怕了吧？”

    文国昌点了点头，他听懂了。

    虽然本质还是概率统计，但是条件概率，提前通过某种手段剔除掉了绝大部分不可能的情况，那剔除的这部分，训练量就完全省下来了。

    从程旭的话里边也非常明显的听出来，现有模型训练是海量数据堆积、海量算力支撑，而条概模型，是先行基础逻辑，然后中量数据投喂，进行统计分析。

    海量，那是没量，愈多愈善。但，中量——可能也不少，但至少有数了。

    这一比较——

    突然想起刚刚说起的工业人工智能训练模型，按现有的训练方式，全世界的工业数据都不足以支撑。

    那条概模型呢？

    “条概模型能省多大水平的数据？”文国昌也是殷切的问道。

    程旭一眼就看出了文老的心思，因为他压根没有加以掩饰：

    “利用条概模型，我说的是未来的成熟条概模型哈，而不是千寻临时用的那个还不完善的模型雏形。

    “利用条概模型，以我国的工业体系数据，绝对足以支撑一个大型工业人工智能模型的训练。”

    “哈哈哈哈哈哈……”

    文国昌仰面大笑，内心十分舒爽：

    阿美瑞卡是在吹牛、在忽悠，他们一定想不到，我们未来竟然有可能真的实现吧？

科技无垠：芯的开始 第48章 新模型的威力

科技无垠：芯的开始第48章新模型的威力