崛起从金融开始:正文卷 第054章【关于灵境AI的讨论(修正)】
工作室内。
罗靖看向众人说道:“各位都有什么疑问现在可以说,我给你们一一解答,没有我就直接分派任务了。”
话音刚落,一位三十岁就发际线颇高的程序员旋即问道:“我有个问题,灵境AI为什么会选择《星际争霸2》这游戏来研究开发呢?”
罗靖言简意赅地回答:“因为这款游戏足够难?”
那程序员好奇道:“足够难?这个‘难’是以什么角度来理解?是技术瓶颈还是游戏本身难玩?”
罗靖有条不紊道:“都有。选择《星际争霸2》这款游戏,首先是这个游戏因为存在不完全信息对称的博弈,比如有战争迷雾。”
“其次是从技术角度来说,游戏中每一个单位都有很多种动作选择,灵境AI需要通过大量的学习来做出最优解。”
“这款游戏在人类的比赛对抗中,经常会出现战术欺骗,以灵境AI的角度而言,它会怎么处理这种局面?通过大量的学习后从概率分析来判断,其实人类在分析对方是否在欺骗自己的时候,也是通过经验和概率来分析。”
另一个工程师说道:“灵境AI给我的感觉,怎么说呢,好像学习就是靠大量的数据,以一個人一生中不可能达到的学习量来提升。”
罗靖点头说道:“触及问题的本质了,这一点在人工智能的开发上有三驾马车,即数据、算法、算力。拼的就是这三样,大多数AI研究团队拿到的数据都基本上是趋同的,那么就拼谁的算法更牛掰,大家的算法如果没有太明显的差距,那么拼的就是算力水平。”
之前那位工程师说道:“那就是说,它的学习速度更快?”
罗靖点了点头:“没错。灵境AI采用了一种‘关系性深度强化学习’的算法,比如说,游戏中一个凤凰是选择抬追猎者还是抬不朽者,在灵境AI的眼里是个概率问题,而想要让这个概率趋于最优解,就需要大量的数据学习和迭代训练。”
旁边的一位程序员不由得说道:“这一点倒是和人类不同,人类在做选择的时候,往往是主观的、生理的判断,而不是基于严谨的数学概率。”
罗靖笑着说:“这个的确有点意思,人在很多情况下做判断,都是一种潜意识的直觉判断。所以,我也并不希望灵境AI从纯粹的严谨数学概率判断方向走向,而是更像人类,还得接着研究才行。”
又一个工程师说道:“预判这种概念在我看来是比较抽象化的……”
罗靖有条不紊得说:“其实就是靠拟人神经网络来实现的,也就是类似一个经验的积累和学习,以及一个最优概率的判断。灵境AI的学习过程中都是在高维的空间平面里去寻找最优化的路径,但在这个寻找过程中,可能有不同的路径,所以展现出来的方式也是不一样的。”
顿了下,罗靖接道:“此外,从算法的角度来讲,灵境AI肯定需要通过当前有限的观测来预测全局的信息,通俗来讲,这个算法中肯定是包含这一函数的。”
之前那位工程师又说道:“我们人类通常在制定一个计划的时候,往往还有兜底的B计划方案之类的,灵境AI应该不会吧?”
罗靖想了想便说:“对于灵境AI来说,确实不存在B计划,因为它的每一个选择都是经过大量学习迭代后做出的当前最优解,对于人类来说,习惯制定B计划兜底是基于人的判断力不够准确,也就是找不到那个最优解,心里没底,所以才会有B计划兜底,但人工智能不存在,它就是基于最优解来决策。”
那位工程师不由得点头:“有道理。这么说来,灵境AI等于是理科生,只有标准答案,而不是一百个人心中有一百个哈姆雷特。”
罗靖微笑道:“若是灵境AI能够向着‘文科生’转变,那就牵涉到自我情感逻辑分析层面了,人类之所以能够创造文明,也是因为有情感,有自我思想,假设人工智能也有了生命的概念,不过这对我们来说还太过遥远,不是现在要考虑的问题。”
在接下来的一段时间,罗靖跟在场的几个工程师开展交流,他们也逐渐被罗靖的技术见解所折服。
有没有T10级别水平先不说,但他们可以肯定的是,罗靖的技术水平绝对在他们所有人之上,而且差距不是一星半点。
末了,罗靖看向众人说道:“你们去找星际2的战报录像,把网上所有的Replays都导出来,然后不断迭代训练灵境AI,然后观察,训练三五千万盘之后,搞一个韩服战网的游戏账号,让灵境AI托管游戏账号去跟顶尖的人类玩家对战。”
坐在旁边的一位工程师说道:“灵境AI的学习量和效率都是恐怖的,是呈几何级的量级,可也需要庞大的算力资源,公司的算力怕是不够。”
闻言,罗靖笑道:“这不是问题,我已经跟姚总说过了,公司要买一台超级计算机,大概率两个月后就能搞定。”
众人一听这话都不禁一愣,那位工程师连忙道:“直接买?”
罗靖点头道:“运算速度至少达到2000万亿次每秒。”
几个工程师心中直呼好家伙,这个算力规模基本上是国内仅次于“天河一号”了,公司不是一般的有钱啊!
而且,大家也意识到罗靖在灵境科技内部的能量比他们想象中的要大,跟姚总说一说,然后公司就直接买一台超级计算机……
片刻过后,罗靖补充道:“另外,你们着手基于灵境AI开发一个镜像AI,等公司的超级计算机运行起来了,就让它们在星际争霸这款游戏上相互对战,不断的训练、迭代,到时候每天都要训练500万至1000万盘。”
显然,这就是AI的恐怖之处。
一个人类职业玩家,毕生都不可能拥有这样的训练量,可AI的训练是呈几何数量级的。
罗靖之所以选择星际争霸2这款即时战略游戏,就是因为这游戏的信息不完全对称的博弈,接地气的说就是瞬息万变,不可预测性,不同的选择和策略都会产生不同的结果。
把灵境AI的迭代学习任务分派完毕,罗靖也准备离开公司。
……