穿越:2014:风起青萍之末 第220章 未来的合作伙伴
虽然尹芙·卡莉已经将林灰同其最近探讨的成果以论文的形式整理了出来并且整理得还不错。
但林灰还是决定在尹芙·卡莉撰写的论文基础上再完善一下。
毕竟这是来到这个时空里林灰在纯粹学术方面的首秀。
对于这次首秀,林灰希望能够做到尽善尽美。
尽管世界上几乎不存在十全十美的东西。
但林灰的理念向来是要么不做,要做就要做到极致。
在这种信念的驱使下,这注定是个无眠的夜晚了。
原本林灰也不需要这么着急的。
但尹芙·卡莉发来的邮件中也顺带着提到了美国国内对生成式摘要算法跟进的情况。
形势虽然不算是悲观,但也谈不上是很乐观。
在林灰鼓捣出生成式摘要算法之后。
很多美国商业性质的科研机构都在迅速跟进林灰的研究。
除此之外,还有很多计算机方面实力超强的美国大学(包括但不限于诸如麻省理工学院、斯坦福大学、卡内基梅隆大学等)也在跟进这一方向。
这些海外的科研机构会迅速跟进林灰的研究也不足为奇。
涉及到文本摘要这个自然语言处理的细分领域这方面的研究虽然看起来不怎么起眼。
普通人里面多数人中甚至没啥人知道有人在从事着这方面的工作。
但这丝毫不妨碍文本摘要对于人类文明进步的重要意义。
对此之前林灰已经进行过很多这方面的论证了。
事实上这个时空这些海外的科研团队应该一开始就很重视文本摘要这方面的研究。
只是现在的重视程度又提高了一个层级。
之所以重视程度提高一个层级跟林灰搞出的动静有着不可分割的联系。
在林灰的研究成果出现之后。
目前国内外常用的自动文本摘要技术根据摘要产生的不同方法可以分为两种:
抽取式文本摘要和生成式文本摘要。
抽取式文本摘要的方法实现简单,只是从文档中抽取已有的句子形成摘要。
生成式文本摘要则是要利用自然语言理解技术来执行文本的语法和语义分析和融合信息并在此基础上生成新的摘要句子。
由于林灰刚搞出生成式摘要算法没多久。
所以现在生成式摘要算法除了在南风APP上应用了之外其应用范围还不算太广泛。
反倒是抽取式方法由于一些历史方面的沿革而在应用方面较为广泛。
但这并不能据此否定生成式文本摘要的价值。
学术层次从来都不是多数压倒少数的,真理往往掌握在少数人手中。
抽取式文本摘要归根结底只能看作一个组合优化问题。
这在生成式文本摘要面前终究是落了下乘。
尽管处理同一个问题(文本摘要)的两种方法强行分为上下乘似乎有些不妥。
可人类在文本摘要的目的是什么呢?
甚至于人类在自然语言处理这方面的研究的目的是什么呢?
终归不过是为了更好的理解自然语言进而能够更加高效地处理自然语言。
以这个角度来衡量的话,生成式摘要算法在理解自然语言方面的能力无疑要比抽取式摘要算法高到不知道哪去了。
因此称生成式文本摘要算法为上乘而抽取式文本摘要算法为下乘也不偏颇。
想来这些海外的研究团队应该也是看到了林灰搞出来的生成式摘要算法在让机器对自然语言的理解能力更上一层楼之后。
才会对生成摘要这方面研究的重视程度进一步提升。
不得不说,方向对了。
事实上前世由于人工智能领域崛起基于人工智能的生成式文本摘要得到质的飞跃之后生成式文本摘要更是一举成为生成摘要的主要研究方向。
不过仅仅是一些科研机构在文本摘要算法方面加大投入还不足以让林灰这么重视。
林灰已经在生成式摘要算法这方面构筑了相当完备的技术壁垒。
想要弯道超车是不可能的,这些科研团队所能采取的方式无非是继续按照林灰先前公布的技术路线造轮子。
林灰比较警惕地是:
因为这些科研机构将关注的重心放在文本摘要这个细分领域之后。
海外很多原本一直处在冷宫的自然语言处理方面的部分细分领域的研究最近也被重拾起来。
甚至于连带着机器学习其余领域的一些原本冷门的研究方向也有回暖的迹象。
这对林灰可不是一个好消息。
这很可能打断林灰此前的一些部署。
纵然林灰在除却文本摘要之外的其余领域也有着技术方面的优势。
七年甚至七年以上的信息优势想要一朝逾越是不可能的。
但现在这种情况也意味着林灰想要藉此一劳永逸也是不现实的。
对手虽然进步的很慢,但也是一直在进步的。
林灰如果固步自封的话,迟早会被超越的。
龟兔赛跑的故事家喻户晓,这里面的道理自然不需多言。
弱小和无知从来不是生存的障碍,傲慢才是。
盲目的自负和藐视对手是要付出惨痛的代价的。
更何况对手还是科研实力地表第一梯队的美国。
林灰是不能丝毫大意。
不仅不能大意,而且今后林灰必须加大在自然语言处理和机器学习这方面落子的速度了。
只有比对手进步的更快,才能不断碾压对手。
心念及此,林灰很快就进入了熬夜奋战的状态。
尽管是熬夜奋战,林灰也不觉得有什么疲惫。
非但不疲惫,而且神清气明,思维始终处于很活跃的状态。
现在林灰似乎愈发可以肯定其重生之后穿过时空隧道之时身体获得一定程度的强化了。
不过事情也不绝对,林灰依旧不能完全排除这事是否是因为金钱刺激的影响。
虽然像这种论文跟之前的代码有些不同,这种论文并没有什么直接经济效益。
但并不能说这些论文没有经济效益。
这类论文的间接经济效益还是有的,不但有,而且经济效益还十分显着。
在这种情况下,林灰也不能判断是身体被强化了还是说依旧是金钱刺激。
或许什么时候可以更严格控制一下相关变量进行一下测试。
但林灰觉得很难,这个世界完全不掺杂任何金钱利益或者其余形式利益的事情少之又少。
反正纵然是此时思维比较活跃,林灰也没想到比较好的验证方法。
多思无益,林灰也不再纠结。
趁着思维活跃,林灰全身心投入到工作中。
在这种全身心地投入下,林灰工作效率很高。
原本林灰是做好奋战通宵的准备的。
结果才凌晨三点不到林灰就将论文改得差不多了。
确切地说涉及到论文的核心表述方面已经没有任何问题了。
能这么快改得差不多除了林灰高度活跃的思维之外。
也得益于先前尹芙·卡莉做的前期工作很棒。
之所以还没彻底完成还是因为语言方面的一些原因。
为了追求学术前沿就特么得写英文论文?
以后林灰牛比了拥有某一研究领域的绝对话语权之后绝对要求所有歪果仁都写成中文论文往外发。
理想很丰满,不过现实很骨感。
只能说是任重道远。
这之后,林灰又将他微调了一点点的论文给尹芙·卡莉回了过去。
要尹芙·卡莉有空帮忙润色一下。
此后,林灰也没怎么有睡意。
林灰想到前不久他想要鼓捣的关于手机病毒方面的专利。
虽然短时间内林灰没申请该专利的打算。
但先将相应的材料整理出来总是好的,免得到时候还要额外花费时间。
重生以后,时间是林灰最宝贵的财富。
也是林灰潜在的最大威胁。
时间是一条不会逆行的河流。
林灰的经历中逆行过一次的河流已然属于神迹了。
这样的经历林灰觉得是没有机会再遇到了。
重生之后,林灰的时间跟这个时空的任何人一样。
每一秒过去了也不会再回来了。
这种情况下,林灰格外珍惜每分每秒。
尽管这种状态或许很忙碌,但林灰相信随着他的忙碌会有很多人随之而忙碌。
毕竟再有七年甚至是七年以上信息优势的情况下。
林灰的很多努力都是踩在巨人的肩膀上的。
站在巨人的肩膀上,林灰可以够得比别人更高,看得比别人更远。
依旧是拿自动文本摘要来说吧。
这个时空的科研人员在处理自动文本摘要问题的时候可能会仅仅局限在文本摘要这一块。
但林灰想得却要更多。
文本摘要的不断迭代人们会对摘要的准确度提出更高的要求。
而对文本摘要准确度的更高要求连带着会对神经网络学习产生更高水平的要求。
而神经网络方面即将到来的突破将催生人工智能的兴盛。
以神经网络为核心的人工智能的兴盛可能又会催生生物方面的进步。
神经网络看似是计算机方面的研究,其实不纯粹。
神经网络的发展得益于生物学的突破。
而神经网络方面的研究又会反哺于生物学。
这些虽然可能还有些遥远。
但这就是未来。
谁洞察了未来的先机,谁就终将胜利。
总之,站在巨人肩膀上的林灰相信其有能力轻而易举得影响世界。
之前林灰搞得生成式摘要算法,无形之中调动世界上众多科研机构的忙碌不正说明这一情况么?
一个人的忙碌让一堆人不得不更忙碌。
这种现象用前世的话叫什么呢?
对,没错,就是“卷”。
重生者不当卷王,难道带头躺平么?
林灰迟早卷死这个时空所有的潜在敌对势力。
dd