学霸的AI系统:正文卷 第16章 她白得就跟250一样
齐凡又喝下一口贤者饮料,给自己充能。
对图像的数字化处理,首先自然就是将彩色图转化为灰度图。简单来说,就是将一张彩色照片弄成黑白的。
之后那黑白图像上的一个个像素点的灰度值,便是计算机看到的东西。
齐凡忽的想起李月。她可真白!
贤者状态下的齐凡是很纯洁的,比4个9的黄金还要纯。他想起李月完全是因为好奇该如何用数字形容她的白。
灰度值的范围是0~255。0代表纯黑,255代表纯白。
李月该有多白。150?200?还是250?
齐凡觉得一定是250。她白得就跟250一样。
人类通过一個个像素点的灰度值就能识别出物体,其实计算机也是这么干的。
这其实是很浅显易懂的道理。只要这个世界上没有修仙和魔法,那做同一件事情多半就是用同一种方法,只不过是过程有些不同罢了。
就如,人类对着一副图像看一样就什么都明白了,人类自己甚至都感受不到这个过程。
你看到图像上有一只猫,你不会下意识去思考“我为什么会认为它就是一只猫”。也就是说,人类根本不明白自己识别的过程。
因而在于如何教计算机识别图像的问题上,人类绞尽脑汁,这类问题就是机器学习诞生的初衷。
齐凡通过阅读许阳他们的代码,知道他们并未采用简单的线性回归来处理数字识别。他想想也是,毕竟线性这东西就如一个直男,脑子永远就是一根筋的,只能走直线,走不了曲线,自然也就处理不了复杂些的问题。
比如:异或问题。这是一个最典型的非线性问题。
所谓异或,就是:同为0,异为1。两个数字1异或之后结果是0。
用白话来解释线性和异或的话,线性可以看成是按套路办事,非线性则可看成不按套路出牌。异或就是不按套路出牌的一种典型情况。
如果计算模型是线性的,那无论如何它也无法处理非线性的问题。哪怕是把现有CPU的运算能力翻一万倍,那也是无济于事的。
这就好比一个男人还没结婚的时候,他的钱都是他的。结婚之后,计算机按往常理解,就是把夫妻双方的钱加起来除以2。
不加干预的话,计算机是无法自己开窍其实不是除以2,而是很可能向某一方汇聚,最后男方那边剩余是0。
面对这种问题,线性方法是处理不了问题的。这个时候可以用SVM支持向量机的升维。
就好比婚后的一对男女同住在一块,男的保不住钱。那怎么办?可以人为制造一个维度将男女分开,一个在天南一个在地北。这样两人的地域就不在一个维度了。通过新增一个地域维度,从而实现地域维度上的分离,这样男人的钱就能保住了。
当然,计算机的世界里没有微信转账,这种可以沟通不同地域维度的东西。
齐凡也不知道自己看书看着看着,怎么脑子里会有这么多奇奇怪怪的想法。他自己也知道这个例子用来形容SVM不是很恰当,但他觉得这个例子很有意思。
他觉得直男是想不出这种例子的。
贤者饮料的牛X莫过于此--让不是直男的齐凡,在进入贤者状态后,思维无限自由发散,却能在面对欲望的时候,表现得比直男直一万倍。
齐凡自己都没有察觉到这一点。否则的话,他多半会去做一件事--看些小成本电影。
他肯定会好奇,自己能否在深切感知电影主角们悸动的同时,自身又能做到心如止水。
齐凡收回思绪,回到数字图像处理的问题上。
SVM的作用主要是拿来分类,而数字识别就是一个典型的分类问题。因为一个数字只有0~9这几种可能。
而分类问题体现在数学上,其实就是对坐标系的分割。
每一张包含了手写数字的图像,通过提取特征后,都可以在坐标系找到属于它的位置。而SVM要干的事情,就是仔细划分这些不同位置的坐标点。
属于“0”的坐标点要和“1”的坐标点清清楚楚地分开。其余数字依次同理。
这个坐标系很复杂,有N个维度。假如一张图片的像素点是100*100的,将它整个扔给计算机的话,那就有1万个输入维度。人类所能理解的图形极限是三维,所以1万维是完全不可能画得出来的。
画不出来还是小事,可以自行脑补嘛。计算和特征提取才是大事。
维度越大,所需的计算量也就越大,算得也就越慢。如果一个程序识别一个手写数字要花10秒,那一定会被骂成“人工智障”,这就是“人工智障三人组”最初名号的由来。齐凡是从计算机学院其他学长口中得知的。当然,现在已经不这样了。
所以,进行计算前,势必要将图像参数简化一下。
同时,图像还涉及到清晰度和对比度的问题。
因而,齐凡被图像的“池化”“锐化”等概念虐了一通后,总算将它们掌握了。
最后就到了最关键的一步--图像最真实的特征。
图像的特征自然是来自于像素点。可其实不仅仅体现在像素点的灰度值上,还体现在像素点的排列上。
如果直接将像素点的坐标和值作为输入参数,那就会带来一个问题。
假如一个一模一样的数字“1”,出现在一张纸的不同位置。这对以上方法来说,就是不同的输入参数,因为其坐标位置变化了。可按实际情况,这个数字并没有任何改变,只是位置发生了变化而已。
位置的变化不应该带来输入参数的变化,因为人类识别数字也并不需要参数数字整体的位置。
齐凡带着疑问在书上找到了答案--变化特征。
通过提取相邻像素点灰度值的变化作为特征,这样就能摒弃数字坐标位置不同而引入的干扰。
这就是方向梯度直方图(Histogram of Oriented Gradient)的核心概念。
【计算机经验+10。】
到此为此,图像特征提取部分已被齐凡搞定。
剩下的,就是找寻许阳他们所用的模型到底是哪里出了问题,以至于会出现40%多识别错误率。
-----------------
心情愉悦的齐凡,收起东西从图书馆回到宿舍。
齐凡一进宿舍,王哲就火急火燎地开口,“怎么发你微信过了半天才回,今天微积分课吴院长点名,你又不是在。他现在每回都会特意关注你,你要是再不去,他可真就要发飙了。”
齐凡最近的行为在同学们看来简直就是作死,连最近看不惯他的贾震都开始对他同情了。
“齐凡,十年寒窗不容易,伱这么个作法,早晚要被开除学籍的。何必呢。”只要不挑战贾震的学霸权威,他也不是什么十足的坏人。
“多谢你们关心。可我早就和你们说过了呀。是因为王教授叫我去帮忙。”
从对面两人的神情来看,显然不信。齐凡也只有无奈。
“算了,等后天吧。后天的微积分课正好有些内容我还需要巩固下,到时你们看,吴院长会不会管我。”齐凡自信王教授肯定已经都打好招呼了。