在企鹅与wst合作之初就有了技术方面的共享,所以“小奥”的源代码,企鹅这边都是有的。
只不过,先前凌志的权限不够,而如今有了杨立飞的首肯,凌志也能访问到“小奥”的源代码了。
奥沙利文安排凌志和“小奥”重新来一场比赛,他想近距离观察一下小奥的发挥。
这场比赛的结果不出凌志预料,他输了。
“小奥”本身就是准度极高的ai机器人,在沉浸式表演赛结束之后,鹰方疑似又将它的内置算法优化了一下。
如今的“小奥”,近乎于没有短板!
凌志以正常的方式跟“小奥”打了两局,基本上都是长台被“小奥”抓住了机会,然后一杆超分。
当初,凌志在vr密室中,采用了炸散球堆然后一杆超分的方式赢下了一局比赛。
对待这种程度的对手,最好的取胜方式,就是不让对手上场!
可是,炸散球堆的方式并不能保证每一次都能有红球入袋。
如果是在正式比赛上,面对现在的“小奥”,凌志不可能有获胜的机会。
至少现在的他,想不到任何取胜的方式。
奥沙利文似乎知道凌志在想什么,他笑了笑,指着年轻时候的自己说道:
“其实它有一个很明显的缺陷,不知道你们发现没有?”
凌志三人沉默了一会儿,路锋试探着说道:
“我不确定这是否是缺陷,但我总觉得......在跟他打球的时候,我们几乎抓不到任何简单上手的机会。”
“它的防守十分严谨,很难找到它的破绽,而它每次上手,基本上都是抓住了我们的破绽!”
“所以它倒逼我们采取保守式打法,这样我们才能不给它留下简单上手的机会。可每当这种时候,它的打法会变得更加保守!”
“比如刚刚几局,要是凌志坚持贴球堆防守,我相信它也会跟着贴球堆,根本不会选择主动打开局面!”
“你说得没错。”
奥沙利文肯定了路锋的说法,
“我还以为你们会被它强大的球技所蒙蔽,还好,你们都还能保持清醒。”
“它最大的问题就是像你刚刚说的那样,路。”
“它能保证自己输不了,但是它没办法保证自己一定能赢!”
凌志若有所思地点了点头,奥沙利文一语中的,点出了问题的关键。
“小奥”的进攻无懈可击,防守也不会留下太多破绽,这种情况下,本身就立于不败之地。
它之所以能赢,主要还是抓住了对手留下的机会,而它自己却从来不会主动进攻难度球为自己创造出机会!
当然,这样的要求,或许对于ai来说有些苛刻,因为就连人类自己,都难以达到它的水平。
然而在人类的赛场之上,所有选手都会努力为自己创造出机会,没有人会采取消极打法。
这也是人类能不断进步的原因所在!
如果满足于ai现有的水平,那么它只会迟滞不前。
人类无法从ai的行为数据当中学习到更多的东西,而ai存在的意义,只是成为了一个不错的陪练而已。
然而台球圈子内的人都知道,如果对战双方实力差距巨大,那么实力较弱的那一方,其实并不能起到很好的练习效果。
因为本来说好的是一场博弈,可到头来却成了个人秀。
所以ai必须要有学习能力才可以!否则最后,只能当一个装饰用的花瓶。
凌志将自己的想法说了出来,奥沙利文点了点头:
“非常好,凌。看起来,邀请到你,是一个极其正确的选择!”
“没有没有,我才觉得十分荣幸呢。”
“那你觉得,如何才能提高它的进攻积极性呢?”
“我觉得可以选择性地让它进攻一些难度红球,不仅限于红球在袋口的那种......”
凌志和奥沙利文在球桌旁边讨论着这些技术性问题,路锋和汤开诚相视一笑,情不自禁地开始互相调侃:
“你能听懂么?老路。”
“我当然能,你呢?”
“我够呛,你知道的,我英语也就那样儿,要不是有手机充当翻译,我都不敢带学员走出国门。”
“其实我也没好多少,虽然凌志说的,我大概知道是什么意思,但他时不时会冒出来一些晦涩的专业术语,比如reinforcementlearning之类。”
路锋顿了顿,继续道:
“其实我听不懂倒还无所谓,但我惊讶的是,奥沙利文竟然在不断地点头!我都不知道,他到底是真懂还是在装懂......”
两位教练在场边聊得不亦乐乎,而场上的奥沙利文已经和凌志初步敲定出了一个方案。
凌志决定先调试一下“小奥”的源代码,看看效果怎样。
第二天,四人再次来到了虚拟体育馆,观察凌志优化之后的效果。
此时的“小奥”已经愿意主动进攻一些高难度长台红球了,可是缺陷依然很明显。
虽然“小奥”的长台进球成功率很高,但是显得有些强行,红球进了,白球却不知道跑哪里去了。
奥沙利文摇了摇头:
“凌,或许我们一直以来,都陷入到了一个误区。”
“哦?您指的是什么?”
“我们一直都想让‘小奥’去像人一样进行击球,却忽略了,它的准度已经超出了人类很多。”
“所以我们完全没有必要让它去学我们呀!我们需要代入它的视角!”
“凌,假设你拥有了极高的准度,你会采用什么样的打法呢?”
“极高的准度么?这倒是一个有意思的问题,我想,真到了那个时候,我什么策略都不会采用。”
“毕竟,一准天下无难事嘛!”
这确实是一句台球圈子内流传已久的俗语,意思是,只要有准度,基本上这比赛就输不了。
这也是有数据支撑的,在斯诺克职业赛场上,如果球员的击球成功率能维持在90%以上,那么就大概率会取得胜利。
奥沙利文点点头,赞同了凌志的说法,但紧接着又提出了新的疑问:
“如果两位选手的击球成功率都能维持在90%以上呢?”
凌志陷入了沉思。
如果出现奥沙利文所说的这种情况,那无疑将会是一场视觉盛宴。
但在过去的几十年时间里,这样的比赛屈指可数,每个赛季能有个一两场,那将足以被台球爱好者们所铭记。
因为这样高质量的对决很难得,所以凌志没往这个方向去想过。
但如果真的出现了,那么左右比赛胜负的关键,还是准度吗?
在一般的比赛中,那确实是一准天下无难事。
但在高质量对局中,双方的准度都达到了一个很高的水准。
这种情况下,谁失误多,谁就更容易输掉比赛!
但准度在线的情况下,失误会出现在哪一方面呢?
那可能性就太多了,比如杆法和力度的控制,白球路线的选择等等。
凌志把自己的想法和在场三人进行了分享。
汤开诚沉吟道:
“现在考虑得过多也不太好应付,不如先从两种情况开始,长台打进红球以后,如果想叫彩球,应当采取什么策略?如果想防守,又应该采取什么策略?”
路锋在一边提出疑问:
“有考虑防守的必要性吗?既然准度在线,那打进之后直接考虑叫彩球不就行了么?”
“可并不是所有情况下都适合叫位,比如下半台红球比较散的时候,白球可不容易跑出来。”
“但这种情况下你会选择进攻?”
“......”
两人开始激烈地讨论起来,还真别说,这种高质量对局中,两位选手应该采取什么样的策略,这是教练们从没有深思过的事情。
因为汤开诚的英文不太好,所以交流的全程都是用的中文。
好在虚拟体育馆内也内置了同声传译技术,所以奥沙利文理解起中文来也不算太困难。
讨论的时间很久,众人理清了不少细节,暂时敲定了一个大致的方案。
总体上还是倾向于让“小奥”去更主动地进攻,但要考虑白球能叫到下一颗彩球的概率。
如果概率低到某种程度,那么就要考虑是否进攻了。以及如果选择进攻,那么白球的防守线路该如何确定的问题。
讨论的最后,奥沙利文再次抛出一个有意思的问题:
“凌,路,你们觉得,优化到最后,小奥会变成什么样子呢?”
凌志不假思索地答道:
“应该是极其完美的程度吧,能拿100个世界冠军的那种。”
奥沙利文笑着摇了摇头:
“以它现在的水准,已经足以拿到100个世界冠军了。但我想说的不是这个,而是,它对于人类来说,有着什么样的意义呢?”
在场的三人再次陷入了沉思,一个无敌的台球ai机器人,其意义只是为了击败人类吗?
凌志听说过二十多年前横空出世的alphago,这是一个很强大的围棋ai机器人,曾多次击败围棋世界冠军。
然而谷鸽的黄博士曾说过,alphago的出现并不是为了击败人类,而是一个人类和ai互相激励的过程。
凌志对于这段话一直都没能深刻理解,直到今天,听到奥沙利文提出类似问题的时候,他的思绪悄然间向某个维度迈出了一步。
沉溺于虚拟空间中“小奥”的强大并没有什么意义,优化的尽头,终究还是得回到现实世界!
它再强大,终究,还是要为人类服务的。