台球博士(木森研心) 第三百六十九章优化的尽头

    在企鹅与wst合作之初就有了技术方面的共享，所以“小奥”的源代码，企鹅这边都是有的。

    只不过，先前凌志的权限不够，而如今有了杨立飞的首肯，凌志也能访问到“小奥”的源代码了。

    奥沙利文安排凌志和“小奥”重新来一场比赛，他想近距离观察一下小奥的发挥。

    这场比赛的结果不出凌志预料，他输了。

    “小奥”本身就是准度极高的ai机器人，在沉浸式表演赛结束之后，鹰方疑似又将它的内置算法优化了一下。

    如今的“小奥”，近乎于没有短板！

    凌志以正常的方式跟“小奥”打了两局，基本上都是长台被“小奥”抓住了机会，然后一杆超分。

    当初，凌志在vr密室中，采用了炸散球堆然后一杆超分的方式赢下了一局比赛。

    对待这种程度的对手，最好的取胜方式，就是不让对手上场！

    可是，炸散球堆的方式并不能保证每一次都能有红球入袋。

    如果是在正式比赛上，面对现在的“小奥”，凌志不可能有获胜的机会。

    至少现在的他，想不到任何取胜的方式。

    奥沙利文似乎知道凌志在想什么，他笑了笑，指着年轻时候的自己说道：

    “其实它有一个很明显的缺陷，不知道你们发现没有？”

    凌志三人沉默了一会儿，路锋试探着说道：

    “我不确定这是否是缺陷，但我总觉得......在跟他打球的时候，我们几乎抓不到任何简单上手的机会。”

    “它的防守十分严谨，很难找到它的破绽，而它每次上手，基本上都是抓住了我们的破绽！”

    “所以它倒逼我们采取保守式打法，这样我们才能不给它留下简单上手的机会。可每当这种时候，它的打法会变得更加保守！”

    “比如刚刚几局，要是凌志坚持贴球堆防守，我相信它也会跟着贴球堆，根本不会选择主动打开局面！”

    “你说得没错。”

    奥沙利文肯定了路锋的说法，

    “我还以为你们会被它强大的球技所蒙蔽，还好，你们都还能保持清醒。”

    “它最大的问题就是像你刚刚说的那样，路。”

    “它能保证自己输不了，但是它没办法保证自己一定能赢！”

    凌志若有所思地点了点头，奥沙利文一语中的，点出了问题的关键。

    “小奥”的进攻无懈可击，防守也不会留下太多破绽，这种情况下，本身就立于不败之地。

    它之所以能赢，主要还是抓住了对手留下的机会，而它自己却从来不会主动进攻难度球为自己创造出机会！

    当然，这样的要求，或许对于ai来说有些苛刻，因为就连人类自己，都难以达到它的水平。

    然而在人类的赛场之上，所有选手都会努力为自己创造出机会，没有人会采取消极打法。

    这也是人类能不断进步的原因所在！

    如果满足于ai现有的水平，那么它只会迟滞不前。

    人类无法从ai的行为数据当中学习到更多的东西，而ai存在的意义，只是成为了一个不错的陪练而已。

    然而台球圈子内的人都知道，如果对战双方实力差距巨大，那么实力较弱的那一方，其实并不能起到很好的练习效果。

    因为本来说好的是一场博弈，可到头来却成了个人秀。

    所以ai必须要有学习能力才可以！否则最后，只能当一个装饰用的花瓶。

    凌志将自己的想法说了出来，奥沙利文点了点头：

    “非常好，凌。看起来，邀请到你，是一个极其正确的选择！”

    “没有没有，我才觉得十分荣幸呢。”

    “那你觉得，如何才能提高它的进攻积极性呢？”

    “我觉得可以选择性地让它进攻一些难度红球，不仅限于红球在袋口的那种......”

    凌志和奥沙利文在球桌旁边讨论着这些技术性问题，路锋和汤开诚相视一笑，情不自禁地开始互相调侃：

    “你能听懂么？老路。”

    “我当然能，你呢？”

    “我够呛，你知道的，我英语也就那样儿，要不是有手机充当翻译，我都不敢带学员走出国门。”

    “其实我也没好多少，虽然凌志说的，我大概知道是什么意思，但他时不时会冒出来一些晦涩的专业术语，比如reinforcementlearning之类。”

    路锋顿了顿，继续道：

    “其实我听不懂倒还无所谓，但我惊讶的是，奥沙利文竟然在不断地点头！我都不知道，他到底是真懂还是在装懂......”

    两位教练在场边聊得不亦乐乎，而场上的奥沙利文已经和凌志初步敲定出了一个方案。

    凌志决定先调试一下“小奥”的源代码，看看效果怎样。

    第二天，四人再次来到了虚拟体育馆，观察凌志优化之后的效果。

    此时的“小奥”已经愿意主动进攻一些高难度长台红球了，可是缺陷依然很明显。

    虽然“小奥”的长台进球成功率很高，但是显得有些强行，红球进了，白球却不知道跑哪里去了。

    奥沙利文摇了摇头：

    “凌，或许我们一直以来，都陷入到了一个误区。”

    “哦？您指的是什么？”

    “我们一直都想让‘小奥’去像人一样进行击球，却忽略了，它的准度已经超出了人类很多。”

    “所以我们完全没有必要让它去学我们呀！我们需要代入它的视角！”

    “凌，假设你拥有了极高的准度，你会采用什么样的打法呢？”

    “极高的准度么？这倒是一个有意思的问题，我想，真到了那个时候，我什么策略都不会采用。”

    “毕竟，一准天下无难事嘛！”

    这确实是一句台球圈子内流传已久的俗语，意思是，只要有准度，基本上这比赛就输不了。

    这也是有数据支撑的，在斯诺克职业赛场上，如果球员的击球成功率能维持在90%以上，那么就大概率会取得胜利。

    奥沙利文点点头，赞同了凌志的说法，但紧接着又提出了新的疑问：

    “如果两位选手的击球成功率都能维持在90%以上呢？”

    凌志陷入了沉思。

    如果出现奥沙利文所说的这种情况，那无疑将会是一场视觉盛宴。

    但在过去的几十年时间里，这样的比赛屈指可数，每个赛季能有个一两场，那将足以被台球爱好者们所铭记。

    因为这样高质量的对决很难得，所以凌志没往这个方向去想过。

    但如果真的出现了，那么左右比赛胜负的关键，还是准度吗？

    在一般的比赛中，那确实是一准天下无难事。

    但在高质量对局中，双方的准度都达到了一个很高的水准。

    这种情况下，谁失误多，谁就更容易输掉比赛！

    但准度在线的情况下，失误会出现在哪一方面呢？

    那可能性就太多了，比如杆法和力度的控制，白球路线的选择等等。

    凌志把自己的想法和在场三人进行了分享。

    汤开诚沉吟道：

    “现在考虑得过多也不太好应付，不如先从两种情况开始，长台打进红球以后，如果想叫彩球，应当采取什么策略？如果想防守，又应该采取什么策略？”

    路锋在一边提出疑问：

    “有考虑防守的必要性吗？既然准度在线，那打进之后直接考虑叫彩球不就行了么？”

    “可并不是所有情况下都适合叫位，比如下半台红球比较散的时候，白球可不容易跑出来。”

    “但这种情况下你会选择进攻？”

    “......”

    两人开始激烈地讨论起来，还真别说，这种高质量对局中，两位选手应该采取什么样的策略，这是教练们从没有深思过的事情。

    因为汤开诚的英文不太好，所以交流的全程都是用的中文。

    好在虚拟体育馆内也内置了同声传译技术，所以奥沙利文理解起中文来也不算太困难。

    讨论的时间很久，众人理清了不少细节，暂时敲定了一个大致的方案。

    总体上还是倾向于让“小奥”去更主动地进攻，但要考虑白球能叫到下一颗彩球的概率。

    如果概率低到某种程度，那么就要考虑是否进攻了。以及如果选择进攻，那么白球的防守线路该如何确定的问题。

    讨论的最后，奥沙利文再次抛出一个有意思的问题：

    “凌，路，你们觉得，优化到最后，小奥会变成什么样子呢？”

    凌志不假思索地答道：

    “应该是极其完美的程度吧，能拿100个世界冠军的那种。”

    奥沙利文笑着摇了摇头：

    “以它现在的水准，已经足以拿到100个世界冠军了。但我想说的不是这个，而是，它对于人类来说，有着什么样的意义呢？”

    在场的三人再次陷入了沉思，一个无敌的台球ai机器人，其意义只是为了击败人类吗？

    凌志听说过二十多年前横空出世的alphago，这是一个很强大的围棋ai机器人，曾多次击败围棋世界冠军。

    然而谷鸽的黄博士曾说过，alphago的出现并不是为了击败人类，而是一个人类和ai互相激励的过程。

    凌志对于这段话一直都没能深刻理解，直到今天，听到奥沙利文提出类似问题的时候，他的思绪悄然间向某个维度迈出了一步。

    沉溺于虚拟空间中“小奥”的强大并没有什么意义，优化的尽头，终究还是得回到现实世界！

    它再强大，终究，还是要为人类服务的。