从开普勒452b说起(3)

2023-11-22科技人工智能科幻小说通俗演义来源:百合文库

【4】参数：拿围棋来说，模型的参数就是：看到现在棋盘上的局面，我应该在哪里落子，可能有多种可能的落子方式，但是不同的位置对我方局面的有利程度不一样，参数刻画了这个“程度”
【5】模型训练：从不会下围棋，到慢慢知道规则，再到非常擅长甚至是精于围棋有一个学习的过程，人工智能也有一个训练过程，这个过程就是通过程序在计算机上不断调整参数模拟不同的局面并判断这些参数是否能赢。
【6】测试或推理：模型推理就是利用训练好的模型在新的任务上执行一遍验证一下效果，就好像你说你围棋水平九段，下一盘看看效果
【7】训练数据：以下围棋为例，计算机程序的训练过程需要训练数据，这个数据就是不同的落子策略、先后、不同位置的对弈数据；简单说一条数据就是一次围棋比赛、或者一次落子位置等等

【8】监督训练：监督和无监督是针对于训练任务而言的，仍然以下围棋为例，监督训练是知道指采用的数据是否有利于赢棋，通俗讲就是知道这样下是好是坏，这样的数据一般是提前准备好的，比如参考历史上优秀棋手的对弈数据。
【9】无监督训练：不知道这样下是好是坏，只能自己探索
【10】过拟合：针对一个具体场景或者任务匹配到几乎一丝不差的程度，但是一旦切换一个场景就容易失效，比如下围棋的时候针对一个选手研究得十分透彻，对方的每一步都在你的预料之中，但是可能换一个选手他的策略并不完全跟现在这个选手一样，那学到针对现在选手的一些策略和落子方式在对弈新选手的时候就很容易失效。
03—参考文献关键字：《统计学习方法》、李航