我们的AI模型和正确答案差多少？了解深度学习中的数学原理 - 科学月刊Science Monthly

Author 作者蔡炎龙／政治大学应用数学系副教授，专长为代数几何及深度学习。近年来致力推广Python程式语言及人工智慧教学，着有《少年Py的大冒险：成为Python数据分析达人的第一门课》等书。人工智慧AI 模型台湾原生种八哥土八哥白尾八哥家八哥函数函数学习机Take Home Message
► 人工智慧其实就是要把问题化为一个「函数」，再利用各种机器学习、深度学习等方式，让电脑想办法学习这个函数。
► 透过One-Hot Encoding 编码方式、Softmax 等转换，我们可以让AI 模型的函数处理结果更为精准。
► 设计损失函数便能帮AI 模型「评分」，使用方法是把训练资料都输入AI 模型中让它作答，最後再看AI 模型和正确答案的差距。

随着人工智慧（artificial intelligence, AI）技术兴起，有愈来愈多人投入人工智慧领域的研究。人工智慧其实很简单，首先就是要把问题化为一个「函数」。举例来说，假设我们想做一个AI系统，辨识在台湾常见的三种八哥，分别是台湾原生种八哥（Acridotheres cristatellus，俗称土八哥）、外来种白尾八哥（Acridotheres javanicus）、外来种家八哥（Acridotheres tristis）。化成函数的形式，就是由我们输入一张八哥的照片，电脑输出这是哪种八哥。土八哥（Noel Reynolds, CC BY 2.0, Wikimedia Commons）白尾八哥
（JJ Harrison, CC BY-SA 4.0, Wikimedia Commons）问题是，电脑只会处理数字，该怎麽告诉我们答案是「土八哥」呢？我们只需要改变一个方式，就是给每只八哥一个编号！比方说土八哥是1号、白尾八哥是2号、家八哥是3号。

接着，我们就可以利用各种机器学习、深度学习等方式，去打造一台「函数学习机」，让电脑想办法学会这个函数。如果采用深度学习，我们会需要大量的训练资料：一种八哥大约需要1000 张照片，然後再用这些训练资料去训练我们的函数学习机（即AI模型）。如果AI模型学成了这个函数，那只要输入一张八哥的照片，就会输出一个数字，让我们知道这是哪种八哥。
比如说，输入一只八哥的照片，输出结果是1.2，我们就知道「啊，这是土八哥！」，因为数值1.2介於编号1 的土八哥与编号2 的白尾八哥之间，且较靠近 1。One-Hot Encoding目前这个函数看来还很美好，但问题是：如果我们输入一张照片，AI模型告诉我们是2.5，这该怎麽解读呢？难道要说我们的AI模型判断，这只鸟有50％的机会是编号2 的白尾八哥，另外50％的机会是编号3的家八哥吗？如果你有认真看这三种八哥，就会发现土八哥其实和白尾八哥比较像，白尾八哥和家八哥反而不太像。依常理来说，应该不会有这种分不清的情况吧？

至於会发生这种问题的原因，出在我们给八哥的编号，就只是一个代号，并没有本来数字系统里的意义，例如连续、大小关系等。而为了打破数字间的连续性，可以使用一种称为One-Hot Encoding的编码方式：因为总共有三个种类的八哥，我们就用三维向量来表示，每个位置代表「是」（1）或「不是」（0）某种八哥。
於是，我们的AI模型就会输出三个数字，分别代表土八哥、白尾八哥、家八哥的得分。
如果训练成功，只要我们输入一张照片，会得到三个数字，我们看最高分是谁，就能够知道这只鸟是哪种八哥。比如说输入一张照片以後，得到的三个分数是1.9、1.1、0.2。因为第一个数字最大，我们就知道这是土八哥！……【更多内容请阅读科学月刊第629期】