我们的AI模型和正确答案差多少?了解深度学习中的数学原理 – 科学月刊Science Monthly

Author 作者 蔡炎龙/政治大学应用数学系副教授,专长为代数几何及深度学习。近年来致力推广Python程式语言及人工智慧教学,着有《少年Py的大冒险:成为Python数据分析达人的第一门课》等书。人工智慧AI 模型台湾原生种八哥土八哥白尾八哥家八哥函数函数学习机Take Home Message
► 人工智慧其实就是要把问题化为一个「函数」,再利用各种机器学习、深度学习等方式,让电脑想办法学习这个函数。
► 透过One-Hot Encoding 编码方式、Softmax 等转换,我们可以让AI 模型的函数处理结果更为精准。
► 设计损失函数便能帮AI 模型「评分」,使用方法是把训练资料都输入AI 模型中让它作答,最後再看AI 模型和正确答案的差距。

随着人工智慧(artificial intelligence, AI)技术兴起,有愈来愈多人投入人工智慧领域的研究。人工智慧其实很简单,首先就是要把问题化为一个「函数」。举例来说,假设我们想做一个AI系统,辨识在台湾常见的三种八哥,分别是台湾原生种八哥(Acridotheres cristatellus,俗称土八哥)、外来种白尾八哥(Acridotheres javanicus)、外来种家八哥(Acridotheres tristis)。化成函数的形式,就是由我们输入一张八哥的照片,电脑输出这是哪种八哥。土八哥(Noel Reynolds, CC BY 2.0, Wikimedia Commons)白尾八哥
(JJ Harrison, CC BY-SA 4.0, Wikimedia Commons)问题是,电脑只会处理数字,该怎麽告诉我们答案是「土八哥」呢?我们只需要改变一个方式,就是给每只八哥一个编号!比方说土八哥是1号、白尾八哥是2号、家八哥是3号。

接着,我们就可以利用各种机器学习、深度学习等方式,去打造一台「函数学习机」,让电脑想办法学会这个函数。如果采用深度学习,我们会需要大量的训练资料:一种八哥大约需要1000 张照片,然後再用这些训练资料去训练我们的函数学习机(即AI模型)。如果AI模型学成了这个函数,那只要输入一张八哥的照片,就会输出一个数字,让我们知道这是哪种八哥。
比如说,输入一只八哥的照片,输出结果是1.2,我们就知道「啊,这是土八哥!」,因为数值1.2介於编号1 的土八哥与编号2 的白尾八哥之间,且较靠近 1。One-Hot Encoding目前这个函数看来还很美好,但问题是:如果我们输入一张照片,AI模型告诉我们是2.5,这该怎麽解读呢?难道要说我们的AI模型判断,这只鸟有50%的机会是编号2 的白尾八哥,另外50%的机会是编号3的家八哥吗?如果你有认真看这三种八哥,就会发现土八哥其实和白尾八哥比较像,白尾八哥和家八哥反而不太像。依常理来说,应该不会有这种分不清的情况吧?

至於会发生这种问题的原因,出在我们给八哥的编号,就只是一个代号,并没有本来数字系统里的意义,例如连续、大小关系等。而为了打破数字间的连续性,可以使用一种称为One-Hot Encoding的编码方式:因为总共有三个种类的八哥,我们就用三维向量来表示,每个位置代表「是」(1)或「不是」(0)某种八哥。
於是,我们的AI模型就会输出三个数字,分别代表土八哥、白尾八哥、家八哥的得分。
如果训练成功,只要我们输入一张照片,会得到三个数字,我们看最高分是谁, 就能够知道这只鸟是哪种八哥。比如说输入一张照片以後,得到的三个分数是1.9、1.1、0.2。因为第一个数字最大,我们就知道这是土八哥!……【更多内容请阅读科学月刊第629期】

国内怎么安装surfshark

0 0 投票数
Article Rating
订阅评论
提醒
guest
0 Comments
内联反馈
查看所有评论