随着处理效能、内存密度和系统整合度的提升,嵌入式视觉从传统逐渐扩增到新兴应用领域,市场规模在十年内必有显着增长。目前,嵌入式视觉领域中热门的话题之一就是机器学习。下面粤嵌浅谈一下嵌入式视觉领域当中热门的机器学习。
机器学习涵盖多个产业重要趋势,不仅是嵌入式视觉,而且在工业物联网和云端运算中均发挥极为显著的作用。对于不熟悉机器学习的人来说,很多时候机器学习是透过神经网络的创造和训练而实现的。神经网络一语极为通用,包含大量截然不同的子类别。这些子类别的名称一般用于辨识被实现的具体网络类型。这些网络在大脑皮层上建模,大脑皮层中每个神经元接收输入、处理后并将其传达给另一个神经元。因此,神经元一般由输入层、多个内部隐藏层和一个输出层组成。
在简单的层面上,神经元取得输入、施加权重给输入,然后在加权输入总和上执行传递函数。其结果随后传递至隐藏层中的另一层,或传递给输出层。将某一阶段的输出传递给另一阶段而不形成一个周期的神经网络被称为“前馈神经网络”而那些存在反馈、内含定向周期的神经网络则被称为“循环神经网络”。
在众多机器学习应用中极为常用的神经网络之一是“深度神经网络”。这类神经网络拥有多个隐藏层,能实现更复杂的机器学习任务。为了确定每一层使用的权重和偏差值,必须对神经网络进行训练。在训练过程中,为该神经网络施加一定数量的正确输入和错误输入,并使用误差函数教授网络所需的性能。训练深度神经网络可能需要相当庞大的数据集,才足以正确训练所需性能。
机器学习重要的应用之一是嵌入式视觉领域。其中,各类系统正从视觉实现的系统演进为视觉引导的自动化系统。相较于其他较简单的机器学习应用,嵌入式视觉应用主要的区别在于采用二维(2D)输入格式。因此,在机器学习实施方案中,采用称为卷积神经网络(CNN)的网络结构,因为它们能够处理2D输入。
CNN是一种前馈网络,其中包含多个卷积层和子采样层以及一个单独的全连接网络,以执行终分类。由于CNN的复杂性,它们也被归类在深度学习类别。在卷积层中,输入影像被细分为一系列重迭的小模块。在进行进一步的子采样和其它阶段之前,来自该卷积的结果先使用启动层建立启动图,然后应用到终的全连接网络上。
对于粤嵌嵌入式视觉领域中的机器学习,在这个科技发展的信息时代,机器学习将持续作为众多应用的重要推动因素,尤其是视觉导向的机器人或所谓的“协作机器人”应用。