当谈到我们的精神状态和情绪时,我们的脸很能说明问题。面部表情是人类非言语交流的一个重要方面。即使我们无法解释我们是怎么做的,我们通常也能从另一个人的脸上看到他们的感受。在许多情况下,阅读面部表情尤其重要。例如,老师可能会这样做,以检查学生是否忙碌或无聊,护士可能会这样做,以检查患者的病情是否有所改善或恶化。
多亏了技术的进步,当涉及到人脸识别时,计算机可以做得很好。然而,识别面部表情是一个完全不同的故事。人工智能领域的许多研究人员试图使用各种建模和分类技术来解决这个问题,包括流行的卷积神经网络(CNN)。然而,面部表情识别是复杂的,需要复杂的神经网络,需要大量的训练,并且计算成本高昂。
为了解决这些问题,中国吉林工程师范大学贾博士领导的一个研究团队最近开发了一种新的用于面部表情识别的CNN模型。正如《电子成像杂志》(Journal of Electronic Imaging)上发表的一篇文章所述,该团队专注于在模型的训练速度、内存使用和识别准确性之间取得良好的平衡。
传统的CNN模型与该团队提出的模型之间的主要区别之一是使用了深度方向的可分离卷积。这种卷积鈥攖他在CNN的每一层执行核心操作鈥攄与标准方法不同的是,它独立处理输入图像的不同通道(如RGB),并在最后合并结果。
通过将这种卷积与一种称为“预激活剩余块”的技术相结合,该模型能够以从粗到精的方式处理输入的面部表情。通过这种方式,该团队大大减少了计算成本和系统学习用于准确分类的必要参数数量。“我们设法获得了一个具有良好泛化能力的模型,只有58000个参数,”田说。
研究人员通过在课堂环境中比较其面部表情识别性能与其他报告模型,对其模型进行了测试。他们使用一个名为“扩展科恩假名数据集”的流行数据集对所有模型进行训练和测试,该数据集包含35000多张表达常见情绪的标记人脸图像。结果令人鼓舞,田团队开发的模型显示了最高的准确性(72.4%),参数数量最少。
田说:“当使用小样本数据集时,我们开发的模型对面部表情识别特别有效。我们研究的下一步是进一步优化模型的架构,实现更好的分类性能。”。
考虑到面部表情识别可以广泛应用于人机交互、安全驾驶、智能监控、监视和医学等领域,让我们希望团队尽快实现他们的视觉。