用 Python 和 FER 库构建实时情绪检测应用

type

status

date

slug

summary

fer: 一个非常好用的 Python 库，它封装了深度学习模型，可以轻松实现面部情绪识别。我选择了 mtcnn=True 选项，因为它在人脸检测方面通常更准确。

万事开头难，但这里的初始化过程很直接。首先，加载 FER 检测器和 OpenCV 的摄像头捕获对象。

一个重要的细节是视频保存的分辨率。与其硬编码一个尺寸，不如直接从摄像头读取第一帧，动态获取其宽度和高度。这样可以确保保存的视频 emotion_video.avi 和原始输入尺寸完全一致，避免拉伸变形。

这是项目的一个关键点。天真的做法是在每一帧都用 plt.cla() 清除整个图表再重新绘制，但这非常慢，会导致程序卡顿。

更优化的方法是：只创建一次图表，后续只更新数据。

我们先用 plt.bar() 创建一组初始高度为 0 的条形图，并保存这些条形图对象。在主循环中，我们只需要调用 bar.set_height() 来更新每个条形的高度即可。这种方式的性能开销极小。

这是程序的核心逻辑，在一个 while True 循环中不断执行：

这是将 Matplotlib 图表保存为图像帧的关键代码：

当用户按下 'q' 键后，循环结束。此时，必须做好清理工作：释放摄像头、关闭视频和 GIF 文件写入器、销毁所有 OpenCV 窗口。

最后，我们将循环中收集到的每一帧的情绪数据（一个字典列表）转换成一个 Pandas DataFrame。这使得后续分析变得非常容易。例如，我们可以使用 .cumsum() 计算每种情绪的累积得分，并绘制一个折线图，直观地展示在整个检测过程中，哪些情绪占据了主导地位。

这个项目是一个很好的实践，它融合了计算机视觉、数据可视化和实时处理。最大的收获是理解了如何通过“只更新数据，不重绘对象”的方式来优化 Matplotlib 的实时性能，以及如何将动态图表保存为 GIF。fer 库的易用性也大大降低了进入情绪识别领域的门槛。

完整代码：