视觉组 – 上海交通大学类脑智能应用与技术中心

研究内容

我们的研究涵盖人工智能的许多方面，其目的是通过尖端的学术研究来促进人们的生活和提高社会生产力。我们的研究包括目标检测，人脸识别，面部表情识别，运动检测，网络复用等等。

目标检测

首先，我们提取图像上的信息。然后通过神经网络的卷积来比较提取的信息和数据库中的信息。最后，我们标记目标。我们的方法的特色在于利用整个图片作为输入网络，直接返回输出图层中边界框的位置和边界框所属的类别。

人脸识别

通过从数据集中的人脸图像中提取HOG特征，针对每个8×8像素大小的单元提取31维FHOG算子。通过SVM算法对数据进行正面和侧面训练，得到人脸检测模型。通过该算法，MegaFace数据集中的人脸检测精度可达99.4％。

我们提取面部数据特征并通过多级级联回归树执行临界点回归。然后利用CLNF（约束局部神经网络）算法实现对人脸参考点的训练，得到用于标记参考点的模型。最终我们实现了脸上68个脸部的标记，并描述了人脸，眼睛，眉毛，鼻子和嘴巴的轮廓。

表情识别

通过时空深度神经网络，在时域上提取上下文信息，在空间域中使用卷积神经网络CNN。然后进行网络收敛，通过联合损失函数对网络进行训练，从而确定被识别对象的心理状态。

动作检测

我们使用包括物体检测和运动检测的双流网络方法。然后通过相应的语义分析，最终得到动作识别的结果。通过行为识别，我们可以区分不同的人类运动。动作检测显然具有深远的理论研究意义和较强的实用价值。

网络复用

网络复用是为了获得一个多任务的网络，而网络主要用于算法研究。实践证明，网络可用于前端网络层实现结构共享，从而降低网络复杂度。

项目

坐姿检测

坐姿检测是一种动作检测，其主要目的是检测人的不同坐姿来获取人的坐姿习惯和精神状态，并通过与坐标进行比较来达到矫正坐姿的目的。

便利店顾客识别

在便利店顾客识别系统中，我们将相机放在不同类别的货物旁边，以便在货物前识别停留顾客的数量、性别、停留时间，从而得到不同顾客的喜爱程度。这个系统可以更好地帮助企业了解顾客的喜好，从而调整产品策略。

演示

目标检测

目标检测可以检测图像和视频中的目标，该技术可以有效地提高识别效率，在各个领域有着广泛的应用。

人脸识别

人脸识别是一种基于人脸特征信息的生物特征识别。通常我们使用相机来收集包含许多脸部的图片或视频流，自动检测并跟踪图像中的人脸。

表情识别

表达识别是指从给定静态图像或动态视频序列中分离特定表达，以确定所识别对象的心理状态。

动作检测

动作检测将识别图片或视频中的动作，然后帮助我们确定动作的类型和当前的心理活动。