视觉组

 

研究内容

我们的研究涵盖人工智能的许多方面,其目的是通过尖端的学术研究来促进人们的生活和提高社会生产力。 我们的研究包括目标检测,人脸识别,面部表情识别,运动检测,网络复用等等。

目标检测

首先,我们提取图像上的信息。然后通过神经网络的卷积来比较提取的信息和数据库中的信息。 最后,我们标记目标。我们的方法的特色在于利用整个图片作为输入网络,直接返回输出图层中边界框的位置和边界框所属的类别。

人脸识别

通过从数据集中的人脸图像中提取HOG特征,针对每个8×8像素大小的单元提取31维FHOG算子。 通过SVM算法对数据进行正面和侧面训练,得到人脸检测模型。 通过该算法,MegaFace数据集中的人脸检测精度可达99.4%。

我们提取面部数据特征并通过多级级联回归树执行临界点回归。 然后利用CLNF(约束局部神经网络)算法实现对人脸参考点的训练,得到用于标记参考点的模型。最终我们实现了脸上68个脸部的标记,并描述了人脸,眼睛,眉毛,鼻子和嘴巴的轮廓。

表情识别

通过时空深度神经网络,在时域上提取上下文信息,在空间域中使用卷积神经网络CNN。 然后进行网络收敛,通过联合损失函数对网络进行训练,从而确定被识别对象的心理状态。

动作检测

我们使用包括物体检测和运动检测的双流网络方法。然后通过相应的语义分析,最终得到动作识别的结果。通过行为识别,我们可以区分不同的人类运动。动作检测显然具有深远的理论研究意义和较强的实用价值。

网络复用

网络复用是为了获得一个多任务的网络,而网络主要用于算法研究。 实践证明,网络可用于前端网络层实现结构共享,从而降低网络复杂度。

项目

坐姿检测

坐姿检测是一种动作检测,其主要目的是检测人的不同坐姿来获取人的坐姿习惯和精神状态,并通过与坐标进行比较来达到矫正坐姿的目的。

便利店顾客识别

在便利店顾客识别系统中,我们将相机放在不同类别的货物旁边,以便在货物前识别停留顾客的数量、性别、停留时间,从而得到不同顾客的喜爱程度。 这个系统可以更好地帮助企业了解顾客的喜好,从而调整产品策略。

演示

目标检测

目标检测可以检测图像和视频中的目标,该技术可以有效地提高识别效率,在各个领域有着广泛的应用。

人脸识别

人脸识别是一种基于人脸特征信息的生物特征识别。通常我们使用相机来收集包含许多脸部的图片或视频流,自动检测并跟踪图像中的人脸。

表情识别

表达识别是指从给定静态图像或动态视频序列中分离特定表达,以确定所识别对象的心理状态。

动作检测

动作检测将识别图片或视频中的动作,然后帮助我们确定动作的类型和当前的心理活动。