Vision Semantics Ltd. 
VSL Inside: 能够快速搜寻人员的AI技术
世界领先技术的人工智能产品
改变视觉分析的深度学习神经网络

大约二十年前,我们开始致力于开发能够改变计算机视觉分析应用于现实世界问题的产品。今天,我们的专利产品:“VSL Inside”,可以为全球最重要的智能城市和公共安全应用部署行人再识别(Re-ID),以解决城市问题并保障民众的生命财产安全。
该产品的核心技术来源于伦敦玛丽王后大学Sean Gong教授领导的世界领先水平的研究团队,Gong教授同时也是Vision Semantics公司的联合创始人。伦敦玛丽王后大学的计算机视觉团队20多年来一直在进行世界领先水平的计算机视觉和机器学习的研究。该研究团队以其在视频和图像中的异常行为识别、动作识别、行人再识别、多摄像机跟踪和面部分析的工作而享誉国际。
尤其是近年来,该团队活跃于基于域知识迁移学习和无监督学习的行人再识别研究,并且发表了300多篇学术论文(合计23,000多次的引用)以及6个国际专利。
过去十年,Vision Semantics公司以最佳的工程技术来实施并完善其公司推出的解决方案。该系统已在政府和诸多商业机构的实际运营中进行了应用和测试,包括了国际贸易和工业部、国防部、国防科技实验室(DSTL)、内政部以及英国宇航系统公司、英国宇航科学院、英国电信实验室、英国广播公司研发部和奇奈蒂克公司等工业界合作伙伴。

人工智能驱动的行人再识别

随着我们越来越多地使用摄像头来预防犯罪、保护财产和改善公共安全,视频监控行业正在快速地增长。数字监控摄像机产生的数据如此庞大,使得传统的人工方式无法及时处理。因而,Vision Semantics公司开发了旨在增强公共安全和智能城市视频分析能力的软件平台。


在公共安全和智能城市应用中,行人再识别是一项重大挑战。行人再识别任务是,根据给定的行人图像,在图像库中找到匹配正确的行人。这项技术不仅使用面部特征(面部特征通常是遮挡的),还需要在整个身体上发现其他特征(如衣服、身高、携带的物体等)。但是,人脸识别只有在被拍摄对象足够靠近、光线充足且面向摄像机时才起作用。而实际的监控视频情况并不能够完全满足这些条件,比如人可以故意在镜头中遮住自己的脸。


Vision Semantics公司提供了独特的行人再识别解决方案,包括相关性反馈(辅助学习),主动学习和基于属性搜索的视频摘要等技术。因此,当视频图像分辨率较低且人脸识别不再可行时(只有不到10%的监控视频包含近的正面人脸图像数据),Vision Semantics的产品提供了可行的解决方案。Vision Semantics产品的独特性在于:它具有可扩展性,并且能够在非结构化和不受控制的环境中无法看清人脸时(大多数情况下都如此)进行人员搜索。Vision Semantics产品可以非常快速地分析海量视频数据,不仅比实时分析快100倍,而且比训练有素的人类专家更准
确地进行行人再识别,尤其是当视频数据来自未知来源且没有搜索优化的域知识时,这一优势更加明显。

VSL Inside: 基于人工智能的行人再识别

Vision Semantics公司的 'VSL inside' 方案提供了最佳的行人再识别(Re-ID)模块,该模块基于学
术领域领导者创造的卓越算法和技术。Gong教授是计算机视觉领域的权威,负责行人再识别和大规模视频数据中的视觉属性搜索技术的研究。他的研究已经申请了专利技术,支持Vision Semantics软件完成如下功能:


•通过相对距离排名进行大规模行人再识别
•基于视频轨迹的再识别
•迁移和无监督学习的再识别
•基于相关性反馈学习和主动学习的再识别
•基于不平衡的属性学习的再识别
•开放集再识别:行人再识别不仅可以在封闭式基准数据集上进行训练和测试数据,还可以在大规模未知目标域中进行
•按属性快速高效地对视频进行语义摘要和搜索

准确性,可扩展性,快速性

精准性

  •  比专家精确2.4倍(Top-20 再识别精度为98.6%)

  •  在未知的目标域(该数据域中没有训练数据),再识别指标Rank-1为85.71%,其
    他最好的方法为63.7%(无监督学习的再识别)

可扩展性

  •  可配置的分布式处理(多GPU,多线程服务器实现)

  •  有客户的商业系统(完善的TRL9)

快速性

  •  比实时快20倍的视频搜索

  •  比专家快1000倍,以334 帧/秒(3毫秒 /帧)速度检测并再识别

© 2019 VISION SEMANTICS LTD