海康AI开放平台客户端是AI海康威视开放平台的PC端配套工具,支持物体检测、图像分类、检测分类混合、OCR等应用场景,提供数据标注、模型训练、模型校验、模型发布和导出等功能,结合EBG AI模型管理组件,可实现算法模型在AI边缘设备的部署与应用。
海康威视是以视频为核心的智能物联网解决方案和大数据服务提供商。
海康威视全球员工超34000人(截止2018年12月31日),其中研发人员和技术服务人员超16000人,研发投入占企业销售额的8.99%(2018年),绝对数额占据业内前茅。海康威视是博士后科研工作站单位,以杭州为中心,建立辐射北京、上海、武汉以及加拿大蒙特利尔、英国伦敦的研发中心体系,并计划在西安、成都、重庆和石家庄进行研发投入。
海康威视拥有视音频编解码、视频图像处理、视音频数据存储等核心技术,及云计算、大数据、深度学习等前瞻技术。为PBG(公共服务事业群)、EBG(企事业事业群) 、SMBG(中小企业事业群)三个事业群客户提供专业的细分产品、IVM智能可视化管理解决方案和大数据服务。
海康威视在中国内地拥有32家省级业务中心/一级分公司,在港澳台地区及海外国家/地区有44个分支机构(截止2018年12月31日)。海康威视产品和解决方案应用在150多个国家和地区,在G20杭州峰会、北京奥运会、上海世博会、APEC会议、德国纽伦堡高铁站、韩国首尔平安城市等重大项目中发挥了极其重要的作用。
2010年5月,海康威视在深圳证券交易所中小企业板上市,股票代码:002415。基于创新的管理模式,良好的经营业绩,公司先后荣获“2016&2018CCTV中国十佳上市公司”1、“2017中国中小板上市公司价值十强”2、“2016年A股上市公司未来价值排行以及A股最佳上市公司”榜首3、“第六届中国上市公司口碑榜最佳公司治理实践奖”4、“中国中小板上市公司投资者关系最佳董事会”5"上市公司金牛投资价值奖”和“最佳投资者关系管理奖”6等重要荣誉。
海康威视秉承“专业、厚实、诚信”的经营理念,践行“成就客户、价值为本、诚信务实、追求卓越”的核心价值观,通过不断创新,不断发展视频技术,为人类的安全和发展开拓新视界。
下面我将介绍开放平台提供的这几种服务能力。
我们知道,现在的深度学习算法是数据驱动的,但是用户很难获取海量的训练数据。为了帮助行业用户突破数据鸿沟,AI开放平台提供了基于领域模型的迁移学习能力。AI开放平台训练了大量不同应用领域的领域模型,根据用户的任务,开放平台会自动选择的一个领域模型作为训练基础,然后在这个训练基础上利用场景数据进行迁移学习。
这张图表是对船只图像进行检测的算法实验结果,横坐标是参与训练的数据量,纵坐标是检测精度,虚线是迁移学习结果,实线是全量学习结果。从实验数据可以看到,迁移学习仅用100张左右的训练样本,算法就能获得85%的检测精度;而从头开始训练的话要达到同样性能则至少需要5000张样本。基于领域模型的迁移学习使用户能够用极少量的数据得到一个可用算法,极大的降低了用户在数据上门槛。
为了帮助用户进一步突破数据瓶颈,平台还开发了虚拟数据引擎,它利用三维建模、光线追踪、对抗学习等技术生成虚拟数据来丰富训练样本。第一个视频展示了虚拟生成的不同摆放位置和角度的货架商品样本;第二个视频展示了通过模拟光斑,字符叠加效果,虚拟生成的制造工件样本;第三个视频展示了通过三维建模,虚拟生成的室内场景。
虚拟数据引擎可以帮助用户丰富训练样本,大大降低了用户的数据成本。
除了数据准备之外,深度学习算法设计也是一件艰难的工作,它包括神经网络结构的设计和超参数的调整,一般都需要资深的算法工程师参与。为了帮助算法设计能力不足的用户,我们开发了模型架构搜索算法,该算法用庞大的计算能力自动寻找神经网络模型的最优解。由用户提交任务并设定约束条件,例如算法所消耗的计算资源和内存资源,由检索引擎自动完成算法设计工作。AI开放平台投入了大规模并行训练系统用以支持模型架构搜索服务上线。
在完成模型训练后,算法在产品端的移植工作也需要投入大量研发工作。为了提升从算法到产品的研发效率,开放平台开发了AI编译器,AI编译器利用神经网络图优化、汇编优化、指令编译优化等技术手段实现了算法在各类芯片平台上的自动优化及部署。由上图可以看到通过AI编译器自动优化的算法,其执行效率大幅度优于通用的优化方法。AI编译器现在已经支持多种云端及边缘端的计算平台,使得人工智能算法在海康前后端产品的移植变得非常便捷。
AI开放平台开放了大量海康已有的智能应用能力供行业用户调用,包括各种视频感知及跨媒体感知的能力。我们开放的视频感知能力包括各种目标的属性识别能力,以及对多种物品和行为的精准感知能力;平台还提供文字识别和语音识别能力。平台还提供多种跨媒体信息的融合感知能力。AI开放平台通过萤石云上线我们的智能应用服务。
人工智能技术在我国实体经济中大规模落地,需要人数众多的AI从业者进行持续的大众创新和群智涌现。但是现在AI从业者面临的一个难题是往往缺少合适的产品来承载他们的算法,为此我们开放了前后端全系列的人工智能硬件产品,以帮助AI从业者,实现他们自己的AI功能及方案。
1、支持OCR图像文字识别模型:可应用于图像文字和标签内容的分析与识别场景;
2、支持数据智能标注:用户标注少部分图片后可由系统自动完成剩余数据标注;
3、支持模型授权:基于边缘设备序列号生成授权license,实现模型在边缘设备中的运行授权,保护模型资产;
4、缺陷修复。