2024年6月9日发(作者:)
业界sdk对比
1、 Face++ 中国
2014 年上半年,Face++ 连续在 3 个世界技术比赛获得排名第一的成绩,显示出团队
雄厚的技术实力,包括:
(1)人脸检测(在照片中精准定位人脸位置的算法),在世界公开评测集 FDDB 排名第一;
(2)人脸关键点检测(精准定位面部关键部门的位置),在世界公开评测比赛 300-W 排名
第一;
(3)在最重要的互联网图片人脸识别(Face recognition)比赛 LFW 中,Face++ 团队更是
力压 Facebook 人脸识别团队(前被 Facebook 用 6000 万美元收购的 团队),获
得世界第一。在极难识别的互联网新闻图片上,获得了97.3%的准确率。
脸部识别归类可为两个大场景,“一个叫做静态的人脸识别,一个叫动态的人脸识别,
静态的意思就说基本上是基于一张照片,和一个数据库来去做人脸这种识别和比对„„第二
个动态,基本上意思是说,基本上在这种视频这种监控的视频里,然后可能在人这种可能在
运动的情况下,对它进行人脸的抓拍和识别。”
第一种静态人脸识别的技术成熟度已经很高,Face++ 的合作伙伴大部分基于这个类型,
一个是识别人的脸部特征,从而实现精准的调整。比如在和美图系产品合作的时候,Face++
就提供人脸检测、人脸追踪、关键点检测技术,让 app 可以精确定位人脸当中需要美化的
部分。二是实现身份的识别。2013 年世纪佳缘使用 Face++ 的技术,推出“最佳伴侣”通
过人脸识别技术对网站的人脸数据库进行分析、精准配对,让世纪佳缘的会员可以相互匹配。
因为在该方面技术成熟,Face++ 的技术还应用了支付宝的“刷脸支付”,以及各个金融公司
的身份验证环节当中。
第二种在动态人脸识别方面,因为技术挑战难度更大,目前只达到相对可商用化的程度。
这方面的挑战,“从视频监控角度来看,有一类叫‘通道式’,比如放在机场安全门上的监控
摄像头,它可以抓拍到大部分人的正面,所以它的动态人脸识别难度不高,可以只识别高质
量的正面照片。不过,如果是在火车站这种开放式的场景下,动态的人脸识别的难度就很高
了,一是分辨率低,二是角度千变万化,识别系统需要一套多张的照片结合 3D 建模和识
别的方法来提高人脸识别的精度。”
Face++ 的发展有两个比较重要的里程碑,一是 2012 年将“脸部识别云平台”将这个
概念产品化;二是在今年将脸部识别与金融行业的应用结合起来,“相当于将从一个比较泛
的平台到一个可以被落地的场景化产品”。
Face++ 已经和中信银行、江苏银行、网商银行、积木盒子、拍拍贷、小米金融等金融
公司达成合作,将脸部识别技术融合进他们的产品当中。印奇解释,金融公司将脸部识别当
成高效、安全的验证手段,广泛运用在银行的各个业务里,包括柜面的辅助验证、以及高额
放贷等等。”
2、 Vuforia
这个以前是高通旗下的,不过后来就卖出去了,说到想找个现成的AR SDK用,一般都
还是会去找高通的vuforia,metaio或者point cloud。虽然免费版会要求有水印,可是至少可
以用到,而且在AR稳定性上比较有保证。商业sdk的话,feature最多的是metaio,但是被
收购了,停止服务了。vuforia的工程质量最高,跟踪效果最好,但是可惜feature太少。
提供android sdk,ios sdk,unity3d sdk. 满足开发者的需求。
高通 SDK 可以直接做 AR,如果你想创业做 AR 相关的应用,那么推荐用高通 SDK。根据
我这段时间找的结果,高通的sdk是追踪效果最好的从技术角度和其他:
基于高通sdk,直接调用现有的API就可以完成识别和跟踪。只需要获取识别跟踪后的
POSE矩阵用于绘制即可。绘制的话,可以使用Unity3D,或者可以直接使用OpenGLES进行
模型渲染以及模型动画解析。当然用Unity3D的好处是可以简化很多学习成本,使用
OpenGLES的话还需要耗费不少功夫,而且现有的好用的渲染,动画开源代码的不多,很多
要自己写,初学者不推荐。所以优点是可以迅速上手的解决方案。基于高通sdk开发的应用
会有水印,如果想去掉水印,或者想用云识别版本是要付费的。高通Vuforia SDK是一个完
整的AR解决方案,如果你检索Vuforia+Unity3D这样的关键字会发现做一个AR简直就是分
分钟的事情,你可以直接使用它的预制件或者是API接口进行开发。
/question/29205313
3、 OpenCV
OpenCV是一个较为底层的计算机视觉处理的库,利用这个库你可以在掌握了AR的核
心算法以后自己去实现类似的功能,但是这条路会走得很艰难
OpenCV 没有直接能用的 AR 功能,包含一些组件,可用来构建 AR 功能。如果你想创业
做 AR SDK,那么 OpenCV 是绕不过去的。
基于OpenCV。Markless的识别和跟踪都没有现成的比较能用的开源代码,能找到的开
源代码大多是基于Marker的,而且效率都很低。做AR识别和跟踪部分都需要自己开发。
而此部分学习成本,开发成本都比较高。想达到高通的效率/准确度/robust 非常难。虽然
这部分论文能找到还不少。但是实现起来会发现各种各样问题。优点的话,就是提高了自学
能力。但想达到商用的程度,难度很高。
针对Markerless的AR开发,我认为有几个方面是比较难做到的。目前的开源代码基本
都做不到这几个方面。
1. 效率。大多数开源代码都是在PC上运行。PC比起手机至少要快10倍以上。如何
在手机,甚至配置较差的手机上也可以实时运行,需要算法改进和效率优化。
2. Robust。这一点是最头疼的。用一下高通的效果就明白,他们这一点太强了。传统
跟踪方法很容易跟丢的(比如手抖了一下,快速移动旋转,Blur以及光照亮度变化很大时候)。
3. Pose准确度以及消除累积误差。需要保证跟踪期间Pose始终正确,而且倾斜一定
角度后依然完全匹配原图。
4、 Realmax
现在Vuforia已经不再是开发者们首选的SDK,现在开发者们都在使用Realmax SDK,它
不仅支持最基本的marker识别,还支持面部识别、手势识别、声音识别等,还具有Vuforia
不具备的slam技术,其稳定性和扫描的速度也远超Vuforia。
跟Vuforia最大的区别就在于:x支持SLAM,可以在不用识别图的情况下做增
强现实效果。x的稳定性还有识别速度比Vuforia强,不会出现在识别图上模型抖动
的情况。
5、 D’Fusion
这个目前提供商业增强现实方案,也比较多人用这个实现增强现实,分为三个版本,手
机,家庭,专业版本。
手机版本:支持设备包括iPhone, iPad和Android手机和平板,这个是专门为移动设备而设
的增强现实应用程序。
家庭版:电脑上的增强现实,可以在不同的平台和浏览器操作,无需安装特别的硬件。
专业版本:需要专业设备,需要配上有特殊功能的装置(例如高清视频、多镜头照相机、红
外线照相机或特殊传感器)使用。
此外:D’Fusion Studio,可以用来创建增强现实的程序。免费增强现实SDK软件包
官网
:D’Fusion Studio Suite
6、 Wikitude
可以实现图像识别和追踪、3D模型渲染、视频叠加以及基于地理AR等核心技术。不过
要收费。Wikitude(维基AR)是世界知名的AR软件提供商,总部位于奥地利维也纳。在2015
年Metaio被苹果收购后,Metaio和Wikitude这两家来自德国和奥地利的公司分别代表了苹
果和谷歌两大阵营。AR in China 增强现实中国也会在2015年8月15日正式在技术论坛中
开设Wikitude版块,更新Wikitude中文教程和在线技术解答。Wikitude(维基AR)与Metaio
软件架构相似度达到80%。下面是Wikitude,Metaio和高通的功能对比。
标记追踪
图像追踪
三维物体追踪
LBS位置信息追踪
人脸追踪
支持 安卓
支持 iOS
支持 Windows PC
支持 Unity 3D
Metaio
√
√
√
√
√
√
√
√
√
Wikitude(维基AR) Vuforia
√
√
√
√
√
√
√
√
√
√
√
√
√
√
√
√
√
√
√
支持 AR语言(Js+HTML5跨平台编程) √
支持 独立3D引擎
支持 AR智能眼镜
支持 云端AR识别
√
√
√
支持 不限制图片数量的云识别 √
√
√
√
√
√
支持 线下识别+云端识别混合模式
有 图形化编辑器
有 免费的AR浏览器
有 中文教程
√
√
有 中文技术支持
/topics/390787189/
7、 ARLab
提供了 AR浏览器、图像匹配、3d引擎、对象跟踪、影像追踪、虚拟按键等技术。
官网:ARLab Augmented Reality SDKs
8、 视辰EasyAR
最后顺带提一下国内的EasyAR,PC和移动多平台支持,完全免费,虽然目前暂不开源。
EasyAR
EasyAR和视+都是视辰信息的产品。,如3D物体识别、云识别、SLAM、
9、 HiAR
是亮风台信息科技打造的新一代移动增强现实(AR)开发平台,提供一整套世界领先的
增强现实(AR)技术服务。
发布评论