成员自1984年以来

了解更多

AIA - 推进的视觉+成像已转变为促进自动化协会,愿景+成像,机器人,运动控制和工业AI产业的领先全球自动化贸易协会。

内容提交:

工业:
N / A.

应用:
N / A.

视觉技术如何建造消费者和品牌之间的桥梁

发布11/08/2019.

 | By: Dan McCarthy, Contributing Editor

随着许多视觉工程师所知,较大的人口并不总是快速掌握编程计算机的概念或实际应用“看”。然而,由于消费者越来越依赖个人数字技术 - 包括个人电脑,智能手机,平板电脑和嵌入其中的相机 - 进取企业发现申请和货币化消费领域视觉技术的方法只是时间问题。

许多新兴应用都采用了一种熟悉的创新形式,比如使用摄像头和软件来积极增强购物者的体验或优化店内广告。但是,要将视觉技术转化为消费者市场,大多数视觉技术通常必须采用一种更友好的形式——甚至达到隐形的地步——因为我们大多数人都不是工程师。

12月,我们将更仔细地审查愿景如何帮助驾驶零售4.0。目前,零售店上方和下方的价值链一目了然显示充足的证据表明视觉技术也能够赋予他们寻求直接参与的品牌和消费者。

图像识别变得更聪明
在工业领域,对摄像机采集到的图像数据进行缩小和优化是非常重要的。在这方面,消费者领域更为宽容。数以百万计的消费者每天用他们的智能手机、平板电脑和电脑拍摄照片和视频,通常很少考虑灯光或构图。但图像质量的损失被大量的图像数据所弥补,这些数据通常被分享到社交网络上。

对于能够自动搜索,排序和检索相关内容的企业的MATRIVELEVERY库的庞大图书馆存在值。随着人工智能和深度学习工具的发展,许多企业正在利用这些工具来装备电脑,以便更像是消费者所做的更像。

技术贝尔夫人如亚马逊谷歌IBM.,微软例如,所有在AI驱动的图像识别软件中都投入了能够自动识别和标记图像内容以及比人类观看者的图像内容。一种流行数字研究比较来自所有四家公司的图像识别技术与人类运营商测量每个图像返回的标签数量,如何准确这些标签,以及置信程度如何与精度相关。

值得注意的是,该研究发现,所有四个软件平台都标记了比人类运营商在图像中的更多项目,但通常以成本为那些标签的准确性。

然而,准确性的间隙并不重要。从人行运营商计算的总精确度分数为87.7%,它发现了Google Vision,亚马逊的重新识别和微软Azure标记的图像内容,可分别具有81.7%,77.7%和75.8%的准确度。IBM的Watson仅实现了55.6%,尽管它在描述性标签中展示了更好的自然语言处理,它有利于它。

总的来说,该研究表明,图像识别软件有一种方法可以匹配或超过用于识别原始图像内容的人类能力。尽管如此,它已经足够高,以增加受控设置下的显着价值,例如自动标记电子商务服务器上的大规模产品库存或搜索庞大的图像库以获取非常特定的内容。

通过成像来吸引消费者
随着社交媒体领域的出现,主要品牌迅速了解到监控社交网络以旗帜,并回应其产品和服务的提升。早期的问题是该文本只形成了在线发布的社交媒体用户的一部分。产品或徽标的图像和视频可以同样重要。但除非消费者标记照片,否则品牌有限于他们能够跟踪在诸如Facebook和Twitter等流行网络上的图像。它们几乎对消费者反馈视而不见,更具视觉上导向的网络,如Instagram,Pinterest和Snapchat。

谈判者,品牌和徽标等公司通过开发图像检测软件来改变这一点,可以在社交网络共享的图像中单挑到图像中的品牌标志。他们现在允许在线社区经理执行品牌,跟踪反馈,参与用户,并且在进入病毒之前可能会出现负面内容。

其他公司,如Clarifai和Gumgum,也提供视觉上的社交媒体聆听工具,但他们利用深受学习的工具来提供进一步的情报。Clarifai提供定制和预借预订的深度学习模型,使品牌能够快速将图像识别应用于其内部图像库。除标记徽标外,Clarifai的解决方案还可以帮助识别图像或视频内的离散对象,包括特定面。Gumgum应用基于AI的应用程序编程接口(API)来扫描图像,视频,重要的是,周围的内容,以优化AD放置并分析品牌赞助的价值。

真实世界的图像搜索和超越
图像识别软件不仅可以帮助品牌识别关于其产品的对话,还可以让消费者识别品牌。传统的电子商务模式采用简化过滤器,帮助潜在买家限制他们对特定商品的搜索,比如毛衣。这不仅要求毛衣供应商为所有产品手动分配标签,而且对于那些可能不太熟悉毛衣命名法的消费者来说,这也是一个不完美的解决方案,因为他们可能不太了解毛衣的命名法,无法在苔藓炭中寻找一件运动的、有罗纹的、半拉链的毛衣。

视觉识别从GumGum和Clarifai api,以及那些驾驶Pinterest镜头的特性,现在允许消费者拍一件毛衣的照片他们喜欢并运行它通过一个智能手机应用程序。程序比较图像的图像数据在线数据库并返回可能匹配——以及信息在哪里购买。

增强现实是视觉技术在视觉上与产品配对消费者的另一种方式。例如,Sephora和Algoface都使得任何带有智能手机摄像机的人都可以分析他们的面部属性,几乎将化妆品与其肤色相匹配,并在购买之前尝试不同的外观。

alloface,它为化妆品品牌提供软件开发套件(SDK),索赔其应用程序根据20种不同的面部特征提出建议,包括年龄,性别,种族,肤色,毛发颜色以及面部的尺寸和形状,眼睛,鼻子,嘴唇等。其SDK还进一步使智能手机相机能够跟踪84个面部地标以捕获用户脸部的自然运动。

学习深度学习
品牌参与中的潜在潜在潜在申请和深度学习已经乘以如此迅速,使内部的应用程序开发能够成为一流的企业。亚马逊网络服务(AWS)开发了可编程DeepLens支持深度学习的视频摄像机以此目的。相机可以在任何行业中与开源软件集成,以简化品牌计算机视觉应用的开发。

该系统本身集成了一个400万像素、H.264编码、1080p分辨率的摄像头、一个Gen9图形引擎和一个英特尔Atom处理器。DeepLens控制台为用户提供了一个预填充的目标检测项目模板,并与rekcognition集成,用于高级图像分析。其理念是帮助不熟悉深度学习的品牌快速学习、开发并应用该技术创建视觉应用,如物体和人脸检测、分类、自动标记等基于品牌的应用。亚马逊的DeepLens网站展示了一个不断增长的用户社区,这些用户正在分享他们的经验和成功,为未来的技术采用者提供信息和启发。

DeepLens的一个成果是dermens,它可以帮助牛皮癣患者与他们的医生和护理团队一起监测和管理他们的皮肤状况。这款应用由独立创业公司Predictably Well开发,利用DeepLens的算法识别银屑病,通过向其提供45张典型的红色和鳞片皮肤图像。每一张照片都配有一个面具,表明患病的皮肤。然后,亚马逊的设备将数据发送给“可预测的好”的配套应用程序,使其能够估计用户病情的严重程度。

消费者可能在很大程度上仍然无知的坚果和螺栓,以及目的地技术如何运作或如何改变他们的生活。但主要品牌迅速成为驾驶订婚和销售潜力的威胁。只要有钱,技术可能会在消费者领域越来越普遍。