挑战与解决方案
12月1日,在某中心的re:Invent 2020大会上,宣布推出视觉异常检测服务。这项异常检测解决方案使用机器学习技术,每小时可处理数千张图像,用于发现制造缺陷和异常情况——无需任何机器学习经验。
这项新服务意味着制造商可以将相机图像发送给视觉异常检测服务来识别缺陷,例如机器部件上的裂缝、面板上的凹痕、不规则形状或不正确的产品颜色。该服务还利用少量样本学习技术,客户可以通过提供小批量图像(有时少至30张图像,包括10张缺陷或异常图像和20张“正常”图像)来评估机器部件或制造产品。随后,该服务会报告与基线不同的图像,以便快速采取适当措施。
由于现代制造系统经过精细调整,缺陷率通常为1%或更低。然而,即使是小缺陷在更换、退款或客户信任减弱方面也可能造成巨大损失,因此发现和标记这些被遗漏的缺陷仍然至关重要。
技术挑战
“发现缺陷主要有两种方式。一种是人工检查,自古以来一直在使用,”某中心首席产品经理表示。“另一种是使用机器视觉系统,这些专用系统拍摄图片,具有硬编码规则,且不会在学习过程中改进。”
除了不具备迭代性外,一些公司缺乏内部专业知识来针对其特定环境微调这些系统。“外部专家可能需要数月时间才能进入,了解您的环境并设置规则,”该经理说。“然后您更换一个供应商部件,机器视觉系统就开始说‘这是一个差异’。然后您必须请回该专家重新校准系统。”
此外,从制造过程到缺陷识别方式,甚至缺陷本身都受到数量惊人的变量影响。
“不仅要考虑异常类型,还要考虑您会发现异常的分布,”某中心高级应用科学家说。“这是我们通过训练模型和数据收集必须解决的一个重大挑战。我们与一个缺陷率在0.1%范围内的客户合作,但这些是必须找到的关键缺陷。因此,我们开发系统的数据应尽可能反映该分布。”
数据收集创新
科学家和工程师们很早就意识到,他们训练模型的样本缺陷与车间现实不匹配。
“我们有相当明显的异常类型示例,巨大的划痕,糟糕的盒子,虽然这可能发生在某些物体或某些用例中,但我们的客户要解决的异常类型要微妙得多,”某中心高级项目经理说。
当科学家和工程师团队考虑面临的挑战范围时,他们意识到存在数据问题。“我们早期的挑战之一是数据问题,以及我们是否有足够的数据来真正形成关于服务应该做什么的强烈意见,”该经理说。
通过与处理计算机视觉注释任务的第三方供应商合作,团队开始探索实际工厂。
“我们试图在制造领域捕获数据,以引导部分数据收集过程,”该经理说。“然后我们有了一个‘大胆思考’的想法。”
模拟工厂解决方案
团队意识到,寻找所需的各种数据需要独特的方法。“基于与客户的对话,我们知道需要尽可能接近地复制生产环境,”该经理说。
解决方案:在印度创建一个模拟工厂。团队开始采购传送带和相机,以及各种类型的物体来模拟不同的制造环境。目标:创建包括正常图像和物体的数据集,然后绘制或创建合成异常——缺失组件、划痕、变色和其他效果。
“我们有多种不同质量的相机,因为我们想考虑RGB、灰度以及不同价格点的相机等因素,”科学家说。“传送带有多种变化我们可以尝试,例如,通过改变皮带纹理或皮带颜色。”
“我们还在尝试解决或监控照明条件、与物体的距离、固定位置的相机,客户实际会尝试自己实现的事情,”经理补充道。
微调模拟工厂使其输出有用也需要大量协作。
“试图弥合科学与工程之间的差距是一个迭代过程,”经理说。“我认为我们从五到十个训练数据集开始。我们会与科学团队一起审查它们,他们不可避免地会对什么有用或无用提供反馈。我们在这个过程中学到了很多。”
这就是团队应用少量样本学习(用尽可能少的训练对数据进行分类)派上用场的地方,允许他们偶尔在完全没有缺陷图像的情况下工作。
“制造中的异常本质上是罕见的,因此在组装训练集时难以获取,”科学家说。“我们的模型可以仅用正常图像进行训练来解决这个困难。生成的模型可以部署或用于在未标记的图像集合中使用我们的‘试验检测’功能挖掘异常,以扩展训练集。”
这种现实生活中的试错迭代过程最终导致了视觉异常检测服务的开发——而这个学习过程才刚刚开始。
“我们意识到这次发布真正代表一个开始,而不是结束。一旦部署,我们知道我们将面临挑战服务的独特情况,我们将从中学习,”经理说。“该服务必须足够多功能以泛化到各种应用;随着时间的推移它会变得更好。我们在发布周期中从客户那里获得的反馈越多,我们获得的知识就越多,系统性能就会越好。”
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)
公众号二维码
公众号二维码