最近,我在电视上看到一些内容,不禁感慨时间过得真快。感觉巴西里约奥运会才刚刚结束不久,2020年东京奥运会就已经临近。在这次东京奥运会上,NEC公司将使用自己旗下的人工智能NeoFace来进行大规模的人脸识别工作。这套系统预计将应用于超过三十万人,包括运动员、志愿者、观众以及媒体人员。NEC的人脸识别技术已经通过了美国国家标准与技术研究所的基准测试,目前处于世界领先地位。
虽然时间过得很快,但我却联想到了另一位“捕神”——张学友。张学友不仅是歌坛巨星,还是一位出色的“协警”。今年初,他在四场演唱会上帮助警方抓获了五名逃犯。这样的故事让人惊叹不已。
我们都知道,图像识别技术是人脸识别技术的基石。例如,当我们试图识别一个人的面部特征时,通常会关注其最显著的部分,如嘴巴和鼻孔。研究表明,当人们观看图像时,视线往往集中在图像的主要特征上,即图像轮廓曲度最大或轮廓方向突然改变的地方。这些位置包含的信息量最大,且眼睛的扫描路线也会依次从一个特征转移到另一个特征。此外,大脑中有一个机制负责整合这些信息,使我们能够综合理解图像的内容。
图像识别技术在各行各业中有着广泛的应用。谷歌的TensorFlow、Facebook的DeepFace以及微软的Project Oxford都是图像识别领域的知名系统。据预测,到2022年,全球图像识别市场的规模将达到422亿美元。
图像识别技术与人工智能紧密相连。今年初,谷歌推出了一款名为Cloud AutoML Vision的新工具,允许用户在自己选择的数据集上训练机器学习系统。这款工具简化了机器学习的门槛,使更多不具备专业知识的用户也能使用。
图像识别技术的核心在于模式识别。通过大量标记图像的训练,系统可以识别图像中的特定模式。例如,气象学家可以利用图像识别技术分析云、雨、雾、霜等天气现象,并不断优化软件性能。图像识别技术的进步离不开科学家们的努力。斯坦福大学教授李飞飞的团队曾对图像识别的发展历程进行了深入研究,他们将识别错误率从28%降低到了2.3%,取得了巨大成就。
当前,AI图像识别技术虽然能够识别物体,但科学家们更加关注如何训练出能够识别物体之间关系的系统。李飞飞教授提到,尽管我们可以搜索“男人穿套装”或“可爱的狗狗”这样的关键词,但在搜索更为复杂的句子,如“一个穿着红衣服的小女孩在和一个穿着蓝衣服的小男孩在海边踢足球”时,现有的技术还难以满足需求。这是因为目前的图像识别模型主要是基于对象的,它们无法真正理解对象之间的关系。
在硅谷,有一支团队致力于解决图像识别中的关系识别问题。这支团队由Neuron Drop的创始人兼CEO Gordon Lu领导。Gordon认为,AI 1.0时代主要是识别物体,而AI 2.0时代则要识别物体之间的关系。Neuron Drop是一家位于美国硅谷的AI公司,专注于动态视觉识别技术。他们开发的分布式智能深度学习算法DCNN能够在无需海量数据的情况下进行自我学习,从而大大降低了人工智能的训练成本。
Neuron Drop的算法独特之处在于,即使没有数据,也可以实现高精度识别。例如,他们可以通过有限的数据识别出《蒙娜丽莎》的真迹。此外,Neuron Drop还能够根据动态物体和人的行为特征构建模型,提高了识别的准确性。在实际应用方面,Neuron Drop的系统已经在大型国际会议、音乐会的安全保障以及高铁和高压线维修等领域得到了应用。
总的来说,图像识别技术正在快速发展,并有望在未来进一步提高识别精度,节省大量人力物力资源。我们期待着图像识别2.0时代的到来。