随着图像识别技术的不断发展,Google 推出了一个新工具,旨在提升我们寻找所需图片的效率。尽管许多人依赖文字搜索来获取信息,但图像和视频搜索无疑将是未来的发展方向。虽然 Google Photos 已具备一定的图像搜索功能,但显然还有改进的空间。
然而,Google 近日宣布了一款名为 Google Cloud Vision API 的强大图像识别工具。这一工具特别适合开发者们,使他们能够开发出能识别图像内容的应用程序和机器人。
Google 在其博客上详细介绍了这款工具的功能。
Google Cloud Vision API 基于机器学习技术,这项技术之前已被介绍过,并且最近已经免费向开发者开放。
该工具的核心功能是通过学习来识别图片内容。它能够迅速将图片归类到数千个大类别中,如船只、狮子、埃菲尔铁塔等。此外,它还能检测图片中的人物表情,并识别图片上的文字。
在 Google 看来,Google Cloud Vision API 拥有多项吸引人的特性:
Google Cloud Vision API 能够从数千种图片分类中识别出图片中的实体。用户还可以根据自己的需求创建自定义的元数据,以便更好地适应自己的分类标准。
Google Cloud Vision API 的光学字符识别技术能够识别图片上的文字内容,并支持多种语言。
Google Cloud Vision API 的安全检测功能可以识别图片中不合适的内容,从而帮助用户避开不适宜的信息。这一功能基于 Google 的 SafeSearch 技术。
Google Cloud Vision API 的面部识别技术能够检测图片中的人脸,并识别出眼睛、嘴巴等器官,还能识别出包括快乐、悲伤在内的八种情绪。为保护用户隐私,Google 承诺不会在任何服务器上存储面部信息。
Google Cloud Vision API 的地标检测功能可以识别出世界著名自然和人文景观,并标注出它们的地理坐标。
Google Cloud Vision API 的 Logo 检测功能可以识别图片中的知名品牌标志。
以下是几个示例:
[图片]
有了这款工具,机器识别图片的能力将大幅提升。以前,我们无法让计算机自动为我们筛选照片,但现在,只需输入特定的“类别”,计算机就能为我们找到合适的图片。
对于开发者而言,这提供了更多的可能性。在未来,机器人可能会根据我们的面部表情来选择合适的问候语,或者我们在网上搜索图片时将更加精准。
当然,对于 Google 而言,这也是一个重要的里程碑。在这一领域,亚马逊和微软已经取得了显著进展。Google 之前推出的预测型 API 产品功能有限,没有涉及图像识别。因此,这次的举措对 Google 来说是一次重大的突破。
目前,Google Cloud Vision API 在 Google 云平台上提供有限的预览版。未来,Google 计划将其集成到 Google 云存储中,以扩大其应用范围。感兴趣的读者可以在 这里 提交注册申请。
本文参考了 VentureBeat、Business Insider 和 Time 的报道。本文由极客公园原创,转载请联系 jianghaoke@geekpark.net。