击败谷歌! 微软图像识别系统准确率排名第一

图灵汇官网

12月11日,在第六届“ImageNet图像识别大赛”中,微软研究院的图像识别系统在多个类别中获得了优异的成绩,超越了包括谷歌、英特尔、高通在内的众多竞争对手。

据了解,微软所采用的系统名为“图像识别深度残差学习”。该系统由何恺明、张祥雨、任少卿和孙剑组成的团队研发。微软计划在未来发表的论文中详细介绍这一系统的技术细节。

据微软研究员介绍,该系统能够训练超过150层的神经网络,并通过“深度残差学习”框架显著提升了图像识别的准确性。这种技术上的突破是许多传统网络难以实现的。

图像识别技术正受到越来越多科技公司的关注,因为它们希望通过这项技术来优化内部系统并改进面向用户的产品。微软通过几款有趣的移动应用,如“我看起来有多大”和“我的胡子怎么样”,展示了其在图像识别领域的技术实力。此外,微软还通过“牛津项目”尝试将图像识别技术商业化。

在第六届“ImageNet图像识别大赛”中,参赛者需要从Flickr和搜索引擎中选取的10万张照片中进行精确分类,涉及1000种不同的类别。微软的系统在分类错误率和定位错误率方面表现尤为出色,分别为3.5%和9%。

过去几年,谷歌、初创企业larifai和NEC在图像分类的准确性上也有不错的表现。对于微软取得的优异成绩,研究人员表示感到惊讶。

值得注意的是,中国互联网巨头百度未参加今年的比赛。原因在于去年的比赛中,百度被发现存在严重的违规行为,随后公司对此进行了公开道歉并解雇了相关负责人。此事引起了广泛关注,甚至被MIT科技评论专门报道。主办方因此对百度实施了一年的禁赛处罚。

本文来源: 图灵汇 文章作者: 许晨