中存储网消息,据美国科技博客 GigaOm 1月14日报道,中国搜索引擎公司百度称已经建立世界最精确的计算机视觉系统——深度图像(Deep Image),运行于超级计算机Minwa 上。百度称其在ImageNet物体分类测试中的错误率为5.98%,而在2014年的比赛中,谷歌的GoogLeNet团队以6.66%的错误率胜出。在实验中,人类的识别错误率为5.1%。
ImageNet计算机视觉挑战比赛是目前国际上最大规模的图像分类和识别测试平台,每年举办一次,吸引众多学术机构和实验室参与。
近年来,深度学习研究者们常常使用GPU加速数字图像处理算法。百度首席科学家吴恩达(Andrew Ng)博士是人工智能领域最权威的学者之一。他曾做过一个实验,得出的结论是三台服务器共装了12个GPU就可以达到12 teraflops 的运算能力,远远超过谷歌1000节点CPU群的运算能力。但目前尚没有公司能建立这样的系统。
百度重投深度学习,并取得一定成果。去年12月,吴恩达和阿瓦尼•哈努恩(Awani Hannun)领导的百度研究团队的10名成员宣布,他们开发出了一种更加精准的语音识别技术。吴恩达表示,在嘈杂的背景中进行测试的结果显示,Deep Speech的错误率比谷歌语音API、Wit.ai、微软必应语音和苹果Dictation低了10%。
然而百度并非是唯一一家重投深度学习并且获得成果的公司。谷歌手机翻译APP刚获更新,支持实时语音转文本,这说明谷歌已经开始应用相关科研成果。Facebook开始在人工智能领域布局,主要围绕着其用户的社交关系和社交信息展开。此外,雅虎、Twitter和Dropbox 也组建深度学习和计算机视觉团队。
声明: 此文观点不代表本站立场;转载须要保留原文链接;版权疑问请联系我们。