|
(5)由Barry Schwartz
|在谷歌搜索引擎优化下提交的Prev故事下一个故事Tweet分享
Prev故事下一个故事

前一天,我在搜索引擎土地上报道了一篇Wired文章,题为谷歌的手喂AI现在给出答案,而不仅仅是搜索结果。这篇文章解释说,谷歌从本周开始在桌面搜索结果中使用“句子压缩算法”。句子压缩算法是谷歌提取查询的最佳答案的方法,以显示在特色片段中。
当然,这不仅用于特色片段,也用于谷歌Home响应,谷歌助手等。这就是为什么谷歌建立一个更好的方法来获得更多答案是很重要的。
“深度中性网”是一种模式识别系统,它可以通过分析大量的数据来学习执行特定的任务。在这种情况下,他们学会了从网络上的相关页面上选取一个长句子或长段落,并提取出结果——你正在寻找的信息。
这些“句子压缩算法”刚刚在搜索引擎的桌面版上上线。它们处理的任务对人类来说很简单,但对机器来说一直很困难。它们展示了深度学习如何推动自然语言理解的艺术,即理解和回应人类自然语言的能力。谷歌研究产品经理大卫·奥尔在谈到该公司的句子压缩工作时表示:“你需要使用神经网络——或者至少这是我们找到的唯一方法。”“我们必须使用我们拥有的所有最先进的技术。”为了训练谷歌的人工问答大脑,Orr和他的公司还使用了旧新闻故事,机器开始看到标题如何作为后面较长文章的简短摘要。但目前,该公司仍需要自己的语言学博士团队。他们不仅演示了句子压缩,而且实际上用帮助神经网络理解人类语言如何工作的方式标记了语音部分。皮格马利翁团队由全球约100名语言学博士组成,他们产生奥尔所说的“黄金数据”,而新闻报道则是“白银数据”。银数据仍然很有用,因为有太多的银数据了。但黄金数据是必不可少的。负责管理Pygmalion的Linne Ha表示,该团队将在未来几年继续壮大。这种人工辅助的AI被称为“监督学习”,今天,这就是神经网络的运作方式。有时,公司可以将这项工作众包——或者它就自然而然地发生了。例如,互联网上的人们已经在猫的照片中标记了数百万只猫,这使得训练识别猫的神经网络变得很容易。但在其他情况下,研究人员别无选择,只能自己给数据贴标签。
“我想知道你们有没有注意到有什么变化的特色片段,证实了《连线》杂志的报道,这个星期谷歌的桌面搜索上线了?
我问了Glenn Gabe,他跟踪了很多有特色的代码片段,他注意到本周没有明显的变化:
@rustybrick检查了一些收到很多有特色的代码片段的网站,比较了9月/ 10月的快照和当前的代码片段。几乎都一样。
– Glenn Gabe (@glenngabe) 2016年11月30日
论坛在推特上讨论。