Google:有时复制的内容更相关
Google的John Mueller回答了有关Google如何处理复制内容的问题。Mueller的答案涵盖了不同种类的重复内容。他以对内容和相关性的原始来源的观察结束了他的回答。
Google如何确定原始内容来源?
提出这个问题的人想知道Google如何确定哪些内容是原始来源,以及复制了哪些内容。
问题:“ Google如何确定特定的……内容是否被复制以及该内容的原始来源是谁?”
约翰·穆勒给出了一个广泛的答案,它使用了不同种类的复制内容作为示例(例如整个网站上使用的样板内容)。这种方法的作用是全面概述了Google必须处理的各种复制内容。
谷歌的穆勒解释了谷歌如何处理复制的内容以及为什么该副本可以超越原始内容的原因穆勒回答:“我认为这在某些方面有些棘手……在某些方面,这确实很容易,因为如果您获取一段文本并进行搜索,那么它与网络或其他页面上的文本完全相同,那么这很好表示这是复制的内容。
因此,如果您复制的内容更像样板文字,则您在网站底部拥有……法律免责声明。您在网站的所有页面上都拥有此内容。
然后从技术上讲,这就是复制的内容。但实际上对我们而言,这并不是真正的问题,因为这些是人们通常不希望寻找的东西。不是他们在搜索法律免责声明,而是想找到您的网站。
他们正在寻找您的主要内容。并且在这方面,我们尝试适当地权衡复制的内容,但仍然像在看您网站的其余部分。
很容易识别出这些页面上有复制的内容,但是很难弄清楚我们应该如何处理这些复制的内容。”
确定内容的所有权很困难
在下面的段落中,音频显示为乱码,这就是为什么某些引用在括号中的原因,因为这是我对穆勒所说内容的估计。约翰·穆勒谈到了内容的作者身份,特别是在确定谁是主要作者方面存在困难。
穆勒说:“(关于该内容的作者或所有者),我认为我们不会对此做出任何判断,因为这确实很棘手,就像……我们无法确定谁是所有者。”
为什么复制的内容比原始内容更重要
以Google自己的博客帖子为例,说明了Google算法将其他网站排在Google自己的内容之前。他说这与相关性有关。“有时候,最先写这本书的人并不是最相关的那个人。因此,我们经常看到这种情况,例如在我们自己的博客文章中,我们将撰写一篇博客文章,然后将要共享的信息放在我们的博客文章中,然后有人会复制该内容,他们会添加很多有关它的更多信息。就像,这是Google真正想告诉您的,就像在两句之间阅读以及Google算法的秘密。
当有人搜索时,好像他们想找到原始来源。也许他们想找到更详尽的内容…对内容本身的探索。因此,仅仅因为某物是原创的,并不意味着当某人正在寻找该信息时,它才是最相关的。”
原创并不总是意味着相关
对报价进行报价并提供评论通常被认为是合理使用。Mueller证明,内容更重要的是内容与用户查询的关系。有时,这可能意味着确保内容能够回答某些搜索查询中固有的原因,方式和类型问题。