如果关系的模量小于 0.3,则可以丢弃这种相关性:在这种情况下,两个变量之间的依赖性太弱,无法得出可靠的结论。
对于我们在研究中分析的所有因素,相关比都小于 0.3,所以我们不得不放弃这种方法。
放弃这种分析方法的另一个原因是相关值对异常值的敏感性很高,并且许多关键词的数据反映了许多这些异常值。
如果将具有附加数据的条目添
加到集合中,则关联关系会立即发生变化。
因此,在存在多个变量的情况下,该指标可能不可行,例如在排 因素 白俄罗斯 whatsapp 号码列表 研究中,它甚至可能导致错误的推断。
最后,很难相信只有一个或两个因素的相关比模量如此接近于一:如果这是真的,那么任何人都可以轻松破解谷歌的算法,而我们都会排在第一位!
常见问题
尽管我们尝试利用前面几点提供的数据来回答该领域专业人士提出的大多数问题,但在这里您会找到一些针对最好奇的读者的答案。
我们为什么不使用人工神经网络?
尽管人工神经网络非常适合处理大量变量,例如图像识别(因为每个像素都是一个变量),但它们产生的结果难以解释,并且不允许我们比较每个因素的权重。
此外,这些类型的网络需要大量数据和大量特征才能获得可靠的结果,而我们收集的数据不适合这种情况。
与随机森林不同,随机森林中的每棵决策树都独立投票,因此可以保证高水平的可靠性,而神经网络则处理目标数据。
没有任何迹象表明在本研究中使用人工神经网络可以获得更准确的数据。
我们对寻找合适分析方法的要求是稳定性和发现不同因素重要性的能力。
因此,随机森林是,因为它提供了许多性质相似的排名因素。
为什么访问量是 google 最重要的排名因素?
放下你的手,我们会回答你。
这或许是整个研究中最具争议的一点。
当我们看到结果时我们也感到惊讶。
同时,我们的算法是在可靠的数据集上训练的,因此我们决定核实事实。
为此,我们排除了自然搜索和付费搜索数据以及社交和 手机号码 引荐流量,只考虑直接流量。
结果几乎相同:职位分布保持不变(该研究第 40-41 页的图表说明了这一点)。
对我们来说这些结果完全合
理,并证实了 google 优先考虑具有更高权限的域名,正如其搜索质量评估指南文档中所述。
尽管看起来域名权威只是一个薄弱的借口和一个模糊而短暂的概念,但这种想法在本文档中被彻底驳斥了。
谷歌并未徒劳无功,于 2015 年出版了这本参考书,以帮助那些追求项目质量的人,并体现出“谷歌考虑用户想要什么”。
这本参考书指出了三个原则:体验、权威性和可靠性是网站 究使用的初始数据 质量最具指示性的价值。
网站核心内容的质量和数量、网站上的信息(即谁对其负责)以及网站的声誉都会影响专业性、权威性和可信度这三个原则。
我们建议您这样思考:如果某个 url 排名在前 10 个结果中,那是因为它包含与搜索相关的内容。
但是,为了确定这些 url 在前十名中占据什么位置,google 依赖于其他参数。