Name: 谢奥 科姆皮尤泰尔 SEO Spider 使用指南：第 1 部分 莫斯科
Address: 莫斯科

该工具提供了广泛的功能，从检查元标记的正确性到分析微标记，这使得它对于各种规模的网站的详细分析不可或缺。

在本指南中，我们将了解基本的 SEO 蜘蛛设置和功能，它们将帮助您有效地分析和改进您的网站。

内容：

设置程序
扫描方式
查找重复内容
页面内容不足
查找空白页
检查分析仪表的可用性
标题、描述和标题分析（H1、H2）
服务器响应分析
与外部 API 集成
检查图像可用性和大小
检查微标记

设置程序

内存设置

打开菜单文件→设置→内存分配。

对于大型项目，建议分配 8 GB 内存，或可用内存的一半。

设置数据存储

转到文件 → 设置 → 存储模式。

默认为内存存储。建议切换到数据库存储（硬盘），特别是如果驱动器是SSD，以加快扫描过程。

代理安装

在设置（文件 → 设置 → 代理）中，如果您的 IP 在某个站点上被阻止，您可以设置代理服务器，这将有助于绕过阻止。

设置扫描速度

转到配置 → 抓取配置 → 速度。

Max Threads（线程）的最佳值最多为 5。增加线程数可能会导致扫描期间站点阻塞或过载。

将限制 URL/s 参数保留为每秒 2.0 个 URL。对于 5XX 错误，请将值减小到 1.0 或 0.5 以保持稳定性。

爬虫设置

转到配置→爬网配置→蜘蛛→爬网。

如果您只想扫描站点的选定部分，请取消选中“检查开始文件夹之外的链接”选项。启用“在开始文件夹之外抓取”会将抓取区域扩展到网站上的所有链接。

如有必要，请激活“抓取所有子域”选项以抓取子域，并使用 nofollow 属性配置抓取链接。

设置 XML 站点地图处理

不要忘记启用“抓取链接的 XML 站点地图”选项来分析可能没有直接链接但在站点地图中列出的页面。

扫描方式

蜘蛛模式（默认）

这种模式模仿搜索引擎的行为：从主页开始，使用内部链接对网站进行爬网，深入到结构的各个级别。

列表模式

您可以上传包含要抓取的 URL 的文件、手动输入它们或使用 XML 站点地图的链接。

从文件 — 上传带有 URL 的文件。
手动输入 — 手动输入 URL。
粘贴 - 粘贴复制的 URL。
下载 XML 站点地图 — 发送 XML 站点地图的链接。

搜索结果页面模式

此模式仅分析标题和描述。该模式使用频率较低，适合简单的元数据检查。

比较模式

允许您比较不同扫描的结果，对于跟踪更改或排除错误非常有用。

查找重复内容

转到配置→抓取配置→内容→重复。

当启用“仅检查可索引页面的重复项”选项时，程序将仅在可用于索引的页面中搜索重复项。

“启用附近重复项”选项允许您设置内容匹配百分比，这有助于您找到隐藏的重复项。

页面内容不足

您可以在“内容”→“全部”部分中查看结果，按字数对页面进行排序。内容很少的页面对于搜索引擎来说可能不太有用。

查找空白页

对于具有产品目录的网站特别有用，您可以在其中识别唯一内容不足的页面。为产品卡定义正确的类或 ID 并设置过滤。

检查页面上的计数器

要检查分析计数器（例如 Yandex.Metrica 或 Google Analytics）的可用性，您可以通过将计数器编号插入搜索设置来使用页面代码搜索模式。

标题、描述和标题分析（H1、H2）

扫描站点后，您可以在页面标题部分查看元标记和标题。检查以下几点很重要：

缺失 - 缺少标题标签。
重复 - 不同页面上重复标题。
与 H1 相同 - 如果标题与 H1 匹配。
多个——一页上出现多个标题。

服务器响应分析

我们在响应代码部分查看结果。请务必注意 4xx 和 5xx 等错误；必须更正它们才能正确加载页面。

发送请求，我们将提供咨询在谢奥推广您的网站