如何书写robots.txt文件,有哪些关键字符

什么是robots文件;书写方法:User-Agent的用法,Allow的用法,Disallow的用法,通配符*,结束符;书写文件的注意细节

robots文件是我们seo教程中必学的一个知识点,作为一名seoer必须掌握robots文件的作用、书写等知识,今天跃飞seo就给大家梳理一下robots文件的写法与注意细节等知识点。

如何书写robots.txt文件,有哪些关键字符

一、什么是robots文件

robots.txt文件(也称为爬虫协议、机器人协议等)是专门给搜索引擎的蜘蛛机器人看的,搜索引擎蜘蛛抓取的第一个文件就是robots文件。robots是站点与spider重要的沟通渠道,通过这个文件,蜘蛛可以了解到网站那些内容可以抓取,那些页面不可以抓取,当然,我们也能直接屏蔽掉蜘蛛的访问。对于seo人员来说,我们可以通过书写robots协议来限制蜘蛛抓取某些不参与排名或不利于排名的文件,不仅可以保护文件隐私更能减少蜘蛛爬取造成的服务器压力。

二、robots文件的书写方法

robots文件的书写很简单,大家学习seo教程时,只要记住3个词和2个符号就好,3个词是User-Agent,Allow,Disallow,2个符号是*,$

1、User-Agent的用法

含义:定义搜索引擎蜘蛛,常见的蜘蛛有,百度蜘蛛(Baiduspider),谷歌蜘蛛(Googlebot),360蜘蛛(360spider),搜狗蜘蛛(sougouspider)等,*代表所有蜘蛛

用法:user-agent: 搜索引擎蜘蛛名

比如:User-Agent: Baiduspider,定义百度蜘蛛,然后再用下面的Allow,Disallow来限制百度蜘蛛可以爬取什么和不能爬取什么

user-agent: *,定义所有蜘蛛,就是所有搜索引擎蜘蛛都要遵循下面的规则来爬取文件

2、Allow的用法

含义:允许搜索引擎蜘蛛爬行的URL路径

用法:allow: /文件名

比如:allow: /seo,表示允许搜索引擎蜘蛛爬取seo目录

3、Disallow的用法

含义:不允许搜索引擎蜘蛛抓取的URL路径。

用法:disallow: /文件名

比如:disallow: /seo,表示不允许搜索引擎蜘蛛爬取seo目录

4、通配符*

含义:代表任意多个字符

用法:disallow: /*.jpg 网站所有的jpg文件被禁止了。

disallow: /*?* 网站所有动态路径都被禁止了。

5、结束符$

含义:表示以前面字符结束的url。

用法:disallow: /.asp$ 网站所有以.asp结尾的文件被禁止。

三、书写robots文件的注意细节

1、特别提醒,在robots.txt中,所有语法的:冒号后面必有一个空格。

2、在“/robots.txt”文件中,允许收录优先级要高于禁止收录,如

user-agent: *

allow: /a/b.html

disallow: /a/

则a目录下b.html可以让蜘蛛爬取访问,a目录下的其他文件都禁止蜘蛛访问

3、重点细节:robots.txt中屏蔽的文件目录后面带/斜杠与不带/斜杠的区别 :

比如:

robots.txt部分:

user-agent: *

disallow: /seo

disallow: /seo/

这两种书写,一个是目录名后面不带/斜杠,另一个是带/斜杠的。

根据robots.txt写法规范,解释如下:

1、不带/斜杠的意思是:屏蔽seo这个名字开头的所有目录。如:/seo1、/seo2、或者/seo/以下的所有目录都是被屏蔽的。

2、带/斜杠的意思是:屏蔽/seo/这个目录下的全部内容。如:/seo/abc、/seo/123/或者是/seo/abc/123等,/seo/下的目录都是被屏蔽的。但是它并不屏蔽本目录的内容,如:/seo还是允许蜘蛛抓取的。

以上就是robots文件的写法与注意细节,你学会了吗?更多seo教程请关注seo博客

本文来自投稿,不代表【】观点,发布者:【

本文地址: ,如若转载,请注明出处!

举报投诉邮箱:253000106@qq.com

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2024年5月1日 14:15:59
下一篇 2024年5月1日 14:18:04

相关推荐

  • linux给文件写权限,linux怎么给文件权限

    linux宝塔写入权限不足 1、可以使用chmod命令修改权限。语法:chmod [-cfvR] [–help] [–version] mode file…说明 : Linux/Unix 的档案调用权限分为三级 : 档案拥有者、群组、其他。利用 chmod 可以藉以控制档案如何被他人所调用。 2、通过更改文件权限可以使用c…

    2024年5月23日
    5200
  • 包含c语言对txt文件命名的词条

    如何在C语言编程里面修改源文件名字 如果你是在WINDOWS的话,简单了,随便用个编辑器,比如记事本,然后写c源程序,保存到你想要保存的位置。如果你在DOS下,可以用edit,写好以后,按alt键,选择文件菜单,然后保存。 用open打开文件,注意操作模式使用“修改”或者“添加” 用write或者fprintf向文件中写入你的内容。 用close关闭文件。 …

    2024年5月23日
    5000
  • java获取字符串指定字符,java获取字符串指定字符的位置

    java如何读取字符串中的某一段字符串 1、在Java中获取字符串中指定的值可以使用以下几种方式:点击学习大厂名师精品课使用substring()方法可以使用String类提供的substring(intbeginIndex,intendIndex)方法,从原始字符串中截取出指定范围的字符子串。 2、第一个参数是开始截取的字符位置。(从0开始)第二个参数是结…

    2024年5月23日
    4200
  • c语言多文件调用,c语言多文件操作

    c语言一个结构体如何在多个源文件里面调用? 在这种方法中,可以先将多个源文件分别编译成目标文件,然后再将它们链接成一个可执行文件。 在头文件里定义结构,例如:typedef struct { int a, b;} S;S s_instance;在其他文件里引用就可以。 创建程序入口点main函数,在main函数中条用其它函数。达到同时运行的母的。如果不这样,…

    2024年5月23日
    4400
  • linux.o生成,linux 生成core文件

    linux下多个.o文件如何链接生成可执行程序 你好!很简单,使用-o选项就可以了。如果有a.o,b.o,c.o,d.o4个.o文件,则使用以下命令:gcc -o (生成的目标名称)test a.o b.o c.o d.o 希望对你有所帮助,望采纳。 连接成可执行文件了:gcc hello.c -o h 这时,你的当前目录下就多出了一个叫 h 的文件,它就是…

    2024年5月23日
    4300
  • 为linux命令做链接gcc,linux cp 链接文件

    linux系统中gcc的命令怎么用? 1、linux系统常用操作命令linux系统常用操作命令如下:ls:全拼list,功能是列出目录的内容及其内容属性信息。cd:全拼change directory,功能是从当前工作目录切换到指定的工作目录。cp:全拼copy,其功能为复制文件或目录。 2、linux系统常用操作命令如下:ls:全拼list,功能是列出目录…

    2024年5月23日
    4300
  • 在c语言中如何实现输出字符改变颜色呢,c语言输出文字变色

    c语言怎么实现输出颜色的变化 1、第一步、进入到vs界面,在上方工具栏中选择箭头所指的工具选项,如下图所示。第二步、选择箭头所指的选项,点击进入选项窗口,如下图所示。第三步、点击箭头所指的环境选项,进入到环境设置,如下图所示。 2、方法2, 使用ansi颜色码。两步:I. 修改c:\windows\system32\CONFIG.NT文件,在最后添加一行:d…

    2024年5月23日
    4700
  • java将文件转换为二进制,java将文件转成二进制

    Java中如何把图片转换成二进制流 1、所以定义的数组长度为10240,也就是10kb吧,当然你也可以定义小点,然後分次读。反正二进制都在这个数组里面,最後两句我只是举了个例子教你怎麼看这个二进制,第一个是现实二进制对应的整数,第二个是显示二进制了。 2、//执行 g.dispose(); //输出图片结果 saveImage(image); }我能够输出绘…

    2024年5月23日
    4100
  • java读取文件内容乱码,java读取文件编码格式

    java中filewriter中文乱码怎么解决? 1、如果你期望写到文件中的汉字是 GBK编码,可以写文件时,将字符串准换成 GBK编码的byte[]。网页编码和输出流编码一致。 2、读取文件的时候如果是用的read方法(字节流),碰到中文输出就是乱码,然后存储的时候设置下编码为GBK或者是UTF-8形式即可,可以有效的解决乱码问题。 3、只是个别文件出现了…

    2024年5月23日
    4900
  • java写property文件,java写入properties

    javaweb怎样在classpath建立一个property配置文件 1、一般在scr下面新建一个属性文件*.properties,如a.properties 然后在Java程序中读取或操作这个属性文件。 2、在我的电脑界面,鼠标右键点击“此电脑”。在弹出的列表中,点击最下方的“属性”。在跳转到的界面中,点击“高级系统设置”。在弹出的系统属性界面,点击右下…

    2024年5月23日
    4800

发表回复

登录后才能评论



关注微信