标准化建立网站，网站地图和robots.txt

网创网 • 2024年5月7日 00:00:54 • 用户投稿 • 阅读 56

遵循W3C规范；网站地html网站地什么是robots.txt，robots.txt的语法，User-agent，Disallow

遵循W3C规范

W3C是英文 World Wide Web Consortium 的缩写，中文意思是W3C理事会或万维网联盟。W3C于1994年10月在麻省理工学院计算机科学实验室成立。创建者是万维网的发明者Tim Berners-Lee。

W3C组织是对网络标准制定的一个非赢利组织，像HTML、XHTML、CSS、XML的标准就是由W3C来定制。W3C会员(大约500名会员)包括生产技术产品及服务的厂商、内容供应商、团体用户、研究实验室、标准制定机构和政府部门，一起协同工作，致力在万维网发展方向上达成共识。对于seo工作者对w3c的认识主要体现在对html，xhtml，xml语言标签代码的语义化认识上。

网站地一个是robots.txt，另一个是The Robots META标签。

1.什么是robots.txt?

robots.txt是一个纯文本文件，通过在这个文件中声明该网站中不想被robots访问的部分，这样，该网站的部分或全部内容就可以不被搜索引擎收录了，或者指定搜索引擎只收录指定的内容。

当一个搜索机器人访问一个站点时，它会首先检查该站点根目录下是否存在robots.txt，如果找到，搜索机器人就会按照该文件中的内容来确定访问的范围，如果该文件不存在，那么搜索机器人就沿着链接抓取。

robots.txt必须放置在一个站点的根目录下，而且文件名必须全部小写。

网站 URL

相应的 robots.txt的 URL

http://www.w3.org/

http://www.w3.org/robots.txt

2. robots.txt的语法

"robots.txt"文件包含一条或更多的记录，这些记录通过空行分开(以CR,CR/NL, or NL作为结束符)，每一条记录的格式如下所示：

"<field>:<optionalspace><value><optionalspace>"

在该文件中可以使用#进行注解，具体使用方法和UNIX中的惯例一样。该文件中的记录通常以一行或多行User-agent开始，后面加上若干Disallow行,详细情况如下：

User-agent:

该项的值用于描述搜索引擎robot的名字，在"robots.txt"文件中，如果有多条User-agent记录说明有多个robot会受到该协议的限制，对该文件来说，至少要有一条User-agent记录。如果该项的值设为，则该协议对任何机器人均有效，在"robots.txt"文件中， "User-agent："这样的记录只能有一条。

Disallow :

该项的值用于描述不希望被访问到的一个URL，这个URL可以是一条完整的路径，也可以是部分的，任何以Disallow 开头的URL均不会被robot访问到。例如"Disallow: /help"对/help.html 和/help/index.html都不允许搜索引擎访问，而"Disallow: /help/"则允许robot访问/help.html，而不能访问/help/index.html。

任何一条Disallow记录为空，说明该网站的所有部分都允许被访问，在"/robots.txt"文件中，至少要有一条Disallow记录。如果 "/robots.txt"是一个空文件，则对于所有的搜索引擎robot，该网站都是开放的。

下面是一些robots.txt基本的用法：

禁止所有搜索引擎访问网站的任何部分：

User-agent: *

Disallow: /

允许所有的robot访问

User-agent: *

Disallow:

或者也可以建一个空文件 "/robots.txt" file

禁止所有搜索引擎访问网站的几个部分(下例中的cgi-bin、tmp、private目录)

User-agent: *

Disallow: /cgi-bin/

Disallow: /tmp/

Disallow: /private/

禁止某个搜索引擎的访问(下例中的BadBot)

User-agent: BadBot

Disallow: /

只允许某个搜索引擎的访问(下例中的WebCrawler)

User-agent: WebCrawler

Disallow:

User-agent: *

Disallow: /

本文来自投稿，不代表【痞子匠】观点，发布者：【网创网】

本文地址：https://www.pizijiang.com/tougao/109193.html ，如若转载，请注明出处！

举报投诉邮箱：253000106@qq.com

txt 地图网站

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

网创网作者

37.1K 文章

0 评论

1 粉丝

这个人很懒，什么都没有留下～

影响网站排名的6个因素，经常性的进行网站更新

上一篇 2024年5月6日 23:59:53

网站外部链接的基础知识，单向链接、链接的相关性等

下一篇 2024年5月7日 00:01:57

黑客技术

学习黑客知识的网站,自学黑客网站

麻烦大家推荐个黑客导航网站,像hao123那样的,谢谢! 1、999 369网址之家. 3309网址导航. 229229网址导航. 酷酷123网址之家等。 2、网址导航的鼻祖：hao123，速度快、无广告。（推荐）现在世界排名最高的网址导航：265，速度可以、但界面复杂、有广告，网上传言它有病毒。 3、您好、就导航网站而言，给您推荐使用或者是hao.360…

E安全
2024年5月23日
41000
Linux

linux下运行asp,linux运行asp网站

Linux下安装Apache+ASP环境的原因．如果你安装的Linux版本中带用Apache的话，就在选择所要安装的服务器的时候，将httpd这个服务选上，Linux安装程序将自动完成Apache的安装工作，并做好基本的配置。一是：在安装Apache HTTP Server的时候，如果我们机器上的80端口已被占用，需要选使用8080端口来安装那个选项…

E安全
2024年5月23日
47000
Java

团购网站源码java,方维社区团购源码

请问有java的电商系统的完整源码文档吗(java商城系统源码) 1、Smilehouse Workspace 是一个采用 Java 开发的电子商务应用程序。用来做产品、定案和客户信息管理。 2、现在国内唯一做的正式商业化能用的免费开源电商系统只有ShopsN。注意是纯粹免费，允许商业运营的。至于那种打着免费开源商城的系统，多如牛毛，也就没什么介绍的必要了。…

E安全
2024年5月23日
39000
黑客技术

有没有免费学习黑客的网站,如果免费自学黑客

信息安全技术专业的相关学习网站有哪些? 关于学习类的网站有掌门1对多贝、网易云课堂、慕课、传课、CSDN、我要自学网等等。网络安全主要集中在大型城市，如北京上海广州深圳等，那里安全公司特别多，如360，天融信，奇安信等，所以学习网络安全建议选择这些城市。专业课程专业基础课程：计算机硬件基础、计算机网络技术、程序设计基础、数据库技术、Web应用开发、信息…

E安全
2024年5月22日
40000
Linux

兄弟连linux书籍,兄弟连网站

怎样从零开始学习linux? 熟悉基本概念：在开始学习Linux之前，需要先了解一些基本概念，如命令行、文件系统、用户权限等，这些概念是后续学习和操作的基础。【答案】：1) 多阅读Linux书籍，如《Linux大全》、《RedHat Linux奥秘》、《Linux系统管理白皮书》等；2) 敢于尝试，经常使用Linux，从实践中学习Linux，别怕try a…

E安全
2024年5月22日
46000
Linux

网站安全狗linux,网站安全狗安装

服务器安全狗的安装使用 1、下载网站安全狗到服务器上，安装完成后，即可对网站进行防护。在百度上搜索“安全狗”就可以看到官网信息。 2、使用安全狗服云，是不用安装在服务器上的。只有服务器安全狗、网站安全狗的使用要安装在服务器上。安全狗服云的使用挺简单的，进入安全狗网站，注册登陆安全狗服云。 3、随着应用系统使用时间的增加，数据库里已经存储了大量的重要数据，以数…

E安全
2024年5月22日
33000
黑客技术

一秒变黑客学习,一秒变黑客的网站

黑客入门教程 1、成为黑客的基础入门需要学习计算机编程、网络技术、操作系统、加密技术等相关知识。同时，需要具备好奇心、探索精神和解决问题的能力。想成为黑客，需要首先熟练掌握一种或多种编程语言，如Python、Java等。 2、学习所有Windows下服务器的搭建步骤（ASP、PHP、JSP）。掌握例如Google黑客、cookies 、网络钓鱼、社会工程学等…

E安全
2024年5月22日
43000
Java

java技术网站,javaguide网站

大学Java学习必备的8个网站 1、JournalDev 想学系列文章，推荐 JournalDev，这个网站上所有的 Java 系列文章都堪称经典。有 Spring，有 Java设计模式，有 Java 核心，有 Java EE，有 Java 面试题，应有尽有。 2、java 学习网站有 Coursera、Java世界、Javased等。 Coursera 这…

E安全
2024年5月22日
45000
黑客技术

黑客技术学习app,黑客技术自学网站

学习黑客用什么书? 1、想成为一名黑客从这五本书开始入门1，《Python密码学编程》(第二版)本书是为对加密、破解或密码算法抱有浓厚兴趣的人士准备。 2、）2：《黑客手册》这本书很不错，注重网络安全，适合有网络方面基础的同学学习，不适合入门。 3、我推荐《黑客X档案》，可以接触到很多新技术，而且就算是菜鸟也看得懂（因为绝大部分读者都是初学者，所以这本杂志挺…

E安全
2024年5月22日
41000
黑客技术

有没有学习黑客技术的网站,有没有学黑客的软件

哪里可以学到黑客知识? 1、加入黑客社区加入黑客社区可以与其他黑客交流学习经验和技巧，了解最新的技术动态和安全漏洞。初学者可以加入一些知名的黑客社区，如HackerOne、Bugcrowd等。 2、如果要先学编程，建议选择VB或Delphi，比较容易学习，且功能强大。我推荐《黑客X档案》，可以接触到很多新技术，而且就算是菜鸟也看得懂（因为绝大部分读者都是初…

E安全
2024年5月22日
44000