robots txt 写法
2024-02-15 17:10:38
```
User-agent: *
Disallow: /user/
Disallow: /login/
Disallow: /register/
Disallow: /review/
```
以上代码的意思是禁止所有的搜索引擎抓取/user/(用户中心)、/login/(登录)、/register/(注册)和/review/(评价)这些目录下的页面。
而对于智控、房地产开发、邮政快递服务等行业,他们的网站内容可能会有所不同,所以在编写robots.txt时根据实际情况来调整。
智控行业的网站可能有很多技术性的文章和文档,这部分内容对搜索引擎是有价值的,所以在robots.txt中允许搜索引擎抓取这些页面;而房地产开发公司的网站可能有大量的图片和视频,不想占用太多的带宽,就在robots.txt中禁止搜索引擎抓取这些资源。
至于邮政快递服务公司,他们的网站上可能会有些实时更新的信息,物流跟踪记录,这部分信息的价值在于及时性,旦被搜索引擎收录,就失去了时效性,所以在robots.txt中禁止搜索引擎抓取。