搜索
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
搜索
Cpp五条
这个屌丝很懒,什么也没留下!
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1
只有27亿参数,性能却高25倍!微软发布Phi-2_phi-2模型的github地址
2
java 判断今天昨天_java判断今天,昨天,前天,不能用秒间隔的简单实例
3
MathType 运行时错误‘53’:文件未找到:MathPage.WLL_mathtype53错误
4
Fidder下载安装小白_fidder官网
5
电脑计算机快捷键切换桌面,电脑切换界面的快捷键是什么_电脑切换桌面快捷键怎么用-win7之家...
6
Android学习路线_入门篇(一)编写简单的APP_android开发简易app
7
权限申请_公共盘的映射和权限申请
8
使Xceed.Wpf.Toolkit支持Active X
9
解决黑苹果无法使用Siri、iMessage等服务_苹果电脑登录imessage提示“认证过程中出错”
10
移动端开发基础知识_移动开发所需要的知识
当前位置:
article
> 正文
robot.txt的写法详解
作者:Cpp五条 | 2024-03-21 16:58:59
赞
踩
st robot格式
其实robots.txt就是一个记事本文件(txt格式文件),存放在网站根目录下。
那么robots.txt语法到底有哪些呢?
robots.txt语法有三个语法和两个通配符。
三个语法:
1.首先要定义网站被访问的搜索引擎是那些。
User-agent:(定义搜索引擎)
语法:User-agent: * 或 搜索引擎的蜘蛛名称
例子:User-agent:Googlebot (定义谷歌,只允许谷歌蜘蛛爬取)
User-agent:Baiduspider (定义百度,只允许百度蜘蛛爬取)
User-agent:*(定义所有搜索引擎)
2:屏蔽搜索引擎爬去语法
Disallow:(禁止语法) 用来定义禁止蜘蛛爬取的页面或目录。
写法:DisAllow:/文件夹目录/ (表示禁止蜘蛛爬取网站的其中一个目录)
或 DisAllow:/文件名称 (表示禁止蜘蛛爬取网站的其中一个页面)
例如
isallow:/ (禁止蜘蛛爬取网站的所有目录 “/” 表示根目录下)
Disallow:/admin (禁止蜘蛛爬取admin目录)
Disallow:/abc.html (禁止蜘蛛爬去abc.html页面)
Disallow:/help.html (禁止蜘蛛爬去help.html页面)
整套语法示范:
User-agent: *
Disallow:/目录1/ (禁止所有搜索引擎的蜘蛛爬取站点的目录1)
Disallow:/目录2/ (禁止所有搜索引擎的蜘蛛爬取站点的目录2)
3:允许搜索引擎爬去语法
Allow:(允许语法) 用来定义允许蜘蛛爬取的页面或子目录
例如: Disallow:/ (禁止蜘蛛爬取网站的所有目录)
Disallow:/admin (禁止蜘蛛爬取admin目录)
Allow:/admin/abc.html(“/” 表示根目录下,允许蜘蛛爬去admin目录中的abc.html页面)
两个通配符:
匹配符”$”和 “*”
$ 通配符:匹配URL结尾的字符; * 通配符:匹配0个或多个任意字符;
例子1:
允许所有搜索引擎蜘蛛抓取以某个扩展名为后缀的网页地址,代码如下:
User-agent: *
Allow: .htm$ 说明(其中“.htm”,表示充许搜索引擎蜘蛛抓取所有”.htm”为后缀的文件,注意,这里并不包括以”.html”为后缀的文件)
例2:
设定某种类型文件禁止被某个搜索引擎蜘蛛抓取,代码如下:
User-agent: *
Disallow: /*.htm 说明(其中“.htm”,表示禁止搜索引擎蜘蛛抓取所有以”.htm”为后缀的文件,注意,这里并不包括以”.html”为后缀的文件)
以上是西西对于robots写法(语法)的领悟,分享给大家,如果大家有什么不懂的可以联系西西qq或者email。为了让大家巩固下robots.txt语法知识,下篇文章西西给大家写robots.txt综合列子,尽情期待。
本文发自
站长百科
: http://www.software8.co 收藏分享
声明:
本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:
https://www.wpsshop.cn/w/Cpp五条/article/detail/282089
推荐阅读
article
使用
bat
命令
批量
命名
图
片
名称的方法及解决
bat
格式
中文
乱码的问题(如:
图
片
.
jpg
)
_
bat
图
批量
...
直接按照步骤来就能成功1,简历 .txt 文档,并输入如下代码 @echo off setlocal enabledel...
赞
踩
article
HarmonyOS
应用开发基础——
长
按
事件
_
ohos
list
长
按
...
HarmonyOS
应用开发基础
长
按
事件首先在ability
_
main.xml中添加一个Button和Text。`
[详细]
-->
赞
踩
article
", line 1, in
NameError: na" href="/w/小蓝xlanll/article/detail/282559" target="_blank">File "
ing>", l
in
e 1,
in
<
module
> NameError: na...
", line 1, in
NameError: na" href="/w/小蓝xlanll/article/detail/282559" target="_blank">File "
ing>", l
in
e 1,
in
<
module
>NameError:
name
'
office
'...
赞
踩
article
计算机
体系结构
基础知识
介绍之
指令
级
并行性
:概念和挑战_
体系结构
名称
依赖
反
依赖
输出
依赖
...
如果两条
指令
是并行的,它们可以在任意深度的管道中同时执行,而不会导致任何停顿,假设管道有足够的资源(因此不存在结构危险)...
赞
踩
article
用
鸿蒙
开发
AI
应
用
(七)触摸屏控制
LED
...
前言上一篇,我们体验了一下
鸿蒙
上的界面的
开发
流程,这一篇我们继续深入一点点,尝试打通从
用
户态UI到内核态HDF之间的联系...
赞
踩
article
影刀
RPA
自动化 -
数据库
详解_
影刀
连接
数据库
...
新手在使用
RPA
的容易出现问题以及容易被忽略的点会导致无法调用,我在这里进行讲解一下一些新手容易碰到的误区。_
影刀
连接
数...
赞
踩
article
Nvida
Jetson
Nano
安装QT采坑记_
jetson
nanoanzhuangqt
...
Nvida
Jetson
Nano
安装QT采坑记第一次接触
Jetson
Nano
,该硬件的系统为Ubuntu 18系统...
赞
踩
article
py
thon
extract
_
convert
.
py
对应代码解读
抽取
式提取+生成式提取
摘要
代码解读--...
py
torch动态调整学习率
抽取
式生成的代码
convert
数据转化的过程进入
extract
_
convert
.
py
中的ex...
赞
踩
article
说一说
HashMap
的
底层
实现_说说
hashmap
的
底层
实现?...
在JDK1.8以前
HashMap
的
底层
结构是数组+链表,
HashMap
通过key
的
HashCode然后通过hash方法(...
赞
踩
article
C++
Builder
(RAD
Studio
) 静态编译生成独立的.exe
可执行文件
_
c++
bui...
Packages-->Runtime Packages-->Link with runtime packages 设为 ...
赞
踩
article
2006
年
中国
首届
杰出
数据库
工程师
评选获奖名单...
2006
年
中国
首届
杰出
数据库
工程师
评选获奖名单
2006
年度
中国
杰出
数据库
工程师
邢海捷、万正勇、盖国强、段云峰、齐红胤冯...
赞
踩
article
C++
排序
法
则——
冒泡
排序
法
_
c++
一本通
冒泡
排序
...
在前面我们介绍了sort
排序
函数的使用,按理说,我们没有必要在代码中使用其他的
排序
方
法
,但是,在一些情况下,我们只能使用...
赞
踩
article
祝
大家
元宵节
快乐...
今宵月圆白如昼,千年轮回人依旧。元宵团圆夜,祝
大家
元宵节
快乐!祝
大家
元宵节
快乐 今宵月圆白如昼,...
赞
踩
article
printf
函数中的
%.
*
s
介绍_
printf
%.
*
s
...
有关
printf
函数中输出格式,今天看到一个小技巧。
printf
("%3
s
\n", "hello");
printf
("...
赞
踩
article
交叉
编译
openGL
,Ubuntu20.04 to
aarch64
(一)_
arm
opengl
交叉
...
linux
交叉
编译
openGL
_
arm
opengl
交叉
编译
arm
opengl
交叉
编译
编译
器...
赞
踩
article
主梁
弹性模量
计算
_轮扣
模板
计算
书(
GB51210
-2016
规范
)...
验算软件:品茗安全
计算
软件V12.0梁
模板
(轮扣式,梁板立柱共用)
计算
书
计算
依据:1、《建筑施工脚手架安全技术统一标准》...
赞
踩
article
robots
.
txt
文件详解...
robots
.
txt
是一个用于告诉网络爬虫(也称为搜索引擎蜘蛛)哪些页面可以抓取,哪些页面不可以抓取的文本文件。它通常放...
赞
踩
article
盈建科内楼板
局部
荷载
的
导荷
计算
_
yjk
板上
局部
荷载
...
从
yjk
技术支持那里获得了具体
的
计算
方法,但当时
yjk
是以矩形板示例
的
,现使用一个大于四边
的
板来
计算
,以验证正确性(后续...
赞
踩
article
鸿蒙
HarmonyOS
实战-
ArkUI
组件
(
Popup
)_
鸿蒙
pushkit
...
Popup
组件
通常用于在屏幕上弹出一个对话框或者浮动窗口。这个
组件
通常和其他
组件
一起用于用户界面的交互和反馈。
Popup
...
赞
踩
article
批量
重命
名
图件方法_
bat
批量
修改图片
名
...
通过
bat
文件
批量
重命
名
图片_
bat
批量
修改图片
名
bat
批量
修改图片
名
一、问题提出 在导出一批...
赞
踩
相关标签
harmonyos
risc-v
嵌入式硬件
内核
java
物联网
mvp
linux
rpa
自动化
数据库
数据库开发
python
哈希算法
链表
散列表
开发语言
c++
C++
节日
C语言
qt
主梁弹性模量计算
爬虫