使用说明
1、普通收录工具可以向百度搜索主动推送资源,缩短爬虫发现网站链接的时间,不保证收录效果。
2、API提交和手动提交共享配额,每日至多提交10万条有价值的内容,sitemap提交配额不与其他方式共享,具体配额以站点页面显示数据为准,提交内容会进入百度搜索统一管理。
3、仅限提交关联过主体的站点下的内容,否则无法成功提交,配额不可累计,当日有效。
4、若链接存在跳转关系,请直接提交跳转后链接。如网站换域名,需提交新域名资源;进行HTTPS改造页面,请提交HTTPS资源。
资源提交之API提交
推送接口
接口调用地址:http://data.zz.baidu.com/urls?site=www.*****.com&token=*******
参数名称 | 是否必选 | 参数类型 | 说明 |
---|---|---|---|
site | 是 | string | 在搜索资源平台验证的站点,比如www.example.com |
token | 是 | string | 在搜索资源平台申请的推送用的准入密钥 |
推送示例
curl推送示例
将要提交的链接按照每行一条的格式写入一个文本文件中,命名此文件为urls.txt,然后进入该文件所在目录,执行如下命令:
curl -H 'Content-Type:text/plain' --data-binary @urls.txt "http://data.zz.baidu.com/urls?site=www.*****.com&token=*******"
使用php、python、java等可以参照这个过程推送结构化数据。
查看推送反馈
推送成功
状态码为200,可能返回以下字段:
字段 | 是否必选 | 参数类型 | 说明 |
---|---|---|---|
success | 是 | int | 成功推送的url条数 |
remain | 是 | int | 当天剩余的可推送url条数 |
not_same_site | 否 | array | 由于不是本站url而未处理的url列表 |
not_valid | 否 | array | 不合法的url列表 |
成功返回示例:
{ "remain":99998, "success":2, "not_same_site":[], "not_valid":[] }
推送失败
状态码为4xx,返回字段有:
字段 | 是否必传 | 类型 | 说明 |
---|---|---|---|
error | 是 | int | 错误码,与状态码相同 |
message | 是 | string | 错误描述 |
失败返回示例:
{ "error":401, "message":"token is not valid" }
资源提交之sitemap提交
请填写数据文件地址
示例如下:
www.site.com/site.txt
www.site.com/site.xml
文件地址格式为txt或xml,每个地址文件最多包含50,000个网址且需小于10MB。
如果验证了网站的主域,那么sitemap文件中可包含该网站主域下的所有网址。详细说明
资源提交之手动提交
请填写链接地址
示例如下:
http://www.example.com/mip/1.html
http://www.example.com/mip/2.htm
http://www.example.com/mip/3.php
请在输入框中填写当前选择站点的链接;如需提交其他验证站点链接,请选择对应的站点
您每次最多可提交20条链接,每行一条
仅支持页面对应链接的提交,不支持sitemap形式的文件提交
如果需要提交非验证本站链接,请点击提交非验证站点链接
发表评论 取消回复