百度收录中提交站点地图抓取特别慢,只有通过API提交才可快速被收录,但是手动提交效率太低,因此通过解析站点地图,然后使用百度API快速提交站点链接。
项目中使用到jar包 dom4j1.6.1.jar
package src;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;
import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStreamReader;
import java.io.PrintWriter;
import java.net.URL;
import java.net.URLConnection;
import java.util.ArrayList;
import java.util.List;
public class Baidu {
public static void main(String[] args) {
String url = "http://data.zz.baidu.com/urls?site=你的站点&token=你的token";//接口调用地址
String json = Post(url, getUrls());//执行推送方法
System.out.println("结果是" + json); //打印推送结果
}
//解析xml的站点地图
public static List<String> getUrls() {
List<String> urls = new ArrayList<>();
//添加非站点地图中的url
urls.add("https://blog.yanjingtp.cn/tags/android");
urls.add("https://blog.yanjingtp.cn/tags/androidstudio");
urls.add("https://blog.yanjingtp.cn/tags/mac");
urls.add("https://blog.yanjingtp.cn/tags/flutter");
urls.add("https://blog.yanjingtp.cn/tags/tmp2.0");
urls.add("https://blog.yanjingtp.cn/tags/%E6%97%B6%E5%85%89%E6%9C%BA%E5%99%A8%E5%A4%87%E4%BB%BD");
urls.add("https://blog.yanjingtp.cn/tags/solo");
urls.add("https://blog.yanjingtp.cn/tags/adb");
urls.add("https://blog.yanjingtp.cn/tags/win11");
urls.add("https://blog.yanjingtp.cn/archives/2022/02");
urls.add("https://blog.yanjingtp.cn/archives/2022/01");
urls.add("https://blog.yanjingtp.cn/tags.html");
urls.add("https://blog.yanjingtp.cn/archives.html");
urls.add("https://blog.yanjingtp.cn");
try {
SAXReader saxReader = new SAXReader();
org.dom4j.Document document = saxReader.read("https://blog.yanjingtp.cn/rss.xml"); //你的xml格式的站点地图
Element rootElement = document.getRootElement();
Element channel = (Element) rootElement.elements("channel").get(0);
List<Element> list = channel.elements("item");
for (Element element : list) {
List<Element> list1 = element.elements();
for (Element e : list1) {
if (e.getName().equals("link")) {
urls.add(e.getText());
}
}
}
} catch (DocumentException e) {
e.printStackTrace();
System.out.println(e.getMessage());
}
return urls;
}
public static String Post(String PostUrl, List<String> Parameters) {
if (null == PostUrl || null == Parameters || Parameters.size() == 0) {
return null;
}
String result = "";
PrintWriter out = null;
BufferedReader in = null;
try {
//建立URL之间的连接
URLConnection conn = new URL(PostUrl).openConnection();
//设置通用的请求属性
conn.setRequestProperty("Host", "data.zz.baidu.com");
conn.setRequestProperty("User-Agent", "curl/7.12.1");
conn.setRequestProperty("Content-Length", "83");
conn.setRequestProperty("Content-Type", "text/plain");
//发送POST请求必须设置如下两行
conn.setDoInput(true);
conn.setDoOutput(true);
//获取conn对应的输出流
out = new PrintWriter(conn.getOutputStream());
//发送请求参数
String param = "";
for (String s : Parameters) {
param += s + "\n";
}
out.print(param.trim());
//进行输出流的缓冲
out.flush();
//通过BufferedReader输入流来读取Url的响应
in = new BufferedReader(new InputStreamReader(conn.getInputStream()));
String line;
while ((line = in.readLine()) != null) {
result += line;
}
} catch (Exception e) {
System.out.println("发送post请求出现异常!" + e);
e.printStackTrace();
} finally {
try {
if (out != null) {
out.close();
}
if (in != null) {
in.close();
}
} catch (IOException ex) {
ex.printStackTrace();
}
}
return result;
}
}