网站首页美食营养游戏数码手工爱好生活家居健康养生运动户外职场理财情感交际母婴教育生活知识生活百科知识问答更多知识

如何使用java代码，爬取页面特定内容？

时间：2026-05-02 22:02:04

1、确认目标我们要爬取的是“百度”首页

中的 gif 动态图

将它下载下来

如何使用java代码，爬取页面特定内容？

2、加入jsoup依赖

我这里使用的是maven，进行的依赖管理

如果不知道maven是什么可以去百度了解一下

如何使用java代码，爬取页面特定内容？

3、依赖有了我们就开始编码吧

第一步：先把“百度”首页所有的html元素内容全部爬下来

如何使用java代码，爬取页面特定内容？

4、第二步：找到我们需要的图片元素对象

使用 css 选择器

jsoup已经为我们封装好了，一起来看吧

如何使用java代码，爬取页面特定内容？

5、第三步：获取图片的网络路径

如何使用java代码，爬取页面特定内容？

6、第四步：通过网络图片地址，将图片下载到本地

如何使用java代码，爬取页面特定内容？

如何使用java代码，爬取页面特定内容？

7、代码都在这里了：

public static void main(String [] args) throws IOException {

Document doc = Jsoup.connect("http://www.baidu.com/").get();
Elements select = doc.select(".index-logo-src");
int i = 1;
java.net.URL url = null;
for (Element element : select) {
String src = element.attr("src");
src = src.substring(2);
src = "http://" + src;
url = new java.net.URL(src);
DataInputStream dataInputStream = new DataInputStream(url.openStream());
FileOutputStream fileOutputStream = new FileOutputStream(new File("e:/img/" + (i) + ".gif"));
ByteArrayOutputStream output = new ByteArrayOutputStream();
byte[] buffer = new byte[1024];
int length;
while ((length = dataInputStream.read(buffer)) > 0) {
output.write(buffer, 0, length);
}
byte[] bytes = output.toByteArray();
fileOutputStream.write(output.toByteArray());
dataInputStream.close();
fileOutputStream.close();
i++;
}
}

© 2026 五度知识库
信息来自网络所有数据仅供参考
有疑问请联系站长 site.kefu@gmail.com