java提取html_java获取html内的内容

㈠ java获取html内的内容

简单实现：
HtmlRequest类的内容：
[java] view plain
package com.capinfotech.net;

import java.io.ByteArrayOutputStream;
import java.io.IOException;
import java.io.InputStream;
import java.net.HttpURLConnection;
import java.net.URL;

public class HtmlRequest {

public static void main(String[] args) throws IOException {
URL url = new URL("http://www.163.com/");
HttpURLConnection conn = (HttpURLConnection)url.openConnection();
InputStream inputStream = conn.getInputStream(); //通过输入流获得网站数据
byte[] getData = readInputStream(inputStream); //获得网站的二进制数据
String data = new String(getData, "gb2312");
System.out.println(data);

}

public static byte[] readInputStream(InputStream inputStream) throws IOException {
byte[] buffer = new byte[1024];
int len = 0;
ByteArrayOutputStream bos = new ByteArrayOutputStream();
while((len = inputStream.read(buffer)) != -1) {
bos.write(buffer, 0, len);
}

bos.close();
return bos.toByteArray();
}

}
这样就能获得http://www.163.com的内容，在控制台会打印输出

㈡ java怎样读取html文件

FileReader 类。读取文件内容

㈢请教如何使用java从html内容中提取指定信息

File input = new File("/tmp/input.html");
Document doc = Jsoup.parse(input, "UTF-8", "IP");
看看这个代码，调用 doc.text() 方法即可。

㈣如何使用Java提取html表单元素

用HttpServletRequest的 getParamer方法

㈤ java爬虫怎么动态的获取html

很多网站是用js或Jquery 生成数据的，到后台获取到数据以后，用 document.write()或者("#id").html="" 的方式写到页面中，这个时候用浏览器查看源码是看不到数据的。

HttpClient是不行的，看网上说HtmlUnit，说可以获取后台js加载完后的完整页面
不过并没什么用

热点内容

服务器的应用镜像是什么发布：2025-05-10 10:49:33 浏览：149

命令行的使用方法发布：2025-05-10 10:49:26 浏览：509

怎么让图片左右压缩发布：2025-05-10 10:37:49 浏览：651

白鹿原pdf 发布：2025-05-10 10:37:44 浏览：429

人民币怎么算法发布：2025-05-10 10:05:34 浏览：754

什么app可以听懂刺猬说话发布：2025-05-10 10:04:43 浏览：596

安卓机内存小如何扩大发布：2025-05-10 10:03:21 浏览：125

粉丝服务器怎么和安卓手机通信发布：2025-05-10 10:02:27 浏览：398

初中数学竞赛pdf 发布：2025-05-10 10:02:25 浏览：568

linux自定义安装发布：2025-05-10 09:56:49 浏览：188

fpic要在每个编译文件发布：2025-05-10 09:56:44 浏览：866

编译原理广义推导的定义发布：2025-05-10 09:45:07 浏览：911

怎么在已有的压缩文件里加密码发布：2025-05-10 09:33:50 浏览：517

安卓手机怎么设置系统软件发布：2025-05-10 09:28:45 浏览：766

php前端java后端发布：2025-05-10 09:28:04 浏览：794

数据框转换为矩阵python 发布：2025-05-10 09:22:57 浏览：74

单片机程序反汇编发布：2025-05-10 09:22:21 浏览：853

编程和实物不一样发布：2025-05-10 09:17:21 浏览：880

天官赐福小说什么app可看发布：2025-05-10 09:09:28 浏览：208

原车空调改压缩机发布：2025-05-10 08:46:48 浏览：103

导航:首页 > 编程语言 > java提取html

java提取html

与java提取html相关的资料