python爬虫url怎么看_【Python爬虫】分析网页真实请求

Ⅰ 【壹】Python爬虫入门——认识URL

【系列前言】前段时间李响同学入门了一些Python的基础知识，觉得一直在IDLE里print一些算法题有一些枯燥，所以决定通过学习爬虫来提高自己的兴趣。而且最近确实有一些重复性劳动，想使用爬虫简化工作。遂打算边自学边写自己自学的过程，一方面作为小白的我可以和其他Python大神交流，一方面也可以以此监督自己。
【本人使用Python版本：2.7.5】

首先按理解一下爬虫（Spider），如果把一个站点比作一张纵横交错的蜘蛛网，那么我们爬虫要做的就是在这张网上爬来爬去，获得这张网上的信息和资源。而Web上每种资源，比如HTML文档、图片、视频等都由一个URI（Universal Resource Identifier，通用资源标志符)进行定位。 URL（Uniform Resource Locator，统一资源定位符）是URI的子集。采用URL可以用一种统一的格式来描述各种信息资源，包括文件、服务器的地址和目录等。而爬虫主要的处理对象就是URL。所以务必要对URL有一定的熟悉。

URI通常由三部分组成：
1.访问资源的命名机制；
2.存放资源的主机名；
3.资源自身的名称，由路径表示。

URL的格式由三部分组成：
1.第一部分是协议(或称为服务方式)。
2.第二部分是存有该资源的主机IP地址(有时也包括端口号)。
3.第三部分是主机资源的具体地址，如目录和文件名等。
知乎：HTTP 协议中 URI 和 URL 有什么区别？@西毒的回答

最近在搞挑战杯可能会有点忙，但还是希望自己能按照计划学习，定期更新此系列。

Ⅱ 【Python爬虫】分析网页真实请求

1、抓取网页、分析请求
2、解析网页、寻找数据
3、储存数据、多页处理

翻页有规律：
很多网址在第一页时并没有变化，多翻下一页后规律就出来，比如豆瓣第一页和豆瓣第三页

发现start为40，limit=20，所以猜测start=0就是第一页，每页显示20条数据，对于第三页显示的参数可以一个个删除验证，可以减去不必要的参数， 但是删除前一定要做好数据的对比

（1） 文本框输入后产生一个请求，如常见的登录、注册页面
Referer：表示当前请求的来源
Request URL：表示实际请求地址

翻页后URL不变，该如何寻找请求？
如： http://www.zkh360.com/zkh_catalog/3.html

通过对比可以发现网站是通过pageIndex参数控制翻页的，？表示连接

接下来用抓包工具分析下，从第四页开始看URL就知道了，但是前面几面需要查看请求的参数，这里偏多，就切换到【Inspectors--Webforms】选项，看的比较直观

类似的网站还有今日头条，有兴趣的朋友可以去研究下
（可通过获取max_behot_time的值而改变as和cp）

热点内容

15万贷款怎么算法发布：2025-08-06 19:26:22 浏览：374

起点中文网app在哪里可以下载发布：2025-08-06 19:20:16 浏览：31

解压需要改后缀名mp3 发布：2025-08-06 19:13:39 浏览：633

民宿在哪个app订发布：2025-08-06 19:12:07 浏览：4

php删除指定数组发布：2025-08-06 19:06:05 浏览：53

没人玩了服务器还有什么手游发布：2025-08-06 19:05:27 浏览：534

pdf文档能打印吗发布：2025-08-06 19:01:02 浏览：166

什么是单片机发生器发布：2025-08-06 18:52:12 浏览：260

单片机不同进制除法运算发布：2025-08-06 18:32:46 浏览：774

资料如何上传服务器发布：2025-08-06 18:12:12 浏览：560

苹果iosoa源码发布：2025-08-06 18:01:57 浏览：339

ansible命令详解发布：2025-08-06 17:58:27 浏览：916

安卓怎么确认设备管理发布：2025-08-06 17:44:35 浏览：912

梁加密筋示意图发布：2025-08-06 17:23:34 浏览：329

网站怎么挂在服务器地址发布：2025-08-06 17:15:49 浏览：344

nomo滤镜是哪个app的发布：2025-08-06 17:14:46 浏览：466

phpsession在哪里发布：2025-08-06 17:13:55 浏览：97

如何在电脑上打开wifi连接到服务器地址发布：2025-08-06 17:11:39 浏览：474

dns宽带服务器怎么查发布：2025-08-06 17:11:38 浏览：708

联通app哪里刷人脸登录发布：2025-08-06 17:05:41 浏览：140

导航:首页 > 编程语言 > python爬虫url怎么看

python爬虫url怎么看

与python爬虫url怎么看相关的资料