導航:首頁 > 文件處理 > 抓取網站目錄文件夾

抓取網站目錄文件夾

發布時間:2022-05-09 01:47:30

① 如何抓取某個網頁上的目錄下的所有數據

用火車頭採集器(www.locoy.com)之類的採集工具就可以,採集頁面,自動下載圖片。(但使用要求懂點html、js和正則表達式)先分析列表頁,取得所有書的內容頁,再從內容頁中獲取需要的每一個內容,圖片、價格、作者什麼的。這是個標準的採集流程。火車頭免費版採集的內容是採到access里的

② 怎麼下載一個網站目錄下的所有文件

你可以選擇網際快車,里邊有個資源探索器。。。輸入網站地址直接回車就能看到目錄了
不敢保證百分百都能看,我原來用過

③ 請教怎樣獲取一個網站的根目錄下目錄樹(或者文件夾/文件結構)

能否支持查看目錄樹,必須需要web伺服器的支持的。

一般IIS默認情況下是不支持目錄樹的。

下列圖片中的「目錄瀏覽」選項就是決定是否支持目錄樹的。所以你在不支持目錄樹的網站上是看不了的

php獲取網站根目錄有幾種方法

方法1:

在global.inc 里定義根目錄

define("APP_ROOT",dirname(__FILE__));

在任何PHP文件中可以引用該常量

require_once(APP_ROOT."/inc/head.php");

方法2:

<?php

$PHP_SELF=$_SERVER['PHP_SELF'] ? $_SERVER['PHP_SELF'] : $_SERVER['SCRIPT_NAME'];

$url='http://'.$_SERVER['HTTP_HOST'].substr($PHP_SELF,0,strrpos($PHP_SELF, '/')+1);

echo $url;

方法3:

$basepath=$_SERVER['PHP_SELF'];

$basepath=substr($basepath,0,strpos($basepath,"文件夾名稱"));

echo $basepath;

如:你把文件保存為a.php並路徑為:/wjj/wjj1/wjj2/a.php

上面的例子就寫成:

$basepath=$_SERVER['PHP_SELF'];

$basepath=substr($basepath,0,strpos($basepath,"wjj1"));

echo $basepath;

方法4:

$basepath=$_SERVER['PHP_SELF'];

preg_match("/(\/)?([^\/]+)/",$basepath,$wjm);

echo $wjm[0];

⑤ 怎麼獲取網站的絕對路徑

比如你的網站在C盤下的WEB目錄
絕對路徑就是C:/WEB/index.html
相對路徑就是網站根目錄的路徑 比如你的網站目錄是WEB 裡面有一個叫A的文件夾
相對路徑就是/A/*.jpg

⑥ 如何搜索網站所有目錄下的文件

命令提示符程序
using System;
using System.Collections.Generic;
using System.Text;
using System.IO;
using System.Collections;

namespace ConsoleApplication1
{
class Program
{
static void Main(string[] args)
{
Console.WriteLine("請輸入搜索目錄:");
string searchFolder = Console.ReadLine();
Console.WriteLine("請輸入復制的目標目錄:");
string toFolder = Console.ReadLine();
Console.WriteLine("請輸入復制的文件類型:");
string fileType = Console.ReadLine();
CopyAllFiles(searchFolder, toFolder, fileType);

Console.Read();
}

static void CopyAllFiles(string fpath, string tpath, string filetype)
{
if (Directory.Exists(fpath))
{
foreach (string f in Directory.GetFiles(fpath, "*." + filetype))
{
string filename = Path.GetFileName(f);
Console.WriteLine(",", f, filename);
File.Copy(f, Path.Combine(tpath, filename), true);
}
foreach (string f in Directory.GetDirectories(fpath))
{
CopyAllFiles(f, tpath, filetype);
}
}
}

}

}

⑦ 如何獲取一個網站文件夾里的所有文件(大牛進)

可以很負責的告訴你,除了那些靜態的東西,比如圖片,flash,靜態頁面等可以被下載之外,其它的都無法下載 補充: 如果要通過HTTP協議下載,那你必須要知道完整的路徑,如果你有ftp賬號密碼,直接用 ftp工具 去下載 追問: 那個文件夾里都是flash 我只知道那個文件夾的地址. 裡面有一千多個文件(文件名只能一個個的查看到, 不能一下子全部知道). 沒辦 法下載 嗎? 回答: 是的,那就沒辦法了,除非他 伺服器 本身提供了允許瀏覽文件夾,一般這個都關閉的 追問: 這么說只能一個一個的下載了... 回答: 那是 追問: 我會找到辦法的.

⑧ 如何批量抓取網頁目錄下的所有文件

1、首先,如圖所示,我們找到目標文件夾,我們需要把文件夾內的所有文件的文件名批量復制。

⑨ 獲取一個網站的根目錄下目錄樹,網路爬蟲是否可以辦到 高分求助!

理論可以實現的,像webzip不就是按類似的方式實現的么.

基本思路是抓取頁面全部鏈接\圖片\媒體\css等各種文件信息,然後根據路徑就能夠分析出基本目錄結構了,不過得到的信息一般都不會有直接瀏覽目錄的全

閱讀全文

與抓取網站目錄文件夾相關的資料

熱點內容
卡爾曼濾波演算法書籍 瀏覽:761
安卓手機怎麼用愛思助手傳文件進蘋果手機上 瀏覽:837
安卓怎麼下載60秒生存 瀏覽:797
外向式文件夾 瀏覽:229
dospdf 瀏覽:425
怎麼修改騰訊雲伺服器ip 瀏覽:380
pdftoeps 瀏覽:487
為什麼鴻蒙那麼像安卓 瀏覽:730
安卓手機怎麼拍自媒體視頻 瀏覽:180
單片機各個中斷的初始化 瀏覽:718
python怎麼集合元素 瀏覽:475
python逐條解讀 瀏覽:827
基於單片機的濕度控制 瀏覽:493
ios如何使用安卓的帳號 瀏覽:877
程序員公園采訪 瀏覽:805
程序員實戰教程要多長時間 瀏覽:968
企業數據加密技巧 瀏覽:129
租雲伺服器開發 瀏覽:807
程序員告白媽媽不同意 瀏覽:330
攻城掠地怎麼查看伺服器 瀏覽:595