① 如何抓取某個網頁上的目錄下的所有數據
用火車頭採集器(www.locoy.com)之類的採集工具就可以,採集頁面,自動下載圖片。(但使用要求懂點html、js和正則表達式)先分析列表頁,取得所有書的內容頁,再從內容頁中獲取需要的每一個內容,圖片、價格、作者什麼的。這是個標準的採集流程。火車頭免費版採集的內容是採到access里的
② 怎麼下載一個網站目錄下的所有文件
你可以選擇網際快車,里邊有個資源探索器。。。輸入網站地址直接回車就能看到目錄了
不敢保證百分百都能看,我原來用過
③ 請教怎樣獲取一個網站的根目錄下目錄樹(或者文件夾/文件結構)
能否支持查看目錄樹,必須需要web伺服器的支持的。
一般IIS默認情況下是不支持目錄樹的。
下列圖片中的「目錄瀏覽」選項就是決定是否支持目錄樹的。所以你在不支持目錄樹的網站上是看不了的
④ php獲取網站根目錄有幾種方法
方法1:
在global.inc 里定義根目錄
define("APP_ROOT",dirname(__FILE__));
在任何PHP文件中可以引用該常量
require_once(APP_ROOT."/inc/head.php");
方法2:
<?php
$PHP_SELF=$_SERVER['PHP_SELF'] ? $_SERVER['PHP_SELF'] : $_SERVER['SCRIPT_NAME'];
$url='http://'.$_SERVER['HTTP_HOST'].substr($PHP_SELF,0,strrpos($PHP_SELF, '/')+1);
echo $url;
方法3:
$basepath=$_SERVER['PHP_SELF'];
$basepath=substr($basepath,0,strpos($basepath,"文件夾名稱"));
echo $basepath;
如:你把文件保存為a.php並路徑為:/wjj/wjj1/wjj2/a.php
上面的例子就寫成:
$basepath=$_SERVER['PHP_SELF'];
$basepath=substr($basepath,0,strpos($basepath,"wjj1"));
echo $basepath;
方法4:
$basepath=$_SERVER['PHP_SELF'];
preg_match("/(\/)?([^\/]+)/",$basepath,$wjm);
echo $wjm[0];
⑤ 怎麼獲取網站的絕對路徑
比如你的網站在C盤下的WEB目錄
絕對路徑就是C:/WEB/index.html
相對路徑就是網站根目錄的路徑 比如你的網站目錄是WEB 裡面有一個叫A的文件夾
相對路徑就是/A/*.jpg
⑥ 如何搜索網站所有目錄下的文件
命令提示符程序
using System;
using System.Collections.Generic;
using System.Text;
using System.IO;
using System.Collections;
namespace ConsoleApplication1
{
class Program
{
static void Main(string[] args)
{
Console.WriteLine("請輸入搜索目錄:");
string searchFolder = Console.ReadLine();
Console.WriteLine("請輸入復制的目標目錄:");
string toFolder = Console.ReadLine();
Console.WriteLine("請輸入復制的文件類型:");
string fileType = Console.ReadLine();
CopyAllFiles(searchFolder, toFolder, fileType);
Console.Read();
}
static void CopyAllFiles(string fpath, string tpath, string filetype)
{
if (Directory.Exists(fpath))
{
foreach (string f in Directory.GetFiles(fpath, "*." + filetype))
{
string filename = Path.GetFileName(f);
Console.WriteLine(",", f, filename);
File.Copy(f, Path.Combine(tpath, filename), true);
}
foreach (string f in Directory.GetDirectories(fpath))
{
CopyAllFiles(f, tpath, filetype);
}
}
}
}
}
⑦ 如何獲取一個網站文件夾里的所有文件(大牛進)
可以很負責的告訴你,除了那些靜態的東西,比如圖片,flash,靜態頁面等可以被下載之外,其它的都無法下載 補充: 如果要通過HTTP協議下載,那你必須要知道完整的路徑,如果你有ftp賬號密碼,直接用 ftp工具 去下載 追問: 那個文件夾里都是flash 我只知道那個文件夾的地址. 裡面有一千多個文件(文件名只能一個個的查看到, 不能一下子全部知道). 沒辦 法下載 嗎? 回答: 是的,那就沒辦法了,除非他 伺服器 本身提供了允許瀏覽文件夾,一般這個都關閉的 追問: 這么說只能一個一個的下載了... 回答: 那是 追問: 我會找到辦法的.
⑧ 如何批量抓取網頁目錄下的所有文件
1、首先,如圖所示,我們找到目標文件夾,我們需要把文件夾內的所有文件的文件名批量復制。
⑨ 獲取一個網站的根目錄下目錄樹,網路爬蟲是否可以辦到 高分求助!
理論可以實現的,像webzip不就是按類似的方式實現的么.
基本思路是抓取頁面全部鏈接\圖片\媒體\css等各種文件信息,然後根據路徑就能夠分析出基本目錄結構了,不過得到的信息一般都不會有直接瀏覽目錄的全