『壹』 用php的Snoopy如何抓取網頁的驗證碼呢
curl就可以了
<?php
header('Content-Type:image/png');
$url="圖片鏈接";//圖片鏈接
$ch=curl_init();
//Cookie:PHPSESSID=
curl_setopt($ch,CURLOPT_URL,$url);
curl_setopt($ch,CURLOPT_COOKIE,'這里是你的cookies');
curl_setopt($ch,CURLOPT_RETURNTRANSFER,0);
curl_setopt($ch,CURLOPT_TIMEOUT,0);//忽略超時
curl_setopt($ch,CURLOPT_NOBODY,false);
$str=curl_exec($ch);
curl_close($ch);
『貳』 PHP如何突破防採集
function get_resource($url)
{
$c = curl_init();
curl_setopt($c, CURLOPT_URL, $url);
curl_setopt($c, CURLOPT_RETURNTRANSFER, 1);
echo $sourse = curl_exec($c);
curl_close($c);
return $sourse;
}
輸入你想採集的網站就行了
『叄』 !高手速來拿高分!!關於php採集:有的網站為什麼無法採集。(cookie agent referer 全都設置了也不行)
$url='218.57.139.24/shandong/secimg';
$cu=curl_init();
curl_setopt ($cu, CURLOPT_USERAGENT, 'Mozilla/5.0');
curl_setopt($cu,CURLOPT_RETURNTRANSFER,1);
curl_setopt($cu,CURLOPT_HEADER,0);
curl_setopt($cu,CURLOPT_URL,$url);
$rst=curl_exec($cu);
curl_close($cu);
file_put_contents('D:\\abc.jpg',$rst);
『肆』 關於php中的snoopy問題。高手請進
我運行了一下,你這程序是可以運行的。
snoopy類不是phpstudy帶的,更不是php自身就有的,它是第三方編寫的一個類文件。你在網上下載一個snoopy.class.php,放在你這個程序的目錄下就可以了。
『伍』 如何用php採集新浪財經
給您提供一下思想,希望能夠幫您解決。fopen("tmp.htm","r"); //只讀打開
$str=str_replace("{title}",$title,$str);
$str=str_replace("{content}",$content,$str);//替換內容
fclose($fp);簡單的採集常用函數。,您也可以用強大的snoopy採集類。彩集新浪財經,需要查看/分析源代碼,然後用正則表達式,匹配要採集的代碼然後重新組織數據結構。
『陸』 php偽造ip獲取網頁內容,求高手
偽造IP是不可能的,HTTP協議是機遇TCP,你發送GET命令過去必須留有準確的IP地址,否則對方無法把結果發給你,你與伺服器xxx.xxx.xx的通訊相當於寫信,你匿名寫信只能攻擊,要獲取返回的東西必須提交真實的地址。
無論使用CURL還是別的方法,都要受前面的基本規則限制。
編程上已經沒有辦法可走了,你可以考慮使用代理,通過代理伺服器去獲取數據,查封就換個代理伺服器。不過現在代理伺服器是很難找的。
『柒』 高手速來拿高分!!【php採集:瀏覽器能打開,php卻無法採集。】 剛才不小心關閉了。再開!
經測試,可以打開啊,是一個90X41像素的驗證碼,請問環境是什麼,框架用的什麼?
『捌』 Snoopy採集,thinkphp使用snoopy採集數據
呵呵。這種情況,看看是不是程序那裡有錯誤了吧。
一般情況不會出現這么大內存需求的。
另外,如果你開啟的是snoopy的多線程測試,可以考慮把線程數量減少。
還有就是循環執行時間,也可以適當減少再試試。
『玖』 有沒有辦法實現PHP代理抓取網頁內容
可以呀。
用snoopy的類,網上有snoopy.class.php,你自行網路查找。
snoopy的類可以設置$proxy_host參數,設置代理主機,$proxy_port是代理主機埠。你下載一個下來,網上的教程很多,看看應該明白。
至於調用proxy.txt,輪換ip的問題,我覺得可用代理不是很多的話,可以設置成隨機選擇代理就好了。你採集的那個網站記錄的是你代理伺服器的ip