php獲取頁面指定內容_用PHP獲取網頁部分數據

A. 怎樣用php或者js獲取網頁中某個部分的值

首先你先確定你是不是需要跨域去訪問你的目標站點：aaa.com（跨域指的是你當前所在的網址跟你input的網址是否同源，因為瀏覽器對跨域訪問是有限制的，所以這點需要考慮。）
如果需要跨域，且aaa不允許跨域訪問的話，這件事情只能在後端去做，否則可以在前端實現。
然後大概講一下實現思路，不管是後端還是前端思路都差不多，首先你發起一個http請求去訪問input的網站（前端自己發起ajax請求，後端node可以用$http模塊發起請求，tomcat等伺服器同理），得到響應的html頁面內容之後你再做一次文本解析（例如正則匹配的方式）獲取你想要的目標字元串，最後加上你自己的鏈接就行了。

B. PHP 如何獲取到一個網頁的內容

1.file_get_contents
PHP代碼

復制代碼代碼如下:

<?php
$url = "http://www.jb51.net";
$contents = file_get_contents($url);
//如果出現中文亂碼使用下面代碼
//$getcontent = iconv("gb2312", "utf-8",$contents);
echo $contents;
?>

2.curl
PHP代碼

復制代碼代碼如下:

<?php
$url = "http://www.jb51.net";
$ch = curl_init();
$timeout = 5;
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, $timeout);
//在需要用戶檢測的網頁里需要增加下面兩行
//curl_setopt($ch, CURLOPT_HTTPAUTH, CURLAUTH_ANY);
//curl_setopt($ch, CURLOPT_USERPWD, US_NAME.":".US_PWD);
$contents = curl_exec($ch);
curl_close($ch);
echo $contents;
?>

3.fopen->fread->fclose
PHP代碼

復制代碼代碼如下:

<?php
$handle = fopen ("http://www.jb51.net", "rb");
$contents = "";
do {
$data = fread($handle, 1024);
if (strlen($data) == 0) {
break;
}
$contents .= $data;
} while(true);
fclose ($handle);
echo $contents;
?>

註：
1.
使用file_get_contents和fopen必須空間開啟allow_url_fopen。方法：編輯php.ini，設置
allow_url_fopen = On，allow_url_fopen關閉時fopen和file_get_contents都不能打開遠程文件。
2.使用curl必須空間開啟curl。方法：windows下修改php.ini，將extension=php_curl.dll前面的分
號去掉，而且需要拷貝ssleay32.dll和libeay32.dll到C:\WINDOWS\system32下；Linux下要安裝curl擴
展。

C. php抓取網頁指定的內容

我給你一個思路, 代碼我也不會給的, 會被網路刪的.

抓取網上的數據, 一般用正則去匹配. 你可以匹配開頭為<div class="so_weather">的, 然後匹配結尾. 結尾盡量是這個開頭div的下一個同級div, 如<div id="asda">, 這樣. 然後得到的數據用strip_tags函數將html代碼都去了, 得到的結果就是你想要的

D. php用正規表達式獲取網頁指定內容

<?php
$str
=
<<<str
<th>1</th>
<td
class="key"><a
href="網址1"
target="_blank">你要的地址1</a></td>
<th>2</th>
<td
class="key"><a
href="網址2"
target="_blank">你要的地址2</a></td>
<th>3</th>
<td
class="key"><a
href="網址3"
target="_blank">你要的地址3</a></td>
<th>4</th>
<td
class="key"><a
href="網址4"
target="_blank">你要的地址4</a></td>
<th>5</th>
<td
class="key"><a
href="網址5"
target="_blank">你要的地址5</a></td>
str;
$p
=
'#<td
class="key"><a
href="(.*)"
target="_blank">(.*)</a></td>#iUs';
preg_match_all($p,$str,$ar);
print_r($ar[0]);
?>
$ar[0]
的所有值就是你想要的地址了
測試過
沒問題

E. php獲取指定網頁內容

一、用file_get_contents函數,以post方式獲取url

<?php

$url='http://www.domain.com/test.php?id=123';

$data=array('foo'=>'bar');

$data= http_build_query($data);

$opts=array(

'http'=>array(

'method'=>'POST',

'header'=>"Content-type: application/x-www-form-urlencoded " .

"Content-Length: " .strlen($data) ." ",

'content'=>$data

)

);

$ctx= stream_context_create($opts);

$html= @file_get_contents($url,'',$ctx);

二、用file_get_contents以get方式獲取內容

<?php

$url='http://www.domain.com/?para=123';

$html=file_get_contents($url);

echo$html;

三、用fopen打開url, 以get方式獲取內容

<?php

$fp=fopen($url,'r');

$header= stream_get_meta_data($fp);//獲取報頭信息

while(!feof($fp)) {

$result.=fgets($fp, 1024);

}

echo"url header: {$header} <br>":

echo"url body: $result";

fclose($fp);

四、用fopen打開url, 以post方式獲取內容

<?php

$data=array('foo2'=>'bar2','foo3'=>'bar3');

$data= http_build_query($data);

$opts=array(

'http'=>array(

'method'=>'POST',

'header'=>"Content-type: application/x-www-form-

urlencoded Cookie:cook1=c3;cook2=c4 " .

"Content-Length: " .strlen($data) ." ",

'content'=>$data

)

);

$context= stream_context_create($opts);

$html=fopen('http://www.test.com/zzzz.php?id=i3&id2=i4','rb',false,$context);

$w=fread($html,1024);

echo$w;

五、使用curl庫，使用curl庫之前，可能需要查看一下php.ini是否已經打開了curl擴展

<?php

$ch= curl_init();

$timeout= 5;

curl_setopt ($ch, CURLOPT_URL,'http://www.domain.com/');

curl_setopt ($ch, CURLOPT_RETURNTRANSFER, 1);

curl_setopt ($ch, CURLOPT_CONNECTTIMEOUT,$timeout);

$file_contents= curl_exec($ch);

curl_close($ch);

echo$file_contents;

F. PHP抓取網頁指定內容

<?php
/*
* 如下：方法有點笨
* 抓取網頁內容用 PHP 的正則
* 用JS每隔5分鍾刷新當前頁面---即重新獲取網頁內容
*
* 註： $mode中--<title></title>-更改為所需內容（如 $mode = "#<a(.*)</a>#";>獲取所有鏈接）
*
* window.location.href="http://localhost//refesh.php";中的http://localhost//refesh.php
* 更改為自己的URL----作用：即刷新當前頁面
*
* setInterval("ref()",300000);是每隔300000毫秒（即 5 * 60 *1000 毫秒即5分鍾）執行一次函數 ref()
*
* print_r($arr);輸出獲得的所有內容 $arr是一個數組可根據所需輸出一部分（如 echo $arr[1][0];）
* 若要獲得所有內容可去掉
* $mode = "#<title>(.*)</title>#";
if(preg_match_all($mode,$content,$arr)){
print_r($arr);
echo "<br/>";
echo $arr[1][0];
}
再加上 echo $content；
*/
$url = "http://www..com"; //目標站
$fp = @fopen($url, "r") or die("超時");

$content=file_get_contents($url);
$mode = "#<title>(.*)</title>#";
if(preg_match_all($mode,$content,$arr)){
//print_r($arr);
echo "<br/>";
echo $arr[1][0];
}
?>
<script language="javaScript" type="text/javascript">
<--
function ref(){
window.location.href="http://localhost//refesh.php";
}
setInterval("ref()",300000);
//-->
</script>

G. php如何獲取帶參數頁面的內容

cURL可以使用URL的語法模擬瀏覽器來傳輸數據，
因為它是模擬瀏覽器，因此它同樣支持多種協議，
FTP,
FTPS,
HTTP,
HTTPS,
GOPHER,
TELNET,
DICT,
FILE
以及
LDAP等協議都可以很好的支持，包括一些：
HTTPS認證，HTTP
POST方法，HTTP
PUT方法，FTP上傳，keyberos認證，HTTP上傳，代理伺服器，cookies，用戶名/密碼認證，
下載文件斷點續傳，上傳文件斷點續傳，http代理伺服器管道，甚至它還支持IPv6，scoket5代理伺服器，通過http代理伺服器上傳文件
到FTP伺服器等等。
這就是我們為什麼要使用cURL的原因！
使用cURL完成簡單的請求主要分為以下四步：
1.初始化，創建一個新cURL資源
2.設置URL和相應的選項
3.抓取URL並把它傳遞給瀏覽器
4.關閉cURL資源，並且釋放系統資源
我們來採集一個頁面，通常情況下，我們會使用file_get_contents()函數來獲取：
像這樣：

<?php

$str = file_get_contents('http://bbs.lampbrother.net');

//或者是：

$str = file("http://bbs.lampbrother.net");

//或者是：

readfile("http://bbs.lampbrother.net");

?>
這樣我們會發現，我們沒有辦法有效地進行錯誤處理，更重要的是我們沒有辦法完成一些高難度的任務：
如：處理cookies，驗證，表單提交，文件上傳等等。
好，現在我們來用代碼完成上述cURL的四步：
<?php

//1.初始化，創建一個新cURL資源

$ch = curl_init();

//2.設置URL和相應的選項

curl_setopt($ch, CURLOPT_URL, "http://www.lampbrother.net/");

curl_setopt($ch, CURLOPT_HEADER, 0);

//3.抓取URL並把它傳遞給瀏覽器

curl_exec($ch);

//4.關閉cURL資源，並且釋放系統資源

curl_close($ch);

?>

H. 用php獲取指定網頁內容

functiongetRemoteRes($url,$postfields=NULL,$timeout=60){
	$ci=curl_init();
	curl_setopt($ci,CURLOPT_URL,$url);
	curl_setopt($ci,CURLOPT_HEADER,FALSE);
	curl_setopt($ci,CURLOPT_RETURNTRANSFER,TRUE);
	curl_setopt($ci,CURLOPT_SSL_VERIFYPEER,0);
	curl_setopt($ci,CURLOPT_SSL_VERIFYHOST,0);
	curl_setopt($ci,CURLOPT_TIMEOUT,$timeout);
	curl_setopt($ci,CURLOPT_POST,TRUE);
	if(is_array($postfields)){
		$field_str="";
		foreach($postfieldsas$k=>$v){
			$field_str.="&$k=".urlencode($v);
		}
		curl_setopt($ci,CURLOPT_POSTFIELDS,$field_str);
	}
	$response=curl_exec($ci);
	if(curl_errno($ci)){
		return'ERRNO!';
	}else{
		$httpStatusCode=curl_getinfo($ci,CURLINFO_HTTP_CODE);
		if(200!==$httpStatusCode){
			return'ERRNO!';
		}
	}
	curl_close($ci);
	return$response;
}
先用以上函數獲取指定的網頁,然後從返回的數據中解析出你要的數據.可以使用正則表達式來提取,這要根據你要獲取的頁面源代碼來判斷了.暫時未知,以上只是提供一個思路給你.

I. 用PHP獲取網頁部分數據

如果你要
和
之間的所有源碼，用 preg_match 就可以，不用preg_match_all ，如果你要裡面的所有的

標簽中的內容，可以用preg_match_all //提取所有代碼 $pattern = '/
(.+?)
/is'; preg_match($pattern, $string, $match); //$match[0] 即為
和
之間的所有源碼 echo $match[0]; //然後再提取

之間的內容 $pattern = '/(.+?)li>/is'; preg_match_all($pattern, $match[0], $results); $new_arr=array_unique($results[0]); foreach($new_arr as $kkk){ echo $kkk; }

J. PHP採集網頁中指定的內容

你如果是單個頁面的話不需要正規表達式，只要找到自己需要的部分看看前面和後面有什麼唯一性的標識，截取出來就可以了。

導航:首頁 > 編程語言 > php獲取頁面指定內容

php獲取頁面指定內容

與php獲取頁面指定內容相關的資料