最優(yōu)良人 » 采集 http://www.dgkai.cn/blog 中山php|最優(yōu)網(wǎng)絡(luò) Mon, 13 May 2013 04:56:43 +0000 en hourly 1 http://wordpress.org/?v=3.1.4 php采集程序,提取網(wǎng)頁(yè)超鏈接,郵箱或其他特定內(nèi)容 http://www.dgkai.cn/blog/view-366.html http://www.dgkai.cn/blog/view-366.html#comments Wed, 30 May 2012 08:48:29 +0000 lin http://www.dgkai.cn/blog/?p=366 以下代碼從上一篇文章修改而來(lái),專門(mén)用于提取網(wǎng)頁(yè)所有超鏈接,郵箱或其他特定內(nèi)容

<?php

function fetch_urlpage_contents($url){
$c=file_get_contents($url);
return $c;
}
//獲取匹配內(nèi)容
function fetch_match_contents($begin,$end,$c)
{
$begin=change_match_string($begin);
$end=change_match_string($end);
$p = "#{$begin}(.*){$end}#iU";//i表示忽略大小寫(xiě),U禁止貪婪匹配
if(preg_match_all($p,$c,$rs))
{
return $rs;}
else { return "";}
}//轉(zhuǎn)義正則表達(dá)式字符串
function change_match_string($str){
//注意,以下只是簡(jiǎn)單轉(zhuǎn)義
$old=array("/","$",'?');
$new=array("\/","\$",'\?');
$str=str_replace($old,$new,$str);
return $str;
}

//采集網(wǎng)頁(yè)
function pick($url,$ft,$th)
{
$c=fetch_urlpage_contents($url);
foreach($ft as $key => $value)
{
$rs[$key]=fetch_match_contents($value["begin"],$value["end"],$c);
if(is_array($th[$key]))
{ foreach($th[$key] as $old => $new)
{
$rs[$key]=str_replace($old,$new,$rs[$key]);
}
}
}
return $rs;
}

$url="http://www.dgkai.cn"; //要采集的地址
$ft["a"]["begin"]='<a'; //截取的開(kāi)始點(diǎn)<br />
$ft["a"]["end"]='>'; //截取的結(jié)束點(diǎn)

$rs=pick($url,$ft,$th); //開(kāi)始采集

print_r($rs["a"]);

?>

]]>
http://www.dgkai.cn/blog/view-366.html/feed 190
php小偷程序,簡(jiǎn)單的php采集代碼 http://www.dgkai.cn/blog/view-364.html http://www.dgkai.cn/blog/view-364.html#comments Wed, 30 May 2012 08:08:32 +0000 lin http://www.dgkai.cn/blog/?p=364 <?php

function fetch_urlpage_contents($url){
$c=file_get_contents($url);
return $c;
}
//獲取匹配內(nèi)容
function fetch_match_contents($begin,$end,$c)
{
$begin=change_match_string($begin);
$end=change_match_string($end);
$p = "{$begin}(.*){$end}";
if(eregi($p,$c,$rs))
{
return $rs[1];}
else { return "";}
}//轉(zhuǎn)義正則表達(dá)式字符串
function change_match_string($str){
//注意,以下只是簡(jiǎn)單轉(zhuǎn)義
//$old=array("/","$");
//$new=array("\/","\$");
$str=str_replace($old,$new,$str);
return $str;
}

//采集網(wǎng)頁(yè)
function pick($url,$ft,$th)
{
$c=fetch_urlpage_contents($url);
foreach($ft as $key => $value)
{
$rs[$key]=fetch_match_contents($value["begin"],$value["end"],$c);
if(is_array($th[$key]))
{ foreach($th[$key] as $old => $new)
{
$rs[$key]=str_replace($old,$new,$rs[$key]);
}
}
}
return $rs;
}

$url="http://www.dgkai.cn"; //要采集的地址
$ft["title"]["begin"]="<title>"; //截取的開(kāi)始點(diǎn)
$ft["title"]["end"]="</title>"; //截取的結(jié)束點(diǎn)
$th["title"]["中山"]="廣東"; //截取部分的替換

$ft["body"]["begin"]="<body>"; //截取的開(kāi)始點(diǎn)
$ft["body"]["end"]="</body>"; //截取的結(jié)束點(diǎn)
$th["body"]["中山"]="廣東"; //截取部分的替換

$rs=pick($url,$ft,$th); //開(kāi)始采集

echo $rs["title"];
echo $rs["body"]; //輸出
?>

]]>
http://www.dgkai.cn/blog/view-364.html/feed 289
dede采集的文章在欄目列表頁(yè)無(wú)法顯示 http://www.dgkai.cn/blog/view-213.html http://www.dgkai.cn/blog/view-213.html#comments Fri, 26 Aug 2011 15:20:43 +0000 lin http://www.dgkai.cn/blog/?p=213 利用dedecms的采集功能,大批量采集數(shù)據(jù)之后,沒(méi)辦法一個(gè)一個(gè)審核,所有在sql命令行運(yùn)行了

update `dede_archives` set `arcrank` = 0

批量審核文章,然后運(yùn)行

update `dede_archives` set `ismake` = -1

把所有文章改成動(dòng)態(tài)瀏覽

更新首頁(yè)html之后再最新更新可以看到新發(fā)布的文章,但是在欄目列表頁(yè)不顯示最新的數(shù)據(jù),原來(lái)dede還有一個(gè)文章的索引表dede_arctiny,只要運(yùn)行下面sql把審核狀態(tài)置為0就正常了

update `dede_arctiny` set `arcrank` = 0

效果如 最優(yōu)資訊中山新聞?lì)l道

]]>
http://www.dgkai.cn/blog/view-213.html/feed 412
九九精品一区二区| 精品一区无码| 亲日本本道在线观看| 色综合日本| 91无码视频| 亚洲欧美日韩备用站点| 国产第十页| 色达县| 久久丁香综合| 伊人久久大香线蕉av超碰| 热玖玖国产| 亚洲av动态图片| 2021国内精品久久久久精免费| 欧美日韩WwW一区二区三区| 午夜无码在线不卡| 秋霞网国产99| 亚洲五洲男人天堂| 欧美综合日| 玖玖中文视频| 啊v在线观看| 欧美激情性久久| 欧洲亚洲免费观看| 欧美区在线| 日韩熟女影库| 国产韩日| 欧美bbxx| 久久久久久久久久久久国产| 欧美久久不卡视频| 337p日本欧美裸体艺术| 亚洲 欧美日韩 国产 中文| 蜜桃视频在线| 91精品啪在线观看国产老湿机| 绯色av无码色欲在线观看免费| 亚洲AV无码成人毛片一级www| 色黄一区二区三区| 国产精品99久久99久久久动漫| 亚洲一线二线三线品牌精华液| 色女人天堂| 台湾省| 色呦呦91高清| 超碰97人人香蕉|