热搜:6KBBS6kbbs V8.0 官方论坛
当前位置: 6kbbs V8.0 官方论坛 » 查看ican123的资料
如何采集到腾讯“社会万象”的文章?

管理员你好,看到腾讯“社会万象”的文章很不错,想给采集过来,可是修改来修改去就是采集不到文章,还是采集规则不会啊,请ADMIN给帮忙改一下哈,先谢谢啦
社会万象的网址是http://news.qq.com/newssh/shwx/shehuiwanxiang.htm

<?php
/*以下为采集的规则,带“★★★★★”的项目,用户可以根据需要自行修改,其他的尽量不要修改。*/
//★★★★★ 开始采集的URL
$BEGIN_URL="http://news.qq.com/newssh/shwx/";
//★★★★★ 采集的数量,请勿填写过大,建议填写100
$COL_LIMIT_NUM = 100;
//被采集的网站的编码
$WEB_CHARSET="utf-8";
//获取文章URL的正则表达式
$VIEW_URL_P='/http:\/\/news.qq.com/newssh/shwx\/(\d{8,8})\/n(\d{5,5}).shtml/isU';
//★★★★★ 文章URL的正则匹配项的范围, array("1","100","999") 表示匹配的第一项的范围是100至999
$VIEW_URL_RANGE=array(
array("1","20110702","20110704"),
array("2","10000","99999"),
);
//获取文章URL的前缀
$VIEW_URL_PRE='';
//文章标题的正则表达式
$COL_TITLE_P='/<h1>(.*)<\/h1>/isU';
//文章标题的正则表达式的匹配项
$COL_TITLE_P_N=1;
//文章标题中需要替换的字符串,请使用正则表达式
$COL_TITLE_REPLACE_R=array(
"/6kbbs论坛/is"=>"6KBBS官方论坛",
);
//文章内容的正则表达式
$COL_CONTENT_P='/<div id=\"content\">(.*)<\/div>(.*)<\!--<div id=\"ckepop\">/isU';
//文章内容的正则表达式的匹配项
$COL_CONTENT_P_N=1;
//文章内容中需要替换的字符串,请使用正则表达式
$COL_CONTENT_REPLACE_R=array(
"/6kbbs论坛/is"=>"6k论坛",
);
$IS_DEBUG=false;
?>

所在版块:使用问题 - 发表时间: 2011-07-14 16:27
采集的文章只有标题没有内容

大家好,请教大伙一个问题,就是偶用“文章采集”的时候,一次采集文章20篇,查看了一下才发现,文章的标题是采集到了,可是文章的内容并没有采集到,请问如何解决?
谢谢
采集是用系统自带的admin5的

采集规则如下:
<?php
/*以下为采集的规则,带“★★★★★”的项目,用户可以根据需要自行修改,其他的尽量不要修改。*/
//★★★★★ 开始采集的URL
$BEGIN_URL="http://www.admin5.com/browse/177/index.shtml";
//★★★★★ 采集的数量,请勿填写过大,建议填写100
$COL_LIMIT_NUM = 100;
//被采集的网站的编码
$WEB_CHARSET="gb2312";
//获取文章URL的正则表达式
$VIEW_URL_P='/\/article\/(\d{8,8})\/(\d{6,6}).shtml/isU';
//★★★★★ 文章URL的正则匹配项的范围, array("1","100","999") 表示匹配的第一项的范围是100至999
$VIEW_URL_RANGE=array(
array("1","20100825","20150909"),
array("2","100000","999999"),
);
//获取文章URL的前缀
$VIEW_URL_PRE='http://www.admin5.com';
//文章标题的正则表达式
$COL_TITLE_P='/<h1>(.*)<\/h1>/isU';
//文章标题的正则表达式的匹配项
$COL_TITLE_P_N=1;
//文章标题中需要替换的字符串,请使用正则表达式
$COL_TITLE_REPLACE_R=array(
"/6kbbs论坛/is"=>"6KBBS官方论坛",
);
//文章内容的正则表达式
$COL_CONTENT_P='/<div id=\"arctext\">(.*)<\/div>(.*)<div class=\"author\">/isU';
//文章内容的正则表达式的匹配项
$COL_CONTENT_P_N=1;
//文章内容中需要替换的字符串,请使用正则表达式
$COL_CONTENT_REPLACE_R=array(
"/6kbbs论坛/is"=>"6k论坛",
);
$IS_DEBUG=false;
?>

所在版块:6KZZ使用问题 - 发表时间: 2011-06-26 09:17
也求友情链接

大家好,本站集网址导航、最新团购、原创评论于一体,hao123有的咱都有,没有的咱也有,和大伙做友情链接,先看看网站再说,有意者再联系
http://www.ican123.com

谢谢

所在版块:链接交换 - 发表时间: 2011-06-02 10:56
如何避免会员发贴,并限制回复字数?

如何避免会员发贴,并限制回复字数?
偶的网站刚建站半年多,管理人员不多,暂时想限制会员发贴,但不限制回复,请问该如何设置?
另外回复字数好像是10--10000字符,如何自由设置回复限制字数的多少?
爱看之家网站
http://www.ican123.com

所在版块:使用问题 - 发表时间: 2011-06-01 09:46
如何避免会员发贴,并限制回复字数?

偶的网站刚建站半年多,管理人员不多,暂时想限制会员发贴,但不限制回复,请问该如何设置?
另外回复字数好像是10--10000字符,如何自由设置回复限制字数的多少?
爱看之家网站http://www.ican123.com

所在版块:6KZZ使用问题 - 发表时间: 2011-06-01 08:08
5条记录
推荐阅读:

ican123

小学生
帖子
13 
金钱
23 
魅力
23 
威望
23 
注册
2011-06-01 
TA的粉丝(0)