热搜:6KBBS6kbbs V8.0 官方论坛
当前位置: 6kbbs V8.0 官方论坛 » 使用问题 » 关于采集规则-请帮我改成网易新闻排行榜
帖子状态  
本帖子共有 1744 位阅读者, 2 个回复.
  • 回复
3条记录

0007

幼儿园
帖子
金钱
12 
魅力
12 
威望
12 
注册
2010-10-25 
0007 发表于 2010-11-12 17:34   
关于采集规则-请帮我改成网易新闻排行榜
<?php
/*以下为采集的规则*/
// 开始采集的URL
$BEGIN_URL = 'http://news.163.com/special/0001386F/rank_news.html';
// 采集的数量,请勿填写过大,建议填写100
$COL_LIMIT_NUM = 20;
//被采集的网站的编码
$WEB_CHARSET="gb2312";
//获取文章URL的正则表达式
$VIEW_URL_P='/http:\/\/http://news.163.com\/(\d{8,8})\/n(\d{5,5}).html';
// 文章URL的正则匹配项的范围, array("1","100","999") 表示匹配的第一项的范围是100至999
$VIEW_URL_RANGE=array(
array("1","10","10"),
array("2","10000","99999"),
);
//获取文章URL的前缀
$VIEW_URL_PRE='';
//文章标题的正则表达式
$COL_TITLE_P='/<tr><td[^>]*>(<span>\d*<\/span>)?<a href="([^"]*)">([\s\S]*)<\/a><\/td><td[^>]*>(\d*)<\/td><\/tr>/iU';
//文章标题的正则表达式的匹配项
$COL_TITLE_P_N=1;
//文章标题中需要替换的字符串,请使用正则表达式
$COL_TITLE_REPLACE_R=array(
""=>"",
);
//文章内容的正则表达式
$COL_CONTENT_P='/<div id=\"content\">(.*)<\/div>(.*)<\!--<div id=\"ckepop\">/isU';
//文章内容的正则表达式的匹配项
$COL_CONTENT_P_N=1;
//文章内容中需要替换的字符串,请使用正则表达式
$COL_CONTENT_REPLACE_R=array(
""=>"",
);
$IS_DEBUG=false;
?>

0007

幼儿园
帖子
金钱
12 
魅力
12 
威望
12 
注册
2010-10-25 
0007 发表于 2010-11-13 11:17   
RE:关于采集规则-请帮我改成网易新闻排行榜
谁懂的,请帮我改一下啊

bltsq

小学生
帖子
20 
金钱
26 
魅力
26 
威望
26 
注册
2010-11-23 
bltsq 发表于 2010-11-24 22:15   
RE:关于采集规则-请帮我改成网易新闻排行榜
同感,我也觉得我的网站不足的就是这项功能

欢迎大家来参观、指导我的
便利贴社区 http://www.bltsq.com
  • 回复
3条记录