大雀软件园

首页 软件下载 安卓市场 苹果市场 电脑游戏 安卓游戏 文章资讯 驱动下载
技术开发 网页设计 图形图象 数据库 网络媒体 网络安全 站长CLUB 操作系统 媒体动画 安卓相关
当前位置: 首页 -> 技术开发 -> PHP专区 -> 同时提取多条新闻中的文本一例

同时提取多条新闻中的文本一例

时间: 2021-07-31 作者:daque

正文为一个索取一批消息网页中的文本的小步调,它不妨将各篇消息的实质存为以该消息题目为文献名的文本文献。如有更好的处置本领,请和我接洽: lwx3069@sina.com    这边以群众网中的“本日要闻”下的消息为例. <?php ($url) ? "" : $url = "http://www.unn.com.cn/gb/channel2/3/11/index.html";        // 本日要闻 if(isset($url)&&$url!="")        {    $str = implode("",file($url));    $str_ary = explode("<ul>",$str);    $str_ary = explode("<li>",trim($str_ary[1]));    for ($i=0; $i<8; $i++)        {       if (strlen(trim($str_ary[$i]))<3){       continue;       }       echo "消息".$i.":".$str_ary[$i];       $str1=strstr("$str_ary[$i]",'<a href="/');       $str2=strstr("$str_ary[$i]",'" target');       $len1=strlen("$str1");       $len2=strlen("$str2");       $len=$len1-$len2;       $url=substr("$str1",10,$len-10);       if (strlen(trim($url))!=0) {          $url = "http://www.unn.com.cn/".$url;          define(contents_dir,"./contents/");          if(isset($url)&&$url!="")        {             $str = implode("",file($url));             $str1=explode('<div align="right">',$str);            //去掉文献没用的上半局部             $str2 = explode('<h4 align="center">  </h4>',$str1[1]);             //掏出文献的下半局部,并去掉没用的下半局部,这时候获得的都是有效的             $str3=explode('</font><font size="+2"><b><font size="3">',$str2[0]);   //从所有有效局部掏出文献题目和正文             $str4=explode('</div>',$str2[0]);   //掏出日子和功夫             $str5=explode('</font></b></font><font size="2">',$str3[1]);     //从题目和正文局部掏出题目             $title=str_replace("<br>","",$str5[0]);             $str3=explode('<p><font size="2">',$str2[0]);          //从所有有效局部掏出文献正文             $str3[1]=str_replace('<br><br>    ',"\n"."  ",$str3[1]);             $str3[1]=str_replace(' ',"",$str3[1]);             $str3=strip_tags($str3[1]);             $pf=trim($title).".txt";             $ppf=fopen(contents_dir."$pf",'w');             fputs($ppf,$title);             fputs($ppf,"$str4[0]");             fputs($ppf,$str3);         }      }   } } ?> 

热门阅览

最新排行

Copyright © 2019-2021 大雀软件园(www.daque.cn) All Rights Reserved.