写搜索引擎之前收集的一些资料

旧版博客 ayflying 1456℃ 评论
搜索引擎主要的有两个步骤,首先是抓去网站里面的链接,然后抓去链接中的内容,然后反复抓取内容中链接,然后再抓去内容,反复的进行这些操作。 首先要抓去一个网站需要开启指定的网站 $url = "http://blog.myolnet.com/"; $r = file_get_contents($url); //用file_get_contents将网址打开并读取所打开的页面的内容 preg_match("//is",$r,$booktitle);//匹配此页面的标题 这样就获取了一个网站当前的标题,存储到数据库中作为搜索引擎的索引,一边后面使用。 下次再写怎么获取网站中的链接吧!

转载请注明:七彩悠悠博客 | 心悠悠 情悠悠 » 写搜索引擎之前收集的一些资料

高效,专业,悠悠博客

联系我们