搜索引擎主要的有两个步骤,首先是抓去网站里面的链接,然后抓去链接中的内容,然后反复抓取内容中链接,然后再抓去内容,反复的进行这些操作。
首先要抓去一个网站需要开启指定的网站
$url = "http://blog.myolnet.com/";
$r = file_get_contents($url); //用file_get_contents将网址打开并读取所打开的页面的内容
preg_match("//is",$r,$booktitle);//匹配此页面的标题
这样就获取了一个网站当前的标题,存储到数据库中作为搜索引擎的索引,一边后面使用。
下次再写怎么获取网站中的链接吧!
转载请注明:七彩悠悠博客 | 心悠悠 情悠悠 » 写搜索引擎之前收集的一些资料