当前页面: 开发资料首页 → Java 专题 → 用Java+MySQL+PHP轻松构建跨平台的搜索引擎
用Java+MySQL+PHP轻松构建跨平台的搜索引擎
摘要: 此搜索引擎适于在一个中等规模的局域网中使用,由于找到的网页存在数据库中,不仅可以索静态的HTML页面,也可以搜索php、asp等动态页面
此搜索引擎适于在一个中等规模的局域网中使用,由于找到的网页存在数据库中,不仅可以索静态的HTML页面,可以搜索php、asp等动态页面。对于一个拥有5万个网页的系统(使用PII-400作为服务器),搜索响应时间在2-10秒左右,完全可以满足要求,由于Java、MySQL、PHP都是跨平台的软件,所以此搜索引擎不仅可以工作在Windows服务器上,而且也可以工作在Linux等其他系统中。
一、建立搜索引擎需要的数据库和数据表。
首先建立数据库:
c:\mysql\bin\> mysqladmin -uroot -pmypasswd create Spider
然后建立数据库中的表结构
c:\mysql\bin\> mysql -uroot -pmypasswd Spider < Spider.mysql
其中Spider.mysql为一个文本文件,其内容如下:
<table width="100%" bgColor=#ffffff>
<tr>
<td>CREATE TABLE link (
Id int(10) unsigned NOT NULL auto_increment,
Url varchar(120) NOT NULL,
Class tinyint(3) unsigned NOT NULL default 0 ,
IsSearchLink tinyint(3) unsigned default 0,
PRIMARY KEY (Url),
UNIQUE Id (Id),
KEY Url (Url),
KEY Class (Class)
);</td></tr></table>
# 本局域网的初始主页地址,搜索蜘蛛从此网址开始搜索所有其他网页
<table width="100%" bgColor=#ffffff>
<tr>
<td>INSERT INTO link VALUES( '1', 'HTTP://102.211.69.1/', '0', '0');</td></tr></table>
# 数据表 webpagelocal 用来存放下载的所有的网页
<table width="100%" bgColor=#ffffff>
<tr>
<td>CREATE TABLE webpagelocal (
Id int(10) unsigned NOT NULL auto_increment,
Url varchar(120) NOT NULL,
Content text NOT NULL,
PRIMARY KEY (Url),
UNIQUE Id (Id),
KEY Url (Url)
);</td></tr></table>
# 数据表 webpagefindfast
# 用MakeFast.php从表webpagelocal中提取512字节的检索信息存放其中
<table width="100%" bgColor=#ffffff>
<tr>
<td>CREATE TABLE webpagefindfast (
Id int(10) unsigned NOT NULL,
Url varchar(120) NOT NULL,
Title varchar(64),
Content blob,
PRIMARY KEY (Url),
KEY Url (Url),
KEY Title (Title)
);</td></tr></table>
↑返回目录
前一篇:
设计模式之Facade(外观)
后一篇:
设计模式之State