• 大小: 1.93MB
    文件类型: .rar
    金币: 1
    下载: 0 次
    发布日期: 2023-10-26
  • 语言: Java
  • 标签: jsp  

资源简介

jsp搜索引擎完整源码自带网络爬虫功能完整强大-外星人源码论坛的商业源码 详细介绍可以去www.eenot.com 查看

资源截图

代码片段和文件信息

package com.sohu;

import java.awt.FlowLayout;
import java.awt.event.ActionEvent;
import java.awt.event.ActionListener;
import java.awt.Toolkit;

import javax.swing.JButton;
import javax.swing.Jframe;
import javax.swing.JOptionPane;
import javax.swing.JPasswordField;
import javax.swing.JTextField;
import javax.swing.JLabel;

import java.util.*;
import java.io.IOException;

import com.sohu.crawler.*;
import com.sohu.*;

/**
 * 网络爬虫程序的用户界面类
 * @author Bob Hu
 *
 */
public class CrawlerUI extends Jframe
{
//该线程供抓取网页使用
    static Thread thread = null;
    
    //一组静态文本,说明编辑框的作用
    public JLabel crawlingUrlLabel = null;
    public JLabel inputUrlLabel = null;
    public JLabel inputTimeIntervalLabel = null;
    public JLabel timeElapsceLabel = null;
    public JLabel crawlingNumLabel = null;
    
    //一组编辑框,提供用户输入
    public JTextField crawlingUrl = null;
    public static JTextField inputUrl = null;
    public static JTextField inputTimeInterval = null;
    public static JTextField timeElapsce = null;
    public static JTextField crawlingNumText = null;
    
    //一组按钮
    public static JButton startButton = null;
    public static JButton stopButton = null;
    public static JButton exitButton = null;
    
    //用户界面对象
    public static CrawlerUI crawlerUI =null;
    
    //两个定时器
    //定时器 timer:完成数据采集工作,实现定时采集功能
    //定时器 auxTimer: 定时刷新一个计数器,显示下一次“定时采集“的剩余时间
public Timer timer = new Timer();
public Timer auxTimer = new Timer();

//计数器,用于记录下一次“定时采集的时间“
public static Integer counter = 0;
public static boolean isCounterInit = false;

//记录当前爬取的url数量
public static Long crawlingNum = 0L; 

    public CrawlerUI()
    {
     crawlerUI = this; 
    }
    
    /**
     *  “网络爬虫“界面创建函数
     */
    public void create()
    {
     //标题栏
Jframe frame = new Jframe(“网络爬虫“);
//布局管理器
frame.setLayout(new FlowLayout()); 

//创建静态文本框
crawlingUrlLabel =       new JLabel(“正在抓取的 url: “);
inputUrlLabel =          new JLabel(“请输入需要抓取的入口url:“);
inputTimeIntervalLabel = new JLabel(“请设定定时抓取间隔(s):“);
timeElapsceLabel =       new JLabel(“定时抓取剩余时间(s):    “);
crawlingNumLabel =       new JLabel(“已爬取url条数(1s刷新):    “); 

//创建供数据输入的编辑框
inputUrl =          new JTextField(““25);
        inputTimeInterval = new JTextField(““10);    
        crawlingUrl =       new JTextField(““25);  crawlingUrl.setEditable(false); //不能编辑
     timeElapsce =       new JTextField(““10);  timeElapsce.setEditable(false);
     crawlingNumText =   new JTextField(““10);  crawlingNumText.setEditable(false);

     //创建按钮
    startButton =  new JButton(“开始“);
    stopButton =   new JButton(“停止“); stopButton.setEnabled(false);  //禁用该按钮
    exitButton =   new JButton(“退出“);

        //添加按钮的消息响应
    startButton.addActionListener(new Listener_ok());
    stopButton.addActionListener(new Listener_cancel());     
    exitButton.addActionListener(new Listener_exit())

 属性            大小     日期    时间   名称
----------- ---------  ---------- -----  ----

     文件        613  2010-01-14 02:32  zhizhu\.classpath

     文件        495  2010-01-14 00:16  zhizhu\.classpath.bak

     文件        291  2010-01-13 20:21  zhizhu\.mymetadata

     文件       1412  2010-01-14 00:17  zhizhu\.project

     文件        406  2010-01-13 20:20  zhizhu\.settings\.jsdtscope

     文件         49  2010-01-13 20:20  zhizhu\.settings\org.eclipse.wst.jsdt.ui.superType.container

     文件          6  2010-01-13 20:20  zhizhu\.settings\org.eclipse.wst.jsdt.ui.superType.name

     文件       1671  2010-02-28 20:41  zhizhu\src\com\sohu\bean\NewsBean.java

     文件       2585  2010-02-28 20:46  zhizhu\src\com\sohu\bean\searchBean.java

     文件       3046  2010-02-28 20:46  zhizhu\src\com\sohu\crawler\Crawler.java

     文件       1959  2010-02-20 00:02  zhizhu\src\com\sohu\crawler\Crawler.java.bak

     文件       1542  2010-02-28 20:46  zhizhu\src\com\sohu\crawler\linkDB.java

     文件        183  2010-02-28 20:46  zhizhu\src\com\sohu\crawler\linkFilter.java

     文件       4904  2010-02-28 20:40  zhizhu\src\com\sohu\crawler\linkParser.java

     文件        232  2010-02-28 20:47  zhizhu\src\com\sohu\crawler\NewsToDB.java

     文件        659  2010-02-28 20:47  zhizhu\src\com\sohu\crawler\Queue.java

     文件       9105  2010-02-28 21:24  zhizhu\src\com\sohu\CrawlerUI.java

     文件       2379  2010-02-28 20:47  zhizhu\src\com\sohu\db\ConnectionManager.java

     文件       2069  2010-01-14 03:02  zhizhu\src\com\sohu\db\ConnectionManager.java.bak

     文件       3840  2010-02-28 20:48  zhizhu\src\com\sohu\servlet\GetNewsServlet.java

     文件       3492  2010-02-15 20:28  zhizhu\src\com\sohu\servlet\GetNewsServlet.java.bak

     文件      13444  2010-02-28 07:17  zhizhu\src\com\sohu\SohuNews.java

     文件      46725  2007-03-16 17:16  zhizhu\src\lib\commons-codec-1.3.jar

     文件     305001  2009-05-17 15:16  zhizhu\src\lib\commons-httpclient-3.1.jar

     文件      38015  2007-03-16 17:16  zhizhu\src\lib\commons-logging-1.0.4.jar

     文件      70029  2009-05-17 15:16  zhizhu\src\lib\htmllexer.jar

     文件     288106  2009-05-17 15:16  zhizhu\src\lib\htmlparser.jar

     文件      88209  2009-05-14 01:15  zhizhu\src\lib\servlet-api.jar

     文件     231949  2006-04-12 21:37  zhizhu\src\lib\sqljdbc.jar

     文件       1376  2010-02-27 17:47  zhizhu\WebRoot\display.jsp

............此处省略65个文件信息

评论

共有 条评论