四时宝库

程序员的知识宝库

基于java的文档检索系统(java检索引擎)

该项目是基于java的文档检索系统,支持office,txt,pdf等文件的主流办公文件的全文检索,以及在线展示,一处维护处处查看。应对的是某些企业文档较多,查找文档困难以及文档共享内容延迟的情况,解决个人文档版本内容不一致等问题;

系统有三级过滤

  1. 第一级文件夹过滤:只查找想查找的目录
  2. 第二级文档库全文检索过滤: 通过检索文档内容对内容进行一次过滤
  3. 第三级前端二次过滤: 检索结果太多,前端二次过滤
  4. 通过以上三级过滤精准命中目标文档,前后端精心优化,一次性加载10万个节点可稳定检索,经测试文件名过滤速度比windows快很多倍;

系统截图

检索页面

文件查看页面

软件架构

系统功能模块主要分1.数据分析,2.数据检索,3.数据展示 parent为父模块,为了扩展性,数据分析模块(file2text),数据展示模块(file2view),数据检索(fileSearch)均为独立模块开发, 其他模块为常规业务模块

安装教程

  1. 安装jdk8路径不要有中文也不要有括号
  2. elasticsearch5或者以上版本,配置使用默认端口即可
  3. 安装redis使用默认端口即可
  4. 安装LibreOffice 5
  5. 如果没下载安装2和3可以在官网和github上下载
  6. 在application.properties中配置下要解析的文件路径和视图文件存放位置即可开始使用项目了

使用说明

  1. 配置文档库目录,和视图库目录
  2. web下面Application#main是启动入口
  3. 启动后直接访问127.0.0.1即可访问
  4. 使用用户名密码:admin/000000登陆系统

项目地址

https://gitee.com/cangjingge/jFileSearch

发表评论:

控制面板
您好,欢迎到访网站!
  查看权限
网站分类
最新留言
    友情链接