一. 认识搜索引擎


二. 项目介绍 

三. 实现索引模块



实现 Indexer类

实现 FileScanner类

实现 IndexManager类

实现 IndexerProperties类

实现 Document类


实现 InvertedRecord类

四. 实现搜索模块


实现 Document

实现 DescBuilder类

五. 项目展示





一. 认识搜索引擎






标准的解法就是使用倒排索引(Inverted index)。

文档:被检索的 html 页面,pdf,图片,视频等等。



二. 项目介绍 

该项目只针对 JDK API 文档库中的 html 做搜索。下载地址:文档下载


  1. 构建索引模块(不需要使用web功能)
  2. 搜索模块(依赖构建索引完成之后才能进行,需要web功能)

三. 实现索引模块


forward.json:存储正排索引,没有考虑性能,使用了方便理解的 JSON 格式;

inverted.json:存储倒排索引 ;


1. 扫描文档目录下的所有文档:目录遍历的过程 FileScanner;

2. 针对每一篇文档进行分析,处理,得到文档的标题,最终访问的URL,文档下的内容;

3. 每一篇文档:标题,url,内容,标题和内容的每个词;利用上述信息就可以构建索引;

4. 保存索引信息(可以保存成文件系统的一个文件,或者表中的记录) 


创建Spring Boot项目


点击 Finish 就完成 Spring Boot 的项目创建了; 

实现 Indexer类


  1. /**
  2. * 构建索引的模块,是整个程序的逻辑入口
  3. */
  4. @Slf4j // 添加 Spring 日志的使用
  5. @Component // 注册成 Spring 的 bean
  6. //@Profile("run") // 让跑测试的时候不加载这个 bean(run != test)
  7. public class Indexer implements CommandLineRunner {
  8. // 需要依赖 FileScanner 对象
  9. private final FileScanner fileScanner;
  10. private final IndexerProperties properties;
  11. private final IndexManager indexManager;
  12. private final ExecutorService executorService;
  13. @Autowired // 构造方法注入的方式,让 Spring 容器,注入 FileScanner 对象进来 —— DI
  14. public Indexer(FileScanner fileScanner, IndexerProperties properties, IndexManager indexManager, ExecutorService executorService) {
  15. this.fileScanner = fileScanner;
  16. this.properties = properties;
  17. this.indexManager = indexManager;
  18. this.executorService = executorService;
  19. }
  20. @Override
  21. public void run(String... args) throws Exception {
  22. ToAnalysis.parse("随便分个什么,进行预热,避免优化的时候计算第一次特别慢的时间");
  23. log.info("这里的整个程序的逻辑入口");
  24. // 1. 扫描出来所有的 html 文件
  25. log.debug("开始扫描目录,找出所有的 html 文件。{}", properties.getDocRootPath());
  26. List<File> htmlFileList = fileScanner.scanFile(properties.getDocRootPath(), file -> {
  27. return file.isFile() && file.getName().endsWith(".html");
  28. });
  29. log.debug("扫描目录结束,一共得到 {} 个文件。", htmlFileList.size());
  30. // 2. 针对每个 html 文件,得到其 标题、URL、正文信息,把这些信息封装成一个对象(文档 Document)
  31. File rootFile = new File(properties.getDocRootPath());
  32. List<Document> documentList = htmlFileList.stream()
  33. .parallel() // 【注意】由于我们使用了 Stream 用法,所以,可以通过添加 .parallel(),使得整个操作变成并行,利用多核增加运行速度
  34. .map(file -> new Document(file, properties.getUrlPrefix(), rootFile))
  35. .collect(Collectors.toList());
  36. log.debug("构建文档完毕,一共 {} 篇文档", documentList.size());
  37. // 3. 进行正排索引的保存
  38. indexManager.saveForwardIndexesConcurrent(documentList);
  39. log.debug("正排索引保存成功。");
  40. // 4. 进行倒排索引的生成核保存
  41. indexManager.saveInvertedIndexesConcurrent(documentList);
  42. log.debug("倒排索引保存成功。");
  43. // 5. 关闭线程池
  44. executorService.shutdown();
  45. }
  46. }

实现 FileScanner类


  1. @Slf4j // 添加日志
  2. @Service // 注册成 Spring bean
  3. public class FileScanner {
  4. /**
  5. * 以 rootPath 作为根目录,开始进行文件的扫描,把所有符合条件的 File 对象,作为结果,以 List 形式返回
  6. * @param rootPath 根目录的路径,调用者需要确保这个目录存在 && 一定是一个目录
  7. * @param filter 通过针对每个文件调用 filter.accept(file) 就知道,文件是否满足条件
  8. * @return 满足条件的所有文件
  9. */
  10. public List<File> scanFile(String rootPath, FileFilter filter) {
  11. List<File> resultList = new ArrayList<>();
  12. File rootFile = new File(rootPath);
  13. // 针对目录树进行遍历,深度优先 or 广度优先即可,确保每个文件都没遍历到即可
  14. // 我们这里采用深度优先遍历,使用递归完成
  15. traversal(rootFile, filter, resultList);
  16. return resultList;
  17. }
  18. private void traversal(File directoryFile, FileFilter filter, List<File> resultList) {
  19. // 1. 先通过目录,得到该目录下的孩子文件有哪些
  20. File[] files = directoryFile.listFiles();
  21. if (files == null) {
  22. // 说明有问题,我们不管(一般是权限等的问题),通常咱们遇不到这个错误
  23. return;
  24. }
  25. // 2. 遍历每个文件,检查是否符合条件
  26. for (File file : files) {
  27. // 通过 filter.accept(file) 的返回值,判断是否符合条件
  28. if (filter.accept(file)) {
  29. // 说明符合条件,需要把该文件加入到结果 List 中
  30. resultList.add(file);
  31. }
  32. }
  33. // 3. 遍历每个文件,针对是目录的情况,继续深度优先遍历(递归)
  34. for (File file : files) {
  35. if (file.isDirectory()) {
  36. traversal(file, filter, resultList);
  37. }
  38. }
  39. }
  40. }

实现 IndexManager类


  1. @Slf4j
  2. @Component
  3. public class IndexManager {
  4. private final IndexDatabaseMapper mapper;
  5. private final ExecutorService executorService;
  6. @Autowired
  7. public IndexManager(IndexDatabaseMapper mapper, ExecutorService executorService) {
  8. this.mapper = mapper;
  9. this.executorService = executorService;
  10. }
  11. // 先批量生成、保存正排索引(单线程版本)
  12. public void saveForwardIndexes(List<Document> documentList) {
  13. // 1. 批量插入时,每次插入多少条记录(由于每条记录比较大,所以这里使用 10 条就够了)
  14. int batchSize = 10;
  15. // 2. 一共需要执行多少次 SQL? 向上取整(documentList.size() / batchSize)
  16. int listSize = documentList.size();
  17. int times = (int) Math.ceil(1.0 * listSize / batchSize); // ceil(天花板): 向上取整
  18. log.debug("一共需要 {} 批任务。", times);
  19. // 3. 开始分批次插入
  20. for (int i = 0; i < listSize; i += batchSize) {
  21. // 从 documentList 中截取这批要插入的 文档列表(使用 List.subList(int from, int to)
  22. int from = i;
  23. int to = Integer.min(from + batchSize, listSize);
  24. List<Document> subList = documentList.subList(from, to);
  25. // 针对这个 subList 做批量插入
  26. mapper.batchInsertForwardIndexes(subList);
  27. }
  28. }
  29. @Timing("构建 + 保存正排索引 —— 多线程版本")
  30. @SneakyThrows
  31. public void saveForwardIndexesConcurrent(List<Document> documentList) {
  32. // 1. 批量插入时,每次插入多少条记录(由于每条记录比较大,所以这里使用 10 条就够了)
  33. int batchSize = 10;
  34. // 2. 一共需要执行多少次 SQL? 向上取整(documentList.size() / batchSize)
  35. int listSize = documentList.size();
  36. int times = (int) Math.ceil(1.0 * listSize / batchSize); // ceil(天花板): 向上取整
  37. log.debug("一共需要 {} 批任务。", times);
  38. CountDownLatch latch = new CountDownLatch(times); // 统计每个线程的完全情况,初始值是 times(一共多少批)
  39. // 3. 开始分批次插入
  40. for (int i = 0; i < listSize; i += batchSize) {
  41. // 从 documentList 中截取这批要插入的 文档列表(使用 List.subList(int from, int to)
  42. int from = i;
  43. int to = Integer.min(from + batchSize, listSize);
  44. Runnable task = () -> { // 内部类 / lambda 表达式里如果用到了外部变量,外部变量必须的 final(或者隐式 final 的变量)
  45. List<Document> subList = documentList.subList(from, to);
  46. // 针对这个 subList 做批量插入
  47. mapper.batchInsertForwardIndexes(subList);
  48. latch.countDown(); // 每次任务完成之后,countDown(),让 latch 的个数减一
  49. };
  50. executorService.submit(task); // 主线程只负责把一批批的任务提交到线程池,具体的插入工作,由线程池中的线程完成
  51. }
  52. // 4. 循环结束,只意味着主线程把任务提交完成了,但任务有没有做完是不知道的
  53. // 主线程等在 latch 上,只到 latch 的个数变成 0,也就是所有任务都已经执行完了
  54. latch.await();
  55. }
  56. @SneakyThrows
  57. public void saveInvertedIndexes(List<Document> documentList) {
  58. int batchSize = 10000; // 批量插入时,最多 10000 条
  59. List<InvertedRecord> recordList = new ArrayList<>(); // 放这批要插入的数据
  60. for (Document document : documentList) {
  61. Map<String, Integer> wordToWeight = document.segWordAndCalcWeight();
  62. for (Map.Entry<String, Integer> entry : wordToWeight.entrySet()) {
  63. String word = entry.getKey();
  64. int docId = document.getDocId();
  65. int weight = entry.getValue();
  66. InvertedRecord record = new InvertedRecord(word, docId, weight);
  67. recordList.add(record);
  68. // 如果 recordList.size() == batchSize,说明够一次插入了
  69. if (recordList.size() == batchSize) {
  70. mapper.batchInsertInvertedIndexes(recordList); // 批量插入
  71. recordList.clear(); // 清空 list,视为让 list.size() = 0
  72. }
  73. }
  74. }
  75. // recordList 还剩一些,之前放进来,但还不够 batchSize 个的,所以最后再批量插入一次
  76. mapper.batchInsertInvertedIndexes(recordList); // 批量插入
  77. recordList.clear();
  78. }
  79. static class InvertedInsertTask implements Runnable {
  80. private final CountDownLatch latch;
  81. private final int batchSize;
  82. private final List<Document> documentList;
  83. private final IndexDatabaseMapper mapper;
  84. InvertedInsertTask(CountDownLatch latch, int batchSize, List<Document> documentList, IndexDatabaseMapper mapper) {
  85. this.latch = latch;
  86. this.batchSize = batchSize;
  87. this.documentList = documentList;
  88. this.mapper = mapper;
  89. }
  90. @Override
  91. public void run() {
  92. List<InvertedRecord> recordList = new ArrayList<>(); // 放这批要插入的数据
  93. for (Document document : documentList) {
  94. Map<String, Integer> wordToWeight = document.segWordAndCalcWeight();
  95. for (Map.Entry<String, Integer> entry : wordToWeight.entrySet()) {
  96. String word = entry.getKey();
  97. int docId = document.getDocId();
  98. int weight = entry.getValue();
  99. InvertedRecord record = new InvertedRecord(word, docId, weight);
  100. recordList.add(record);
  101. // 如果 recordList.size() == batchSize,说明够一次插入了
  102. if (recordList.size() == batchSize) {
  103. mapper.batchInsertInvertedIndexes(recordList); // 批量插入
  104. recordList.clear(); // 清空 list,视为让 list.size() = 0
  105. }
  106. }
  107. }
  108. // recordList 还剩一些,之前放进来,但还不够 batchSize 个的,所以最后再批量插入一次
  109. mapper.batchInsertInvertedIndexes(recordList); // 批量插入
  110. recordList.clear();
  111. latch.countDown();
  112. }
  113. }
  114. @Timing("构建 + 保存倒排索引 —— 多线程版本")
  115. @SneakyThrows
  116. public void saveInvertedIndexesConcurrent(List<Document> documentList) {
  117. int batchSize = 10000; // 批量插入时,最多 10000 条
  118. int groupSize = 50;
  119. int listSize = documentList.size();
  120. int times = (int) Math.ceil(listSize * 1.0 / groupSize);
  121. CountDownLatch latch = new CountDownLatch(times);
  122. for (int i = 0; i < listSize; i += groupSize) {
  123. int from = i;
  124. int to = Integer.min(from + groupSize, listSize);
  125. List<Document> subList = documentList.subList(from, to);
  126. Runnable task = new InvertedInsertTask(latch, batchSize, subList, mapper);
  127. executorService.submit(task);
  128. }
  129. latch.await();
  130. }
  131. }

实现 IndexerProperties类

  1. @Component // 是注册到 Spring 的一个 bean
  2. @ConfigurationProperties("searcher.indexer")
  3. @Data // = @Getter + @Setter + @ToString + @EqualsAndHashCode
  4. public class IndexerProperties {
  5. // 对应 application.yml 配置下的 searcher.indexer.doc-root-path
  6. private String docRootPath;
  7. // 对应 application.yml 配置下的 searcher.indexer.url-prefix
  8. private String urlPrefix;
  9. // 对应 application.yml 配置下的 searcher.indexer.index-root-path
  10. private String indexRootPath;
  11. }

实现 Document类

  1. @Slf4j
  2. @Data
  3. public class Document {
  4. private Integer docId; // docId 会在正排索引插入后才会赋值
  5. private String title; // 从文件名中解析出来
  6. private String url; // 依赖两个额外的信息(1. https://docs.oracle.com/javase/8/docs/api/ 2. 相对路径的相对位置)
  7. private String content; // 从文件中读取出来,并且做一定的处理
  8. }
  1. // 针对文档进行分词,并且分别计算每个词的权重
  2. public Map<String, Integer> segWordAndCalcWeight() {
  3. // 统计标题中的每个词出现次数 | 分词:标题有哪些词
  4. List<String> wordInTitle = ToAnalysis.parse(title)
  5. .getTerms()
  6. .stream()
  7. .parallel()
  8. .map(Term::getName)
  9. .filter(s -> !ignoredWordSet.contains(s))
  10. .collect(Collectors.toList());
  11. // 统计标题中,每个词的出现次数 | 统计次数
  12. Map<String, Integer> titleWordCount = new HashMap<>();
  13. for (String word : wordInTitle) {
  14. int count = titleWordCount.getOrDefault(word, 0);
  15. titleWordCount.put(word, count + 1);
  16. }
  17. // 统计内容中的词,以及词的出现次数
  18. List<String> wordInContent = ToAnalysis.parse(content)
  19. .getTerms()
  20. .stream()
  21. .parallel()
  22. .map(Term::getName)
  23. .collect(Collectors.toList());
  24. Map<String, Integer> contentWordCount = new HashMap<>();
  25. for (String word : wordInContent) {
  26. int count = contentWordCount.getOrDefault(word, 0);
  27. contentWordCount.put(word, count + 1);
  28. }
  29. // 计算权重值
  30. Map<String, Integer> wordToWeight = new HashMap<>();
  31. // 先计算出有哪些词,不重复
  32. Set<String> wordSet = new HashSet<>(wordInTitle);
  33. wordSet.addAll(wordInContent);
  34. for (String word : wordSet) {
  35. int titleCount = titleWordCount.getOrDefault(word, 0);
  36. int contentCount = contentWordCount.getOrDefault(word, 0);
  37. int weight = titleCount * 10 + contentCount;
  38. wordToWeight.put(word, weight);
  39. }
  40. return wordToWeight;
  41. }


创建 forward_indexes 和 inverted_indexes 表

  1. CREATE SCHEMA `searcher_refactor` DEFAULT CHARACTER SET utf8mb4 ;
  2. CREATE TABLE `searcher_refactor`.`forward_indexes` (
  4. `title` VARCHAR(100) NOT NULL,
  5. `url` VARCHAR(200) NOT NULL,
  6. `content` LONGTEXT NOT NULL,
  7. PRIMARY KEY (`docid`))
  8. COMMENT = '存放正排索引\ndocid -> 文档的完整信息';
  9. CREATE TABLE `searcher_refactor`.`inverted_indexes` (
  11. `word` VARCHAR(100) NOT NULL,
  12. `docid` INT NOT NULL,
  13. `weight` INT NOT NULL,
  14. PRIMARY KEY (`id`))
  15. COMMENT = '倒排索引\n通过 word -> [ { docid + weight }, { docid + weight }, ... ]';

实现 InvertedRecord类

  1. // 这个对象映射 inverted_indexes 表中的一条记录(我们不关心表中的 id,就不写 id 了)
  2. @Data
  3. public class InvertedRecord {
  4. private String word;
  5. private int docId;
  6. private int weight;
  7. public InvertedRecord(String word, int docId, int weight) {
  8. this.word = word;
  9. this.docId = docId;
  10. this.weight = weight;
  11. }
  12. }

四. 实现搜索模块



  1. <!DOCTYPE html>
  2. <html lang="zh-hans">
  3. <head>
  4. <meta charset="UTF-8">
  5. <meta http-equiv="X-UA-Compatible" content="IE=edge">
  6. <meta name="viewport" content="width=device-width, initial-scale=1.0">
  7. <title>神马搜索</title>
  8. <link rel="stylesheet" href="style.css">
  9. </head>
  10. <body>
  11. <div class="container">
  12. <i class="fa-brands fa-windows item"></i>
  13. <div class="search-box">
  14. <input type="text" class="search-btn" placeholder="搜索">
  15. </div>
  16. <i class="fa-solid fa-magnifying-glass item search-submit"></i>
  17. </div>
  18. <div class="time-box"></div>
  19. <div class="poem">
  20. <p>「世间行乐亦如此,古来万事东流水。」</p>
  21. <p class="author">—— 《梦游天姥吟留别》</p>
  22. </div>
  23. <div class="background"></div>
  24. <script src="https://kit.fontawesome.com/44e73cd2d1.js" crossorigin="anonymous"></script>
  25. <script>
  26. const search = (query) => {
  27. window.open('/web?query=' + encodeURIComponent(query), '_blank')
  28. }
  29. const oSearch = document.querySelector('.search-btn')
  30. oSearch.addEventListener('focus', () => {oSearch.placeholder = ''})
  31. oSearch.addEventListener('blur', () => {oSearch.placeholder = '搜索'})
  32. oSearch.addEventListener('keydown', (event) => {
  33. if (event.keyCode === 13 && oSearch.value.trim().length !== 0) {
  34. search(oSearch.value.trim())
  35. oSearch.value = ''
  36. oSearch.blur()
  37. }
  38. })
  39. document.querySelector('.search-submit').addEventListener('click', () => {
  40. if (oSearch.value.trim().length !== 0) {
  41. search(oSearch.value.trim())
  42. oSearch.value = ''
  43. }
  44. })
  45. const oTimeBox = document.querySelector('.time-box')
  46. const updateTime = () => {
  47. let now = new Date()
  48. let hour = now.getHours()
  49. let minute = now.getMinutes()
  50. if (hour < 10) {
  51. hour = '0' + hour
  52. }
  53. if (minute < 10) {
  54. minute = '0' + minute
  55. }
  56. oTimeBox.textContent = `${hour}:${minute}`
  57. let second = now.getSeconds()
  58. let r = 60 - second
  59. setTimeout(updateTime, r * 1000)
  60. }
  61. updateTime()
  62. </script>
  63. </body>
  64. </html>


  1. <!DOCTYPE html>
  2. <html lang="zh-hans" xmlns:th="https://www.thymeleaf.org">
  3. <head>
  4. <meta charset="UTF-8">
  5. <title th:text="${query} + ' - 神马搜索'"></title>
  6. <link rel="stylesheet" href="/query.css">
  7. </head>
  8. <body>
  9. <!-- th:xxx 是 thymeleaf 的语法 -->
  10. <!-- <div th:text="'你好 ' + ${name} + ' 世界'"></div>-->
  11. <div class="header">
  12. <div class="brand"><a href="/">神马搜索</a></div>
  13. <form class="input-shell" method="get" action="/web">
  14. <input type="text" name="query" th:value="${query}">
  15. <button>神马搜索</button>
  16. </form>
  17. </div>
  18. <div class="result">
  19. <!-- th:utext 和 th:text 的区别:要不要进行 HTML 转义 -->
  20. <!-- <div th:text="'<span>你好 th:text</span>'"></div>-->
  21. <!-- <div th:utext="'<span>你好 th:utext</span>'"></div>-->
  22. <div class="result-item" th:each="doc : ${docList}">
  23. <a th:href="${doc.url}" th:text="${doc.title}"></a>
  24. <div class="desc" th:utext="${doc.desc}"></div>
  25. <div class="url" th:text="${doc.url}"></div>
  26. </div>
  27. </div>
  28. <!-- <div class="result">-->
  29. <!-- <div th:each="item : ${testList}">-->
  30. <!-- <span th:text="${item}"></span>-->
  31. <!-- </div>-->
  32. <!-- </div>-->
  33. <!-- 一直上一页可能走到 page <= 0 的情况 -->
  34. <!-- 一直下一页可能走到 page > 上限的情况 -->
  35. <div class="pagination">
  36. <a th:href="'/web?query=' + ${query} + '&page=' + ${page - 1}">上一页</a>
  37. <a th:href="'/web?query=' + ${query} + '&page=' + ${page + 1}">下一页</a>
  38. </div>
  39. </body>
  40. </html>


  1. * {
  2. margin: 0;
  3. padding: 0;
  4. box-sizing: border-box;
  5. }
  6. .header {
  7. width: 100%;
  8. height: 80px;
  9. position: fixed; /* 固定不动 */
  10. left: 0;
  11. top: 0;
  12. background-color: #eee;
  13. border-bottom: 1px solid #ccc;
  14. padding-left: 120px;
  15. display: flex;
  16. align-items: center;
  17. }
  18. .brand {
  19. margin-right: 120px;
  20. }
  21. .brand a {
  22. color: inherit;
  23. text-decoration: none;
  24. }
  25. .input-shell {
  26. width: 800px;
  27. height: 52px;
  28. border: 1px solid #aaa;
  29. border-radius: 4px;
  30. display: flex;
  31. align-items: stretch;
  32. justify-content: space-between;
  33. }
  34. .input-shell:focus, /* :focus : 该元素 获得焦点 */
  35. .input-shell:hover { /* :hover : 鼠标滑过该元素 */
  36. border: 1px solid #888;
  37. }
  38. .input-shell input {
  39. border: none;
  40. outline: none;
  41. width: 600px;
  42. padding-left: 8px;
  43. font-size: 22px;
  44. }
  45. .input-shell button {
  46. border: none;
  47. outline: none;
  48. width: 200px;
  49. border-left: 1px solid #ccc;
  50. }
  51. .result {
  52. margin-top: 88px;
  53. width: 100%;
  54. padding-left: 120px;
  55. }
  56. .result-item {
  57. display: flex;
  58. flex-direction: column;
  59. margin-bottom: 20px;
  60. align-items: start;
  61. }
  62. .result-item a {
  63. font-size: 22px;
  64. font-weight: 700;
  65. color: rgb(42, 107, 205);
  66. }
  67. .result-item .desc {
  68. font-size: 18px;
  69. }
  70. .result-item .url {
  71. font-size: 18px;
  72. color: rgb(0, 128, 0);
  73. }
  74. .result-item .desc i {
  75. color: red;
  76. font-style: normal;
  77. }
  78. .pagination {
  79. display: flex;
  80. align-items: center;
  81. justify-content: space-around;
  82. margin-bottom: 12px;
  83. }


  1. * {
  2. margin: 0;
  3. padding: 0;
  4. box-sizing: border-box;
  5. }
  6. body {
  7. width: 100vw;
  8. height: 100vh;
  9. display: flex;
  10. align-items: center;
  11. justify-content: center;
  12. position: relative;
  13. overflow: hidden;
  14. }
  15. .container {
  16. z-index: 1;
  17. height: 60px;
  18. background-color: rgba(255, 255, 255, .7);
  19. padding: 0 8px;
  20. border-radius: 30px;
  21. backdrop-filter: blur(4px);
  22. box-shadow: 0 0 5px 1px gray;
  23. display: flex;
  24. align-items: center;
  25. justify-content: space-around;
  26. }
  27. .time-box {
  28. z-index: 1;
  29. position: absolute;
  30. background-color: transparent;
  31. height: 40px;
  32. top: 40%;
  33. line-height: 40px;
  34. font-size: 40px;
  35. text-align: center;
  36. color: #fff;
  37. text-shadow: 0 0 4px #000;
  38. }
  39. .search-box {
  40. width: 200px;
  41. transition: all .3s ease-in-out;
  42. }
  43. .container:hover .search-box,
  44. .container:focus-within .search-box {
  45. width: 440px;
  46. }
  47. .container .item {
  48. margin: auto 20px;
  49. font-size: 20px;
  50. opacity: 0;
  51. transition-delay: .3s;
  52. transition: all .3s ease;
  53. }
  54. .container:focus-within .item {
  55. opacity: 1;
  56. }
  57. .container .search-submit {
  58. display: inline-block;
  59. height: 40px;
  60. width: 40px;
  61. text-align: center;
  62. line-height: 40px;
  63. border-radius: 50%;
  64. cursor: pointer;
  65. }
  66. .container .search-submit:hover {
  67. background-color: rgba(255, 255, 255, .6);
  68. }
  69. .container .search-btn {
  70. width: 100%;
  71. border: none;
  72. outline: none;
  73. text-align: center;
  74. background: inherit;
  75. font-size: 20px;
  76. transition: all .5s ease-in-out;
  77. }
  78. .container .search-btn::placeholder {
  79. color: rgba(230, 230, 230, .9);
  80. text-shadow: 0 0 4px #000;
  81. transition: all .2s ease-in-out;
  82. }
  83. .container:hover .search-btn::placeholder,
  84. .container:focus-within .search-btn::placeholder {
  85. color: rgba(119, 119, 119, .9);
  86. text-shadow: 0 0 4px #f3f3f3;
  87. }
  88. .background {
  89. position: absolute;
  90. top: 0;
  91. right: 0;
  92. bottom: 0;
  93. left: 0;
  94. background-image: url(./bg.jpg);
  95. background-repeat: no-repeat;
  96. background-size: cover;
  97. background-position: center;
  98. object-fit: cover;
  99. transition: all .2s ease-in-out;
  100. }
  101. .container:focus-within ~ .background {
  102. filter: blur(20px);
  103. transform: scale(1.2);
  104. }
  105. .poem {
  106. z-index: 1;
  107. position: absolute;
  108. top: 70%;
  109. color: #ddd;
  110. text-shadow: 0 0 2px #000;
  111. opacity: 0;
  112. transition: all .2s ease-in-out;
  113. padding: 12px 32px;
  114. border-radius: 8px;
  115. line-height: 2;
  116. }
  117. .poem .author {
  118. opacity: 0;
  119. text-align: center;
  120. transition: all .2s ease-in-out;
  121. }
  122. .container:focus-within ~ .poem {
  123. opacity: 1;
  124. }
  125. .container:focus-within ~ .poem:hover {
  126. background-color: rgba(255, 255, 255, .3);
  127. opacity: 1;
  128. }
  129. .container:focus-within ~ .poem:hover .author {
  130. opacity: 1;
  131. }

实现 Document

  1. @Data
  2. public class Document {
  3. private Integer docId;
  4. private String title;
  5. private String url;
  6. private String content;
  7. private String desc;
  8. @Override
  9. public String toString() {
  10. return String.format("Document{docId=%d, title=%s, url=%s}", docId, title, url);
  11. }
  12. }

实现 DescBuilder类

  1. @Slf4j
  2. @Component
  3. public class DescBuilder {
  4. public Document build(List<String> queryList, Document doc) {
  5. // 找到 content 中包含关键字的位置
  6. // query = "list"
  7. // content = "..... hello list go come do ...."
  8. // desc = "hello <i>list</i> go com..."
  9. String content = doc.getContent().toLowerCase();
  10. String word = "";
  11. int i = -1;
  12. for (String query : queryList) {
  13. i = content.indexOf(query);
  14. if (i != -1) {
  15. word = query;
  16. break;
  17. }
  18. }
  19. if (i == -1) {
  20. // 这里中情况如果出现了,说明咱的倒排索引建立的有问题
  21. log.error("docId = {} 中不包含 {}", doc.getDocId(), queryList);
  22. throw new RuntimeException();
  23. }
  24. // 前面截 120 个字,后边截 120 个字
  25. int from = i - 120;
  26. if (from < 0) {
  27. // 说明前面不够 120 个字了
  28. from = 0;
  29. }
  30. int to = i + 120;
  31. if (to > content.length()) {
  32. // 说明后面不够 120 个字了
  33. to = content.length();
  34. }
  35. String desc = content.substring(from, to);
  36. desc = desc.replace(word, "<i>" + word + "</i>");
  37. doc.setDesc(desc);
  38. return doc;
  39. }
  40. }

五. 项目展示






