搜索
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
搜索
在线问答5
这个屌丝很懒,什么也没留下!
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1
毕业三年 /****************************转载**************HUST机械学长****************************/_插美女同事v酒店
2
MS1112驱动开发(iio框架)
3
最新9个日常实用的AI工具,不管是日常生活还是工作中都能用到!,2024年最新python开发界面程序_ai工具csdn
4
椭圆曲线密码学(ECC)基本介绍和总结_ecc椭圆曲线密码
5
Visual Studio 2017 + opencv4.6 + contribute + Cmake(Aruco配置版本)指南_opencv +vs2017
6
【Spark精讲】记一个SparkSQL引擎层面的优化:SortMergeJoinExec_spark sort merge join
7
ModuleNotFoundError: No module named ‘Image‘_modulenotfounderror: no module named 'image
8
logback kafka输出日志到ELK_logback怎么打印日志 elk好分词
9
RK3568行业定制主板脉冲群抗扰度整改方案验证_群脉冲整改方法
10
Linux Centos 7 安装 Zookeeper
当前位置:
article
> 正文
HA3搜索引擎梳理与分析_indexlib
作者:在线问答5 | 2024-06-26 01:52:32
赞
踩
indexlib
HA3搜索引擎梳理与分析
一、HA3技术体系梳理
HA3搜索引擎技术体系图
1.1 内核
网络访问存储:通过网络访问盘古系统(集中式存储)实现存储与计算分离,支持独立扩展,降低运维成本,提高稳定性
热数据cache:支持使用mmap(lock/非lock方式)、blockcache对数据进行加载,实现对热数据的memcache
自适应bitmap:支持根据检索热度自动将部分token转换为bitmap倒排
分层存储:对于超内存数据量、高性能检索、有持久化需求场景,通过将数据根据热度分层,进行不同程度的压缩并存放在不同存储介质的方式,平衡检索性能、存储成本等需求
短链优化:将链长较短的倒排链自动转换为kv存储,提高检索性能
检索性能优化:在主键检索时,用hashtable替换二分查找,以可以接受的空间成本换取时间;range索引在建库的时候,把每一个整数按位拆分成多个倒排的term然后建立倒排索引, 每个range索引目录下,包括两个子目录,分别是低4位和高60位的term建立的倒排索引, 查询的时候会合并二者的结果。
数据压缩:针对数据重复等场景进行优化,减少冗余存储
数据分片:通过数据分片的设计,提高离线/实时数据任务的并行度,从而提高数据实时性
持久化:优化数据从内存dump至磁盘的过程中存在的性能问题
动态索引配置:支持动态新增正排、倒排字段,降低运维成本
红色字体为业务需要但artis体系不具备的能力。
1.2 组件
检索过滤:支持交、并、过滤等检索语义
全量/增量更新:支持全量/增量数据的离线全局计算
doc截断/回收:在全量/增量任务中,可以根据一定规则,将无效的doc丢弃,也可以根据定制的排序结果,将部分doc截断
doc聚合:根据doc中包含的token
声明:
本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:
https://www.wpsshop.cn/w/在线问答5/article/detail/758033
推荐阅读
article
从
二叉树
到
完全
二叉树
_
二叉树
变满
二叉树
...
之所以会出现
完全
二叉树
的概念,是因为可由此在物理上,以线性表的方式实现逻辑上的
完全
二叉树
。1.
完全
二叉树
对于一棵高度为...
赞
踩
article
在Lang
Chain
中,
LLM
(
大型
语言
模型
)和
LLM
Chain
的区别是什么?...
在Lang
Chain
中,
LLM
(
大型
语言
模型
)和
LLM
Chain
的区别是什么在Lang
Chain
中,
LLM
(
大型
语言
模...
赞
踩
article
【
Mariadb
高
可用
MHA
】_
dbmha
...
MHA
(MasterHigh Availability)是一套优秀的MySQL高
可用
环境下故障切换和主从复制的软件。MH...
赞
踩
article
大
数据
机器
学习
(一)概述_
大
数据
机器
学习
袁春
...
2020.09.17 星期三课程笔记1.
学习
资源(1)在线课程①清华学堂在线-
袁春
老师的《
大
数据
机器
学习
》②李宏毅的
机器
...
赞
踩
article
深入探索
多头
注意
力
机制
:深度
学习
的
关键创新_
多头
注意
机制
...
它首次在2017年
的
论文《Attention is All You Need》中被提出,此论文同时引入了Transfor...
赞
踩
article
Docker搭建
kafka
_
kafka
docker
...
docker
简易搭建
kafka
在我们大量使用分布式数据库、分布式计算集群的时候,是否会遇到这样的一些问题:想分析一下用户...
赞
踩
article
微信
小
程序
获取
openid
的两种方法_微信
小
程序
获取
openid
sdk
...
两种方法
获取
小
程序
用户
openid
,一种使用云开发,一种使用自己的后台。文章目录第一种:使用云开发第二种:不使用云开发第...
赞
踩
article
uni
-
app
中
的
数据
缓存
_
uni
app
uni
.
setstoragesync
...
uni
-
app
中
的
数据
缓存
_
uni
app
uni
.
setstoragesync
uni
app
uni
.setstorag...
赞
踩
article
AI
作画
升级,
OpenVINO
™ 和
英特尔
独立
显卡
助你快速生成视频_
openvino
支持哪些
显卡
...
今天,我们对这一应用场景再次升级,除了能够
作画
,利用
OpenVINO
对Stable Diffusion v2模型的支持...
赞
踩
article
漏洞
扫描
工具
AWVS
介绍及
安装
教程(非常详细)从零基础
入门
到精通
,
看完这一篇就够了
_
awvs2024
...
Acunetix Web Vulnerability Scanner(简称
AWVS
)是一款知名的Web网络
漏洞
扫描
工具
,
...
赞
踩
article
AI
绘画
神级
Stable
Diffusion
入门教程|快速入门SD
绘画
原理与安装_
ai
绘画
sd入门...
什么是
Stable
Diffusion
,什么是炼丹师?根据市场研究机构预测,到2025年全球
AI
绘画
市场规模将达到100...
赞
踩
article
2023年全国
职业院校
技能大赛
(
高职组
)
“
云
计算
应用”赛项赛卷6
(
容器
云
)
_金砖
云
计算
赛题
...
2023年全国
职业院校
技能大赛
(
高职组
)
“
云
计算
应用”赛项赛卷6
(
容器
云
)
_金砖
云
计算
赛题
金砖
云
计算
赛题
...
赞
踩
article
react
native
- 收藏集 -
掘金
...
浅谈 RxJava 中的线程管理 - Android -
掘金
上一篇文章研究了一下RxJava中的多线程并发问题,并且在...
赞
踩
article
【
Git
系列】
linux
每次
git
clone
都要
输入
密码
_
git
clone
需要
输入
密码
...
使用方法 2 比较常用方法 1
需要
加上用户名和
密码
,相对麻烦一些
git
clone
需要
输入
密码
...
赞
踩
article
Git
使用:在
Git
pull
时遇到的
Error
及解决方法_
git
pull
error
...
1.
Error
: fatal: The remote end hung up unexpectedly
error
: ...
赞
踩
article
【宠粉赠书】
科技
图表
绘制
:R
语言
数据
可视化
...
为了回馈粉丝们的厚爱,今天小智给大家送上一套科研绘图的必备书籍——《R
语言
数据
可视化
:
科技
图表
绘制
》。下面我会详细给大家...
赞
踩
article
Android
中 使用
WebSocket
实现消息通信,【金九银十_
android
websock...
前端字节跳动真题解析开源分享:【大厂前端面试题解析+核心总结学习笔记+真实项目实战+最新讲解视频】花板技术停滞不前!**...
赞
踩
article
2024年
华为
OD机试真题-
分
披萨
-
Python
-OD统一考试(C卷)_
分
披萨
od
题目
...
接下来的第2行到第N+1行(共N行),每行为一个正整数,表示第i块
披萨
的大小。“吃货”和“馋嘴”两人到
披萨
店点了一份铁盘...
赞
踩
article
MySQL
面试题
大全
,
MySQL
必刷
的
那些
面试题
(2024版)
_
mysql
的
面试题
...
自我介绍一下
,
小编13年上海交大毕业
,
曾经在小公司待过
,
也去过华为、OPPO等大厂
,
18年进入阿里一直到现在。深知大多数...
赞
踩
article
git
clone
后弹出
openssl
输
账号密码
_
git
clone
弹出
openssh
...
显示有了 credential.helper=manager。1、在Windows凭据中加入
git
lab信息。4、再次c...
赞
踩
相关标签
python
AI编程
LLM
langchain
LLM Chain
mariadb
数据库
运维
linux
机器学习
深度学习
人工智能
kafka
docker
java
小程序
云开发
openid
服务器
login
英特尔显卡
计算机视觉
网络
安全