搜索
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
搜索
空白诗007
这个屌丝很懒,什么也没留下!
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1
在Spacy Ner中区分国家和城市_spacy 识别地名错误
2
声纹识别(语音识别)算法工程师必备技能_python 声纹识别
3
语义相似度(实践篇)_基于词频的篇章语义相似度 实验报告
4
区块链知识总结——智能合约_智能合约有什么的优点
5
AI视频生成工具Runway注册试用_runway无法注册
6
C++Primer第五版 习题答案 第七章 类(Classes)_c++ primary 第七章答案
7
InfiniLM实战:Git入门
8
编写ChatGPT指令(Prompt)的万能模板以及使用示例!_chatgpt prompt
9
基于transformers的自然语言处理(NLP)入门1.1-Transformers在NLP中的兴起_transformers nlp
10
京东百万级调度系统(Buffalo)架构解密
当前位置:
article
> 正文
apache项目概览_apache lucy 代码解析
作者:空白诗007 | 2024-08-01 16:50:23
赞
踩
apache lucy 代码解析
igtop 是一个 Apache Hadoop 生态系统的开发、打包和测试系统
Avro是一个数据序列化系统,设计用于支持大 批量数据交换的应用。
HttpComponents也就是以前的httpclient项目,可以用来提供高效的、最新的、功能丰富的支持 HTTP 协议的客户端/服务器编程工具包,并且它支持 HTTP 协议最新的版本和建议
Hama 是个计算框架,基于BSP (Bulk Synchronous Parallel大容量同步并行)计算技术,主要针对大规模科学的计算
Apache Giraph 是一个可伸缩的分布式迭代图处理系统
Apache Forrest是一个把来自各种不同的输入数据源转换成用一种或多种输出格式(比如HTML,PDF等)来统一显示的发布系统。
Flume 是一个分布式、可靠和高可用的服务,用于收集、聚合以及移动大量日志数据,使用一个简单灵活的架构,就流数据模型。这是一个可靠、容错的服务。
Apache 临床的文本分析和知识提取系统 (cTAKES) 是一个开源的自然语言处理系统,用于从临床电子病历自由文本中抽取信息。可处理临床笔记抽取出统一的医学语言系统(UMLS)——药物,疾病/障碍,标志/症状,解剖网站和程序等。
Apache Crunch(孵化器项目)是基于Google的FlumeJava库编写的Java库,用于创建MapReduce流水线。与其他用来创建MapReduce作业的高层工具(如Apache Hive、Apache Pig和Cascading等)类似,Crunch提供了用于实现如连接数据、执行聚合和排序记录等常见任务的模式库。而与其他工具不同的是,Crunch并不强制所有输入遵循同一数据类型。相反,Crunch使用了一种定制的类型系统,非常灵活,能够直接处理复杂数据类型,如时间序列、HDF5文件、Apache HBase表和序列化对象(像protocol buffer或Avro记录)等
Apache Cordova是一套设备API,允许移动应用的开发者使用JavaScript来访问本地设备的功能,比如摄像头、加速计。它可以与UI框架(如jQuery Mobile或Dojo Mobile或Sencha Touch)等相结合使用,这些UI框架可以使用HTML、CSS和JavaScript开发智能手机应用。
Apache Continuum是一个企业级持续集成服务器。提供的特性包括:自动构建、发布管理、基于角色的权限管理、源码控制系统、与其它流行构建工具相集成。不管你是否需要集中构建,还是开发人员手动控制发布。Continuum都能够帮助你改进质量和维护一个协调的构建环境。
Apache Commons包含了很多开源的工具,用于解决平时编程经常会遇到的问题,减少重复劳动
Cocoon的目标是帮助分离内容格式、逻辑和对基于XML的网站管理功能。
Apache James 简称 James, 是 Java Apache Mail Enterprise Server的缩写。James 是100%基于Java的电子邮件服务器。它是一种独立的邮件服务器,并提供了一个完整的电子邮件解决方案,用来收、发电子邮件。
JMeter是一款纯Java编写的压力测试和性能测量工具。
Apache Kafka 看上去一个很不错的分布式消息通讯框架
Apache Lenya 是java的开源内容管理系统(CMS)。它基于一些标准的技术比如XML 与 XSLT。它其中的代码核心来自于另外一个开源项目Cocoon.
Lucene
Apache通用日志工具commons-logging和Log4j
Apache Lucy 是一个全文搜索引擎库,使用 C 语言编写,主要面向一些动态语言,目前提供 Perl 语言的绑定。相当于是 C 语言版的 Lucene
Apache MINA是一个网络应用程序框架,用来帮助用户简单地开发高性能和高可靠性的网络应用程序。它提供了一个通过Java NIO在不同的传输例如TCP/IP和UDP/IP上抽象的事件驱动的异步API。
MRUnit是由Couldera公司开发的专门针对Hadoop中 编写MapReduce单元测试的框架,基本原理是JUnit4和 EasyMock
OFBiz是一个非常著名的电子商务平台
OpenNLP 是一个机器学习工具包,用于处理自然语言文本。支持大多数常用的 NLP 任务,例如:标识化、句子切分、部分词性标注、名称抽取、组块、解析等。
PDFBox是Java实现的PDF文档协作类库,提供PDF文档的创建、处理以及文档内容提取功能,也包含了一些命令行实用工具。
Pig是一个基于Hadoop的大规模数据分析平台,它提供的SQL-LIKE语言叫Pig Latin,该语言的编译器会把类SQL的数据分析请求转换为一系列经过优化处理的MapReduce运算。Pig为复杂的海量数据并行计算提供了一个简单的操作和编程接口。
Portals:与门户(Portal)技术相关的几个项目集合
Apache Roller是一个功能丰富、多用户、博客群服务器,适合大小不一的博客站点。
Santuario:发展 XML 安全性方面的项目
SpamAssassin是Apache发布的计算机程序许可证2.0,用于垃圾邮件过滤,基于内容的匹配规则。现在由Apache基金会维护。
Apache Stanbol 是一个为语义内容管理设计的模块化的软件堆栈和可重用组件
Apache Tika 利用现有的解析类库,从不同格式的文档中(例如HTML, PDF, Doc),侦测和提取出元数据和结构化内容。
Tomcat: 一个运行 Java Servlet 与 JavaServer Pages(JSP)的容器。
Apache VCL 是一个自服务的系统,为最终用户提供专用计算环境的远程访问环境。典型的使用场景是数据中心,也可以是物理刀片服务器、传统机架服务器或者虚拟机。VCL 也可以提供独立机器的代理访问。
Apache UIMA 是UIMA定义的Apache开源实现。UIMA是一个用于分析非结构化内容(比如文本、视频和音频)的组件架构和软件框架实现。这个框架的目的是为非结构化分析提供一个通用的平台,从而提供能够减少重复开发的可重用分析组件。
UIMA 架构允许您轻松插入定制的分析组件,并将它们与其他组件合并。您的 UIMA 应用程序不需要知道分析组件共同合作生成结果的细节。集成和组织多个分析组件是 UIMA 框架的工作。
UIMA 应用程序可能分析纯文本并识别人员、位置和组织;它也可能识别关系,比如为谁工作或在什么地方工作。应用程序通常可以拆分成组件。例如 “语言识别” => “特定于语言的部分” => “句子范围检测” => “实体检测(人员/位置的名称等等)”。
而 VCL 的目的就是让用户通过 Web 界面来有限时间的使用这些计算资源。通过调度 API 可用于自动化管理服务器集群和 HPC 集群。
Xalan:XML 转换处理器
Xerces-J 是 Java 版的 Xerces。Xerces是由Apache组织所推动的一项XML文档解析开源项目,它目前有多种语言版本包括JAVA、C++、PERL、COM等。
HTTP Server: 可以在UNIX,MS-Windows,Macintosh和Netware操作系统下运行的HTTP服务器的项目
Ant: 基于 Java 语言的构建工具,类似于 C语言 的Make工具。
AXIS2: Web服务(SOAP, WSDL)的处理器,基于AXIS1.X重新构建。
APR:(也就是:Apache Portable Runtime)C语言实现的便携运行库的管理工具。
Beehive:为了简单构建 J2EE 应用的对象模型。
Cocoon:一个基于组件技术和 XML 和 Web 应用开发框架。
DB:关于数据库管理系统的几个开源项目集合
Derby:一个纯JAVA的数据库管理系统
Directory:基于 JAVA 语言的目录服务器,支持 LDAP 等目录访问协议。
Excalibur:Apache Avalon 项目的前身。
Forrest:一个发布系统框架的项目。
Geronimo:J2EE 服务器
Gump:整合管理器
Hadoop:并行运算编程工具和分布式文件系统。
Harmony:一个兼容 JAVA 标准的 JAVA 语言的开源实现。
HiveMind:一个服务(Services)与配置(configuration)的微内核
iBATIS:一个基于 JAVA 语言的数据持久化框架
Incubator:为了帮助那些希望获取Apache软件基金会支持的计划进入Apache软件基金会的审核项目
Jackrabbit:内容仓库API标准(Content Repository for Java Technology API,即 JSR-170)的一个开源实现项目。
Jakarta: 在ASF中,基于 Java 语言的一组开源子项目的集合,现在包含的子项目有:BCEL,BSF,Cactus,Commons,ECS,HttpComponents,JCS,JMeter,ORO,Regexp,Slide,Taglibs,Turbine,Velocity
James:JAVA 语言实现的邮件新闻服务器
Labs:为基金会成员提供最新变更的思维的计划
Lenya:内容管理系统
Logging: 一个开发可以在C++、Java、Perl、PHP、.NET 计算机语言下运行的通用日志工具项目集合。
Lucene: 高性能的,基于 Java 语言的全文检索项目。
Maven:项目集成构建工具
MyFaces: 一个JavaServer Faces(JSF)的实现框架。
mod_perl:为 Apache 服务器提供 Perl 语言整合的项目
POI:提供API以供JAVA程式对Microsoft Office格式档案的读/写。
Portals:与门户(Portal)技术相关的几个项目集合
Santuario:发展 XML 安全性方面的项目
Shale:在 Struts 之后,发展起来基于 JAVA 语言Web应用框架
SpamAssassin:垃圾邮件过滤器
Struts: 一个基于 J2EE 平台的 MVC 设计模式的Web应用框架
Tapestry: 另一个 J2EE 平台的、能产生动态、高性能 Web 应用的框架。
TCL:为 Apache 服务器提供 Tcl 语言整合的项目
Tomcat: 一个运行 Java Servlet 与 JavaServer Pages(JSP)的容器。
Web Services:与 Web Services 技术相关的项目集合
Xalan:XML 转换处理器
Xerces: 一组可以在Java,C++,Perl 计算机语言下使用的 XML 解析器项目。
Apache XML:XML 解决方案
XMLBeans:基于 JAVA 语言XML对象绑定工具
XML Graphics:发展 XML 与图形进行转换的计划项目
声明:
本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:
https://www.wpsshop.cn/w/空白诗007/article/detail/914982
推荐阅读
article
BDCC -
数据
集成领域的主流中间件_
Apache
SeaTunnel
vs
Flink
CDC...
Apache
SeaTunnel
是一个非常易用的超高性能分布式
数据
集成产品,支持海量
数据
的离线及实时同步。SeaTun...
赞
踩
article
常见
数据
集成工具的对比:
Apache
SeaTunnel VS Flume VS
DataX
VS...
支持 MySQL、PostgreSQL、Oracle、SQLServer、S3、RedShift、支持 Copy、Fil...
赞
踩
article
Apache
Spark
分布式计算框架
架构
介绍...
Spark
基于
Spark
Core 建立了
Spark
SQL、
Spark
Streaming、MLlib、Grap...
赞
踩
article
Java
Apache
Commons
Collection3.2.1 理解
Transformer
...
接口开始分析Transforms the input object (leaving it unchanged) int...
赞
踩
article
Apache
Kylin
3
.x 的
Cube
构建
流程_kylin
3
.1.
3
使用
spark
构建
cu...
Cube
的
构建
方式通常有两种:**全量
构建
和增量
构建
**,两者的
构建
步骤是完全一样的,区别只在于
构建
时读取的数据源是全...
赞
踩
article
Apache
Kylin
(麒麟)入门介绍_
apache
kylin
cube
数据
存储
位置...
为什么需要
Kylin
? &n..._
apache
kylin
cube
数据
存储
位置
apache
kylin
cube
...
赞
踩
article
大
数据
分析
神兽麒麟(
Apache
Kylin
)_麒麟系统 大
数据
分析
设备 sdk识别
,
数字签名
,
权...
1.
Apache
Kylin
是什么?在现在的大
数据
时代,越来越多的企业开始使用Hadoop管理
数据
,但是现有的业务
分析
工...
赞
踩
article
Apache
Kylin
的快速
数据
立方体
算法——概述_
apache
kylin
数据
立方体
...
Apache
Kylin
(麒麟)是由eBay贡献给开源社区的大
数据
分析引擎,支持在超大
数据
集上进行秒级别的SQL及OLA...
赞
踩
article
Apache
APISIX
和
Envoy
性能大比拼_
envoy
与
openresty
...
Apache
APISIX
和
Envoy
性能大比拼本文作者为王院生,现深圳支流科技创始人,
Apache
APISIX
...
赞
踩
article
apache
httpclient
连接池
工具_
httpclient
发送
https
请求
以及SSLH...
本人在做接口自动化的过程中,遇到了
请求
第三方
https
协议
请求
,在经过了短暂的知识重新学习之后,写完代码执行起来总是遇到...
赞
踩
article
Apache
Doris
的架构讲解_
doris
observer
...
用来扩展查询节点,同时起到元数据备份的作用。如果在发现集群压力非常大的情况下,需要去扩展整个查询的能力,那么可以加obs...
赞
踩
article
「
硬刚
Doris
系列」
Apache
Doris
架构
原理
及核心
特性
解读...
「
硬刚
Doris
系列」
Apache
Doris
架构
原理
及核心
特性
解读_apache dorisapache doris...
赞
踩
article
Apache
Doris
整体
架构
、
FE
元
数据管理
及
数据组织
_
doris
be fe...
Doris
主要分为
FE
和BE两个组件,
FE
主要负责查询的编译,分发和元
数据管理
(基于内存,类似HDFS NN);BE主要...
赞
踩
article
【
数据库
】
Apache
Doris
: 一个开源
MPP
数据库
的架构与实践_
doris
mpp...
1、对数据分析、统计数据分析大体上可以分为两大类场景:一种偏向于报表类的,另一种偏向于多维分析的。2、报表报表类数据分析...
赞
踩
article
Apache
JMeter
进行
TCP
并发
压力
测试
初尝试_
tcp
压力
测试
...
由于互联网编程实验二第三题要求比较使用线程池与否的服务器的并发性能,遂检索信息并了解到
Apache
JMeter
这个工具...
赞
踩
article
Apache
Kafka
入门教程...
Apache
Kafka
是由
Apache
软件基金会开发的一个开源流处理平台,用于处理实时的大规模数据流。
Kafka
...
赞
踩
article
海思移植
APR
(
Apache
Portable Runtime)_
checking
for apa...
0.前言
Apache
可移植运行时(
Apache
Portable Runtime,简称
APR
)是
Apache
HTTP服务...
赞
踩
article
java
.
lang
.
NoClassDefFoundError
:
Failed
resolution
...
android开发中,在安卓版本9.0版本以上,出现
java
.
lang
.
NoClassDefFoundError
: F...
赞
踩
article
Android 项目
java
.
lang
.NoClassDefFoundError: Failed ...
在Manifest下的application标签 下加入:
[详细]
-->
赞
踩
article
java
.
lang
.NoClassDefFoundError:
failed
resolution
o...
原因是Android P Developer Preview(9.0)的bug解决方法:在AndroidManifest...
赞
踩
相关标签
中间件
flink
seatunnel
hbase
大数据
hadoop
Apache Spark
Spark 架构
Spark Streaming
Spark 运行时架构
Spark 组件角色
Spark 生态
Spark 特点
java
apache
transformer
kylin
云计算/大数据
lua
网关
后端
apache httpclient 连接池 工具
apache http自动跳转https
httpclient jar包