当前位置:   article > 正文

apache项目概览_apache lucy 代码解析

apache lucy 代码解析
igtop 是一个 Apache Hadoop 生态系统的开发、打包和测试系统

Avro是一个数据序列化系统,设计用于支持大 批量数据交换的应用。

HttpComponents也就是以前的httpclient项目,可以用来提供高效的、最新的、功能丰富的支持 HTTP 协议的客户端/服务器编程工具包,并且它支持 HTTP 协议最新的版本和建议
Hama 是个计算框架,基于BSP (Bulk Synchronous Parallel大容量同步并行)计算技术,主要针对大规模科学的计算
Apache Giraph 是一个可伸缩的分布式迭代图处理系统
Apache Forrest是一个把来自各种不同的输入数据源转换成用一种或多种输出格式(比如HTML,PDF等)来统一显示的发布系统。
Flume 是一个分布式、可靠和高可用的服务,用于收集、聚合以及移动大量日志数据,使用一个简单灵活的架构,就流数据模型。这是一个可靠、容错的服务。
Apache 临床的文本分析和知识提取系统 (cTAKES) 是一个开源的自然语言处理系统,用于从临床电子病历自由文本中抽取信息。可处理临床笔记抽取出统一的医学语言系统(UMLS)——药物,疾病/障碍,标志/症状,解剖网站和程序等。
 Apache Crunch(孵化器项目)是基于Google的FlumeJava库编写的Java库,用于创建MapReduce流水线。与其他用来创建MapReduce作业的高层工具(如Apache Hive、Apache Pig和Cascading等)类似,Crunch提供了用于实现如连接数据、执行聚合和排序记录等常见任务的模式库。而与其他工具不同的是,Crunch并不强制所有输入遵循同一数据类型。相反,Crunch使用了一种定制的类型系统,非常灵活,能够直接处理复杂数据类型,如时间序列、HDF5文件、Apache HBase表和序列化对象(像protocol buffer或Avro记录)等
Apache Cordova是一套设备API,允许移动应用的开发者使用JavaScript来访问本地设备的功能,比如摄像头、加速计。它可以与UI框架(如jQuery Mobile或Dojo Mobile或Sencha Touch)等相结合使用,这些UI框架可以使用HTML、CSS和JavaScript开发智能手机应用。
Apache Continuum是一个企业级持续集成服务器。提供的特性包括:自动构建、发布管理、基于角色的权限管理、源码控制系统、与其它流行构建工具相集成。不管你是否需要集中构建,还是开发人员手动控制发布。Continuum都能够帮助你改进质量和维护一个协调的构建环境。
Apache Commons包含了很多开源的工具,用于解决平时编程经常会遇到的问题,减少重复劳动
Cocoon的目标是帮助分离内容格式、逻辑和对基于XML的网站管理功能。

Apache James 简称 James, 是 Java Apache Mail Enterprise Server的缩写。James 是100%基于Java的电子邮件服务器。它是一种独立的邮件服务器,并提供了一个完整的电子邮件解决方案,用来收、发电子邮件。

JMeter是一款纯Java编写的压力测试和性能测量工具。

Apache Kafka 看上去一个很不错的分布式消息通讯框架

Apache Lenya 是java的开源内容管理系统(CMS)。它基于一些标准的技术比如XML 与 XSLT。它其中的代码核心来自于另外一个开源项目Cocoon.

Lucene

Apache通用日志工具commons-logging和Log4j

Apache Lucy 是一个全文搜索引擎库,使用 C 语言编写,主要面向一些动态语言,目前提供 Perl 语言的绑定。相当于是 C 语言版的 Lucene

Apache MINA是一个网络应用程序框架,用来帮助用户简单地开发高性能和高可靠性的网络应用程序。它提供了一个通过Java NIO在不同的传输例如TCP/IP和UDP/IP上抽象的事件驱动的异步API。

MRUnit是由Couldera公司开发的专门针对Hadoop中 编写MapReduce单元测试的框架,基本原理是JUnit4和 EasyMock

OFBiz是一个非常著名的电子商务平台

OpenNLP 是一个机器学习工具包,用于处理自然语言文本。支持大多数常用的 NLP 任务,例如:标识化、句子切分、部分词性标注、名称抽取、组块、解析等。

PDFBox是Java实现的PDF文档协作类库,提供PDF文档的创建、处理以及文档内容提取功能,也包含了一些命令行实用工具。

Pig是一个基于Hadoop的大规模数据分析平台,它提供的SQL-LIKE语言叫Pig Latin,该语言的编译器会把类SQL的数据分析请求转换为一系列经过优化处理的MapReduce运算。Pig为复杂的海量数据并行计算提供了一个简单的操作和编程接口。

Portals:与门户(Portal)技术相关的几个项目集合

Apache Roller是一个功能丰富、多用户、博客群服务器,适合大小不一的博客站点。

Santuario:发展 XML 安全性方面的项目

SpamAssassin是Apache发布的计算机程序许可证2.0,用于垃圾邮件过滤,基于内容的匹配规则。现在由Apache基金会维护。

Apache Stanbol 是一个为语义内容管理设计的模块化的软件堆栈和可重用组件

Apache Tika 利用现有的解析类库,从不同格式的文档中(例如HTML, PDF, Doc),侦测和提取出元数据和结构化内容。

Tomcat: 一个运行 Java Servlet 与 JavaServer Pages(JSP)的容器。

Apache VCL 是一个自服务的系统,为最终用户提供专用计算环境的远程访问环境。典型的使用场景是数据中心,也可以是物理刀片服务器、传统机架服务器或者虚拟机。VCL 也可以提供独立机器的代理访问。
Apache UIMA 是UIMA定义的Apache开源实现。UIMA是一个用于分析非结构化内容(比如文本、视频和音频)的组件架构和软件框架实现。这个框架的目的是为非结构化分析提供一个通用的平台,从而提供能够减少重复开发的可重用分析组件。
UIMA 架构允许您轻松插入定制的分析组件,并将它们与其他组件合并。您的 UIMA 应用程序不需要知道分析组件共同合作生成结果的细节。集成和组织多个分析组件是 UIMA 框架的工作。
UIMA 应用程序可能分析纯文本并识别人员、位置和组织;它也可能识别关系,比如为谁工作或在什么地方工作。应用程序通常可以拆分成组件。例如 “语言识别” => “特定于语言的部分” => “句子范围检测” => “实体检测(人员/位置的名称等等)”。

而 VCL 的目的就是让用户通过 Web 界面来有限时间的使用这些计算资源。通过调度 API 可用于自动化管理服务器集群和 HPC 集群。

Xalan:XML 转换处理器

Xerces-J 是 Java 版的 Xerces。Xerces是由Apache组织所推动的一项XML文档解析开源项目,它目前有多种语言版本包括JAVA、C++、PERL、COM等。

    HTTP Server: 可以在UNIX,MS-Windows,Macintosh和Netware操作系统下运行的HTTP服务器的项目
    Ant: 基于 Java 语言的构建工具,类似于 C语言 的Make工具。
    AXIS2: Web服务(SOAP, WSDL)的处理器,基于AXIS1.X重新构建。
    APR:(也就是:Apache Portable Runtime)C语言实现的便携运行库的管理工具。
    Beehive:为了简单构建 J2EE 应用的对象模型。
    Cocoon:一个基于组件技术和 XML 和 Web 应用开发框架。
    DB:关于数据库管理系统的几个开源项目集合
    Derby:一个纯JAVA的数据库管理系统
    Directory:基于 JAVA 语言的目录服务器,支持 LDAP 等目录访问协议。
    Excalibur:Apache Avalon 项目的前身。
    Forrest:一个发布系统框架的项目。
    Geronimo:J2EE 服务器
    Gump:整合管理器
    Hadoop:并行运算编程工具和分布式文件系统。
    Harmony:一个兼容 JAVA 标准的 JAVA 语言的开源实现。
    HiveMind:一个服务(Services)与配置(configuration)的微内核
    iBATIS:一个基于 JAVA 语言的数据持久化框架
    Incubator:为了帮助那些希望获取Apache软件基金会支持的计划进入Apache软件基金会的审核项目
    Jackrabbit:内容仓库API标准(Content Repository for Java Technology API,即 JSR-170)的一个开源实现项目。
    Jakarta: 在ASF中,基于 Java 语言的一组开源子项目的集合,现在包含的子项目有:BCEL,BSF,Cactus,Commons,ECS,HttpComponents,JCS,JMeter,ORO,Regexp,Slide,Taglibs,Turbine,Velocity
    James:JAVA 语言实现的邮件新闻服务器
    Labs:为基金会成员提供最新变更的思维的计划
    Lenya:内容管理系统
    Logging: 一个开发可以在C++、Java、Perl、PHP、.NET 计算机语言下运行的通用日志工具项目集合。
    Lucene: 高性能的,基于 Java 语言的全文检索项目。
    Maven:项目集成构建工具
    MyFaces: 一个JavaServer Faces(JSF)的实现框架。
    mod_perl:为 Apache 服务器提供 Perl 语言整合的项目
    POI:提供API以供JAVA程式对Microsoft Office格式档案的读/写。
    Portals:与门户(Portal)技术相关的几个项目集合
    Santuario:发展 XML 安全性方面的项目
    Shale:在 Struts 之后,发展起来基于 JAVA 语言Web应用框架
    SpamAssassin:垃圾邮件过滤器
    Struts: 一个基于 J2EE 平台的 MVC 设计模式的Web应用框架
    Tapestry: 另一个 J2EE 平台的、能产生动态、高性能 Web 应用的框架。
    TCL:为 Apache 服务器提供 Tcl 语言整合的项目
    Tomcat: 一个运行 Java Servlet 与 JavaServer Pages(JSP)的容器。
    Web Services:与 Web Services 技术相关的项目集合
    Xalan:XML 转换处理器
    Xerces: 一组可以在Java,C++,Perl 计算机语言下使用的 XML 解析器项目。
    Apache XML:XML 解决方案
    XMLBeans:基于 JAVA 语言XML对象绑定工具
    XML Graphics:发展 XML 与图形进行转换的计划项目
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/空白诗007/article/detail/914982
推荐阅读
相关标签
  

闽ICP备14008679号