当前位置:   article > 正文

文档管理系统的核心技术与难点_文件管理技术有哪些

文件管理技术有哪些

概述

网上有非常多的“文档管理系统”,随便搜索就能得到超过1000种大大小小的软件或系统,谓之“铺天盖地”也不为过。其中绝大多数是近几年用各类开源的所谓组件、框架搭起来的七拼八凑的产物,其花哨无比的言辞与看似不错的截图,会造成很多用户茫然,掏钱购买后基本上都感觉交了智商税。那么到底什么样的系统才能称为“文档管理系统”呢?怎么选择比较安全呢?

先回答第二个问题:世界上任何一个能用的软件至少需要5年的基本成长期。所以,选购的时候,5年以内的软件,就不要考虑了。后面是几个基本概念。

文档管理也是各类信息系统的核心功能,但目前多数信息系统普遍缺乏比较好的文档管理模块。
绝大多数的信息系统,号称提供文档管理功能,实际上也都是基于简单的技术或组件,无法提供全面的功能。
文档管理的核心功能简单地说起来就是:能搜;能看(预览);能管(权限);

一、能搜

文档搜索涉及两个方面的核心技术:
(1)文本提取技术:系统应该能稳定、可靠、准确地从各类文件中提取文本。文本类信息(比如程序代码),相对比较简单,主要难点是编码问题。其他Office,PDF文件的提取难点就比较多了。首先是版本问题,系统应该能处理各类版本,比如Office97,2003,2010...,也有编码问题;其次是可靠性问题,市面上的很多文档管理系统(或大系统中的文档管理模块)无法稳定地提取文本,经常“挂掉”;最后是文字识别问题,很多文字是以图片形式保存于PDF文件(或图片),系统应该能够自动识别其中的文字,并提取出来用于搜索。目前平均而言,旧文档能达到80%稍多的识别率,新文档能达到90%以上。没有系统可以做到100%。
(2)全文检索问题:目前大家都在用Lucene,不是超大(PB级别)的系统基本上可以接受。

二、能看(预览)


一般的文档管理系统,都是B/S结构的,在处理非文本文件,如Office、PDF文件和其他应用文件,比如CAD文件时,有两种方式可以被用户打开。一是在用户端都安装相应的软件,二是提供无需安装软件的预览功能。如果要在领导电脑上为其演示一个三维设计图,还事先需要在领导电脑上安装三维软件,这个很费事,也很难看。
正式的文档管理系统都提供文件(含各类设计文稿)的预览功能。

三、能管(权限)


重要的文档都不是随便看、下载、打印与复制的。这就是“权限”的意义。
权限的设置需要考虑人员、角色、小组、虚拟机构、组织结构及高层管理者、系统管理者等等诸多复杂的、变化多端、经常变更的现实因素。
权限系统的设计需求与理念,大多来自于用户的实际需要。
刚刚开发应用5年以内的文档管理系统,其权限系统一定是不完备的。

以上这些朴素的需求与技术,都在 多可文档管理系统 中得到完美的实现。
多可文档管理系统 常常被用户要求与 用友、泛微 等等大的系统连接,以代替其中不够完备的文档管理模块。
多可文档管理系统 100%国产,被中国证监会选中,管理着所有上市公司的主要信息。
多可文档管理系统 被全国所有卫星监测中心选中,管理卫星测控相关的重要文档。

0积分下载免费文档管理系统:

0积分下载文档管理系统icon-default.png?t=N7T8https://download.csdn.net/download/beijinghorn/88598392

不是是个系统就可以称为文档管理系统的。
 

本文内容由网友自发贡献,转载请注明出处:https://www.wpsshop.cn/w/小小林熬夜学编程/article/detail/285824
推荐阅读
相关标签
  

闽ICP备14008679号