当前位置:   article > 正文

化繁为简系列之一:基于百度ERNIE和PyCorrector的文档改错工具_pycorrector类似的

pycorrector类似的

PaddlePaddle-DocCRT: 可视化文档纠错工具

本项目推出一个可视化的文档纠错工具,该工具可以实现简单的文档编辑和查错纠错功能。该项目github链接为https://github.com/fiyen/PaddlePaddle-DocCRT 欢迎多多fork。

注:此项目文档编辑部分参考了项目Doc,文档纠错部分使用了超过fork数超过2k的PyCorrector

使用教程

下载安装

通过git命令下载该项目,并解压。

!git clone https://github.com/fiyen/PaddlePaddle-DocCRT.git
  • 1

运行

由于该项目需要调用PySide2实现界面操作,无法在线运行,感兴趣的话可以下载下来运行。

#使用以下命令运行
!cd PaddlePaddle-DocCRT
!python main.py
  • 1
  • 2
  • 3

运行成功后,将进入以下界面:

可以直接点击/双击空白处进行文档编辑,效果如下:

也可以直接复制粘贴(ctrl+v)相关内容。在编辑结束后,点击左上角功能栏“批”按键进行文本自动修改,第一次点击可能时间较长。

批改结束后,软件判断错误的地方会被标红:

在标红的地方鼠标右击,会弹出功能窗口,除了“忽略此错误”和“撤销此更改”外,剩余部分为待选更正项,点击即可进行更正。

更正完成后,点击右上角功能栏的“定”按钮,即可接受已经进行的更改,将被标错误的文字恢复正常格式。

处理纠错功能之外,工具还具备常见的一些文字编辑功能,如设置字体,大小,斜体,粗体,字体颜色以及背景颜色等。

总结和展望

本项目是一个简单的工具实例demo,具体功能欢迎fork项目进行了解。以后将增加的内容包括:

  1. 增加txt文档导入,导出
  2. 增加word文档导入,导出
  3. 增加批改模型选择(目前固定为ErnieModel)

欢迎感兴趣的开发者更改和完善并提交pr,谢谢谢谢!

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/weixin_40725706/article/detail/346810
推荐阅读
相关标签
  

闽ICP备14008679号