搜索
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
搜索
你好赵伟
这个屌丝很懒,什么也没留下!
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1
【安全】查杀linux上c3pool挖矿病毒xmrig
2
2023 最新 IntelliJ IDEA 2023.3 详细配置步骤演示(图文版)<中文版>_二、idea2023版实验内容 1、spring的配置 2、安装idea 3、编译spring源程序
3
AI与金融行业:如何提高金融服务的效率与准确性
4
嵌入式C语言经典笔试题_嵌入式笔试题 c语言
5
Fiddler 无法抓包手机 https 报文的解决方案来啦!!_抓不到报文
6
web漏洞——文件上传漏洞(upload-labs)
7
PackageNotFoundError: No package metadata was found for bitsandbytes解决方案
8
STM32F103 矩阵键盘4*4 16*16等任意矩阵 按键扫描程序_stm32如何用4个io扫描16个按键
9
OCR开源库(文本区域定位和文本识别):github
10
elasticSearch之java客户端开发,demo演示_elasticsearch java demo
当前位置:
article
> 正文
《机器翻译》阅读笔记-----第一章 绪论_基于规则的机器翻译的缺点是什么
作者:你好赵伟 | 2024-04-21 08:18:20
赞
踩
基于规则的机器翻译的缺点是什么
机器翻译的研究和任务处理过程不仅涉及自然语言处理的诸多经典任务,包括数据挖掘、数据清洗、分词、词性标注、句法分析、语义分析等,而且还涉及解码算法、优化算法、建模及训练过程中各种机器学习算法的应用等。
有三项重要的工作极大的推动了统计机器翻译的发展:对数-线性模型、参数最小错误训练方法、BLEU评测指标(2002)。
自动评测指标BLEU的提出不仅避免了人工评价成本昂贵的弊端,而且可以直接成为模型优化的目标,极大地提高了统计翻译系统模型训练、迭代、更新的效率。
统计机器翻译方法的特点是几乎完全依赖对大规模双语语料库的自动学习、自动构造机器翻译系统。
Moses系统,常作为学术论文中的基线系统。
2014年前后,深度学习方法称为机器翻译领域继统计机器翻译之后的第二次技术突破。
机器翻译方法主要分为基于规则的机器翻译方法和基于语料的机器翻译方法。
基于语料的机器翻译方法又可以细分为基于实例的机器翻译方法、统计机器翻译方法和神经机器翻译方法。
基于规则的机器翻译方法的一般过程可以分为分析、转换和生成三个阶段就。
基于规则的机器翻译方法的缺点是规则描述颗粒度大,导致句子的翻译结果内容比较僵化、生硬和质量较低。
基于实例的机器翻译方法无需对句子进行复杂的语言分析,可直接利用已有的翻译实例库。缺点是没有提出一个全句的最优化方法或优化数学模型去指导选择实例和找到最优译文。其次,该方法采用句子级的实例匹配,粒度较粗,无法很好的利用短语和上下文信息进行精细匹配,从而不能充分利用翻译实例库扩大实例匹配的句子覆盖范围。
统计机器翻译方法的优点是引入了数学模型,可以对翻译目标进行优化,指导翻译过程中的操作向着有利于产生最优译文的方向进行。
基于语料库的方法利用数据驱动,易于维护和扩展。但是,如果双语语料库资源少或很难获得,则基于语料库的方法会变得无效,而基于规则的方法要好很多。
数据和算法技术是推动机器翻译发展的两个重要方面。
数据的发展目前也存在瓶颈。一方面数据规模增长到一定程度后带来的机器翻译质量收益会趋于平坦,原因是存在大量的同质、同构数据使得模型难以学习到更丰富的翻译知识。而另一方面,不同语言、不同领域的数据规模分布不均匀,使得机器翻译性能无法在所有翻译任务上取得均衡。
数据的均衡性和多样性发展对机器翻译来说仍然非常重要。
展望未来,机器翻译技术的研究可能会从以下几个方面展开:基于各种设备的机器翻译会更加普及;垂直领域的专用机器翻译系统将接近或将取得成功;无监督学习、强化学习、小样本学习等技术将克服数据瓶颈。
句子级的翻译应用包括查询检索输入的翻译和图片光学字符识别(OCR)结果的翻译。
目前,机器翻译系统的翻译对象主要是基于句子级别的。
在翻译篇章的句子时,通常会加入篇章级别的特征信息以提高翻译质量,或者对翻译结果进行编辑后处理以体现篇章信息。
计算机辅助翻译(computer aided translation, CAT)
语音翻译的前段和后端还需要自动语音识别系统和语音合成系统。
语言识别结果又两大特点:通常包含各种语气词、插入语、内容重复、连续修正以及未识别词等各种噪音;文本中没有标点符号,不会有标识特定句型(如陈述句和疑问句等)的符号出现。
去躁任务将语音识别结果中影响阅读理解的噪音去掉。
断句任务需要在语音识别结果中的合适位置插入合理的标点符号。
断句任务也是采用机器学习算法,通过训练、学习一个模型来处理。
声明:
本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:
https://www.wpsshop.cn/w/你好赵伟/article/detail/462009
推荐阅读
article
基于
stm32
的
I2C
总线
通讯简介及使用操作(附代码)
_
i2c
_
start
();...
1、
I2C
总线
简介
I2C
是两线式串行
总线
,用于连接微控制器及其外围设备。
I2C
总线
最主要
的
优点是其简单性和有效性。由于接...
赞
踩
article
SPI
接口
的
FPGA
实现(一)——
SPI
接口
的
相关
基础知识
_
fpga
spi
接口
...
本文主要介绍
SPI
接口
的
一些
基础知识
,后续文章会用DAC芯片81416
的
配置为例来具体说明
SPI
接口
的
具体
FPGA
实现。...
赞
踩
article
JSP
实验
-简单
页面
设计
_
jsp
页面
实验
目的
、
内容及
要求
...
实验
一 简单静态网页
设计
一
、
实验
目的:1.复习使用记事本编辑网页的方法。2.熟悉不同表单控件类型的应用。3.练习使用记事...
赞
踩
article
python
程序
控制
homeassistant
_通过
HomeAssistant
来WEB
控制
斐讯
DC1
...
1、首先安装
HomeAssistant
,我安装的是最新的
python
3.7+
HomeAssistant
,有代理的最好开...
赞
踩
article
Android
14
权限
_安卓
14
不兼容 获取
文件
权限
...
与此相对应的,Google 新增了 READ_MEDIA_IMAGES、READ_MEDIA_VIDEO 和 READ_...
赞
踩
article
ZYNQ
PS与PL共享
DDR
_
zynq
ps
pl
共享
ddr
内存...
平台: 开发板:
ZYNQ
-7000系列裸板开发开发环境:vivado hls、vivado、sdk参考htt
ps
://b...
赞
踩
article
android
盒子
安装
windows
,
Android
TV
x86
发布:吃灰老电脑秒变高清
盒子
...
新酷产品第一时间免费试玩,还有众多优质达人分享独到生活经验,快来新浪众测,体验各领域最前沿、最有趣、最好玩的产品吧~!下...
赞
踩
article
【
神经网络
常用损失函数】_
class
focalloss
(
nn
.
module
):...
神经网络
常用损失函数_
class
focalloss
(
nn
.
module
):
class
focalloss
(
nn
.mod...
赞
踩
article
在
fedora28
上
安装
gitlab
的添坑
之路
_
gitlab
invalidhash
...
0. 前言说来惭愧,一直想搭建CI环境,却因为各种原因迟迟没有动手。当然也不是什么都没做,比如很早就选了git做为代码服...
赞
踩
article
vscode
环境
中配置
git
_
vscode
配置
git
...
1. 建立project空目录用于存放electron基本
环境
这个
环境
中得文件不能加入
git
项目中否则每次更新文件太大g...
赞
踩
article
SwiftUI预览界面
Previews
如何修改@
Binding
变量的问题_
swiftui15
#p...
如何在
Previews
下修改@
Binding
的值_
swiftui15
#
preview
binging
swiftui1...
赞
踩
article
7.16
总结(维信
小
程序
开发)_
小
程序
数据
er
...
今天正式要做一个体育场地预约系统,用微信
小
程序
云开发,想用博客来做一个完整的项目进展记录,记录每天的成果与收获。可能这个...
赞
踩
article
CVE
-2017-12149
漏洞
复现
_
hunter
复现
漏洞
...
所有渗透都需获取授权,违者后果自行承担,与本号及作者无关,请谨记守法.申明:本公众号所分享内容仅用于网络安全技术讨论,切...
赞
踩
article
FPGA
时序
约束
理论篇之
IO
约束
_
iostandard
...
参考来源I/O
约束
I/O
约束
是必须要用的
约束
,又包括管脚
约束
和延迟
约束
。管脚
约束
管脚
约束
就是指管脚分配,我们要指定管脚的...
赞
踩
article
关于
JBoss
5.x/
6
.x 反
序列化
漏洞
(CVE-2017-12149)的
复现
_
cve
-2017...
一、
漏洞
介绍该
漏洞
为 Java反
序列化
错误类型,存在于 Jboss 的 HttpInvoker 组件中的 ReadOnl...
赞
踩
article
【
Linux
系统
编程
】文件IO_
linux
io
编程
...
【
Linux
系统
编程
】文件IO(超详细)_
linux
io
编程
linux
io
编程
...
赞
踩
article
记录 |
vscode
python
调试
launch
.
json
args
传参配置_
vscode
p...
记录 |
vscode
python
调试
launch
.
json
args
传参配置_
vscode
python
调试
laun...
赞
踩
article
构建免费专属的
LLM
大
语言
模型
聊天
机器人
-助你轻松工作_双击
gpt4all
-
installer
...
火遍全网的ChatGPT-4等大
语言
模型
已经成为了各种应用的核心,为大家的工作带来的极大的帮助。但是,访问这些强大的
模型
...
赞
踩
article
开源 Ruo-Yi 项目引入
Mybatis
-
Plus
:
3.5
.3
报错
ClassNotFoundE...
开源 Ruo-Yi 项目引入
Mybatis
-
Plus
:
3.5
.3
报错
ClassNotFoundException
:_...
赞
踩
article
Python人工智能之
flask
_
sqlalchemy
用法
_
flask
_
sqlalchemy
解析ho...
加粗样式*欢迎使用Markdown编辑器1、授课:林德尧(泉舟时代-未来城市技术总监)新的改变2、主要文章内容:导包pi...
赞
踩
相关标签
fpga
spi
串口通信
verilog
python程序控制homeassistant
android
权限
fpga开发
android盒子安装windows
计算机视觉
python
人工智能
深度学习
opencv
git
vscode
github
swiftui
ios
swift
小程序
web安全
智能路由器
安全