搜索
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
搜索
你好赵伟
这个屌丝很懒,什么也没留下!
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1
OpenCV数字图像处理详细教程_opencv 图像处理
2
keil编写正弦函数_【STM32F407的DSP教程】第18章 DSP控制函数-更好用的SIN,COS计算...
3
.NET开源的在Windows上统计软件使用时长和网站浏览时长工具 - Tai
4
金三银四必备软件测试刷题神器,刷完还怕面试不过吗?_软件测试刷题工具
5
如何搭建高效安全的eBay测评环境:步骤与要点解析
6
Spring Boot 自动化单元测试类的编写过程_springboot写测试类
7
linux查看MQ日志路径,Rabbitmq之修改日志和数据存放路径
8
Git分支_error: cannot delete branch 'hotfix_week_lyj' chec
9
5.2 Go语言项目实战:初识Walk GUI_walk ui
10
git多人协助开发常见的问题和解决方法:_git多人合作开发合并问题
当前位置:
article
> 正文
《机器翻译》阅读笔记-----第一章 绪论_基于规则的机器翻译的缺点是什么
作者:你好赵伟 | 2024-04-21 08:18:20
赞
踩
基于规则的机器翻译的缺点是什么
机器翻译的研究和任务处理过程不仅涉及自然语言处理的诸多经典任务,包括数据挖掘、数据清洗、分词、词性标注、句法分析、语义分析等,而且还涉及解码算法、优化算法、建模及训练过程中各种机器学习算法的应用等。
有三项重要的工作极大的推动了统计机器翻译的发展:对数-线性模型、参数最小错误训练方法、BLEU评测指标(2002)。
自动评测指标BLEU的提出不仅避免了人工评价成本昂贵的弊端,而且可以直接成为模型优化的目标,极大地提高了统计翻译系统模型训练、迭代、更新的效率。
统计机器翻译方法的特点是几乎完全依赖对大规模双语语料库的自动学习、自动构造机器翻译系统。
Moses系统,常作为学术论文中的基线系统。
2014年前后,深度学习方法称为机器翻译领域继统计机器翻译之后的第二次技术突破。
机器翻译方法主要分为基于规则的机器翻译方法和基于语料的机器翻译方法。
基于语料的机器翻译方法又可以细分为基于实例的机器翻译方法、统计机器翻译方法和神经机器翻译方法。
基于规则的机器翻译方法的一般过程可以分为分析、转换和生成三个阶段就。
基于规则的机器翻译方法的缺点是规则描述颗粒度大,导致句子的翻译结果内容比较僵化、生硬和质量较低。
基于实例的机器翻译方法无需对句子进行复杂的语言分析,可直接利用已有的翻译实例库。缺点是没有提出一个全句的最优化方法或优化数学模型去指导选择实例和找到最优译文。其次,该方法采用句子级的实例匹配,粒度较粗,无法很好的利用短语和上下文信息进行精细匹配,从而不能充分利用翻译实例库扩大实例匹配的句子覆盖范围。
统计机器翻译方法的优点是引入了数学模型,可以对翻译目标进行优化,指导翻译过程中的操作向着有利于产生最优译文的方向进行。
基于语料库的方法利用数据驱动,易于维护和扩展。但是,如果双语语料库资源少或很难获得,则基于语料库的方法会变得无效,而基于规则的方法要好很多。
数据和算法技术是推动机器翻译发展的两个重要方面。
数据的发展目前也存在瓶颈。一方面数据规模增长到一定程度后带来的机器翻译质量收益会趋于平坦,原因是存在大量的同质、同构数据使得模型难以学习到更丰富的翻译知识。而另一方面,不同语言、不同领域的数据规模分布不均匀,使得机器翻译性能无法在所有翻译任务上取得均衡。
数据的均衡性和多样性发展对机器翻译来说仍然非常重要。
展望未来,机器翻译技术的研究可能会从以下几个方面展开:基于各种设备的机器翻译会更加普及;垂直领域的专用机器翻译系统将接近或将取得成功;无监督学习、强化学习、小样本学习等技术将克服数据瓶颈。
句子级的翻译应用包括查询检索输入的翻译和图片光学字符识别(OCR)结果的翻译。
目前,机器翻译系统的翻译对象主要是基于句子级别的。
在翻译篇章的句子时,通常会加入篇章级别的特征信息以提高翻译质量,或者对翻译结果进行编辑后处理以体现篇章信息。
计算机辅助翻译(computer aided translation, CAT)
语音翻译的前段和后端还需要自动语音识别系统和语音合成系统。
语言识别结果又两大特点:通常包含各种语气词、插入语、内容重复、连续修正以及未识别词等各种噪音;文本中没有标点符号,不会有标识特定句型(如陈述句和疑问句等)的符号出现。
去躁任务将语音识别结果中影响阅读理解的噪音去掉。
断句任务需要在语音识别结果中的合适位置插入合理的标点符号。
断句任务也是采用机器学习算法,通过训练、学习一个模型来处理。
声明:
本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:
https://www.wpsshop.cn/w/你好赵伟/article/detail/462009
推荐阅读
article
工具
变量
与两
阶段
最小
二乘
stata
_两
阶段
最小
二乘
法
stata
命令...
以数据集grilic.dta为例,继续探讨教育投资回报率。此数据集的主要
变量
包括:lnw(工资对数),s(教育年限),e...
赞
踩
article
VerilogHDL
实现
通用串行
异步
收发器
8251
_
8251
控制端口...
通用串行
异步
收发器
8251
是一种典型的串口通信接口芯片,它能够
实现
RS-232、RS-422等多种电平规范的
异步
串行通信...
赞
踩
article
stable
diffusion
本地部署教程...
本教程指导您如何在本地部署Stable Diffusion,以便您可以在自己的计算机上运行该模型。通过优化性能和解决常见...
赞
踩
article
GitHub
上
14
个屌炸天的
Java
进阶教程、
面试
真题项目,建议收藏_
java
github
学习
...
对于
面试
,一定要有良好的心态,这位小伙伴
面试
美团的时候没有被前面阿里的
面试
影响到,发挥也很正常,也就能顺利拿下美团的of...
赞
踩
article
【重磅开源】一款可以
生成
SpringBoot
+
Vue
代码
的
轻量级
项目
...
基于
SpringBoot
+
Vue
3开发
的
轻量级
快速开发脚手架。包括前端、后端,适合有一定编码经验
的
,想学习整个
项目
搭建
的
...
赞
踩
article
isaac
gym
(
legged
_
gym
)
学习
(二)——
设置
环境
地形
...
如何
设置
isaac
gym
中的环境
地形
,来实现特殊任务需要的训练!!!!文件中我们可以不用管这个。mesh
_
type = ...
赞
踩
article
MacOS
配置
JDK和
Maven
_mac系统
java
和
maven
合并
配置
path
...
MacOS
配置
JDK和
Maven
。_mac系统
java
和
maven
合并
配置
path
mac系统
java
和
maven
合并配...
赞
踩
article
mac
远程
ftp
服务器
文件共享,
mac
远程
连接
ftp
服务器
配置...
mac
远程
连接
ftp
服务器
配置 内容精选换一换使用Mac版Microsoft Remote Desktop工具,
远程
连接...
赞
踩
article
Gitea
—私有
git
服务器
搭建教程_
git
ea
ssh
...
原文章大佬什么是
Gitea
2. 下载
git
ea通过
git
将项目下载到目录下3. 构建运行下载完成后用Goland打开,在...
赞
踩
article
执行
get
请求,报错Required
request
body
is
m
is
sing
_httpreq...
去掉controller方法中的@
request
body
注解即可。_http
request
.
get
required
r...
赞
踩
article
全网最强,
Python
+
Appium
+
pytest
自动化
测试
,多设备并发+多线程(实战详细)_多线程...
Appium
+python 实现单设备的 app
自动化
测试
启动 appium server,占用端口 4723;电脑与...
赞
踩
article
Linux——
ssh
服务
_
linux
ssh
...
ssh
是一个远程登录相关的协议,主要的用途是登陆到远程电脑中执行命令。叫安全外壳协议(ecureell),是一种加密的网...
赞
踩
article
STM
-32:
I2C
外设总线—
硬件
I2C
读写
MPU6050
_
硬件
i2c读取
mpu6050
...
STM
-32:
I2C
外设总线—
硬件
I2C
读写
MPU6050
_
硬件
i2c读取
mpu6050
硬件
i2c读取
mpu6050
...
赞
踩
article
5G
时代
的
云
计算
变
了_
云
计算
依赖5g么...
最近工作比较忙,到了周末,技术文章继续。最近研究了一下
5G
与边缘
云
计算
的
关系,有一些感触,分享出来。相信做对
5G
网络、
云
...
赞
踩
article
docker
环境下
安装
Hbase+
Phoenix
_
docker
安装
phoenix
...
docker
环境下
安装
Hbase+
Phoenix
_
docker
安装
phoenix
docker
安装
phoenix
...
赞
踩
article
Vulhub
Flask
SSTI
漏洞
复现
_端口8000的
漏洞
复现
...
文章目录环境搭建
漏洞
复现
python3python2CTFSHOWWEB361WEB362WEB363环境搭建首先利用d...
赞
踩
article
DeepFaceLab3
:工作
目录
和
基本概念
_
deepfacelab3
:工作
目录
和
基本概念
...
上一篇文章我们已经讲了安装DeepFaceLab所需要的软硬件环境。正常来说就可以进入安装,实操的阶段了。但是,我觉得安...
赞
踩
article
【
华为
O
D
机试考生
抽中题
C&
D
卷】
孙悟空
吃
蟠桃
,
用
Python
编码
,
速通_
华为
机考爱吃
蟠桃
的孙...
其中数字通过空格分割
,
N、H 为正整数
,
每颗树上都有
蟠桃
,
目 0_
华为
机考爱吃
蟠桃
的
孙悟空
华为
机考爱吃
蟠桃
的
孙悟空
...
赞
踩
article
【阿里内部教程】
python
初阶:基础语法
python
全栈
自动化
测试
系类_
run
shell
和ru...
python
基础语法配置环境变量验证一下安装pycharm更换下载源试一下安装numpy更新pip...
赞
踩
article
框架
安全
&
CVE
复现&
Django
&
Flask
&
Node
.JS&
JQuery
...
那么如果真的要搞清楚这个路径需要用到工具去对路径进行拆解了。只需要改目标ip和端口还有就你的一句话木马文件就可以了。我们...
赞
踩
相关标签
工具变量;两阶段最小二乘
fpga开发
matlab
stable diffusion
GPU
计算机视觉
图像处理
人工智能
github
java
面试
开源
spring boot
vue.js
学习
ubuntu
isaacgym
legged_gym
RL
maven
macos
mac 远程ftp服务器文件共享
服务器
git
appium