基于改进GLR算法的英语翻译智能识别模型设计基于改进GLR算法的英语翻译智能识别模型设计--丽都翻译--15年好评专业翻译公司

——

打印本文             

基于改进GLR算法的英语翻译智能识别模型设计

精读 收藏

宋晓焕 梁金伟 刘晓连

西北大学现代学院基础部

导出/参考文献 分享 打印

摘    要:

针对传统算法模型精度比较低的问题,提出了基于改进GLR算法的英语翻译智能识别模型。通过此算法创建用于标记规模上万个英汉单词的短语语料库,使短语能够自动搜索。另外,创建英语翻译智能识别模型,以数据的收集、处理和输出规划智能识别模型;有计划地对英语信号进行收集和处理,并且提取特征参数,实现英语翻译智能识别。对设计的英语翻译智能识别模型进行实验分析,记录实验数据。通过实验分析可知,设计的英语翻译识别模型精准度较高,能够满足英语翻译工作需求。

关键词:改进GLR算法;英语翻译;智能识别;模型建立;

作者简介:宋晓焕(1984—),女,陕西咸阳人,硕士,副教授。研究方向:英语教育、英语教学法。;

收稿日期:2021-01-25

基金:2021年陕西省新文科研究与改革实践项目;西北大学现代学院校级教育教学改革研究项目(21JG02);

Design of English translation intelligent recognition model based on improved GLR algorithm

SONG Xiaohuan LIANG Jinwei LIU Xiaolian

Foundation Department of Modern College of Northwest University

Abstract:

Aiming at the problem of low accuracy of traditional algorithm model,an intelligent recognition model of English translation based on improved GLR algorithm is proposed. By using this algorithm,a phrase corpus with tens of thousands of English and Chinese words can be created,so that phrases can be searched automatically. In addition,the intelligent recognition model of English translation is created to plan the intelligent recognition model by data collection,processing and output;the English signal is collected and processed in a planned way,and the feature parameters are extracted to realize the intelligent recognition of English translation. The designed intelligent recognition model of English translation is analyzed and the experimental data are recorded. Through the experimental analysis,it shows that the English translation recognition model designed in this paper has high accuracy and can meet the needs of English translation.

Keyword:

improved GLR algorithm; English translation; intelligent recognition; model building;

Received: 2021-01-25

在全球化背景下,国际通用语言为英语,并且使用越来越广泛。但是,各行业都缺乏高英语能力人才。针对我国市场需求,要重视学生的英语语言能力[1]。在英语语言能力中,英语能力为重点,要想在日常交流实践中使用英语,应加强英语语音纠正和学习。以往完全根据教师传授,不仅需要大量的人力资源,并且实现比较困难,所以,开发英语翻译智能识别模型尤为重要。该模型能够监测学生英语发音,并且提出纠正意见。传统英语翻译智能识别模型和设置存在一定的问题,无法对英语翻译精准识别,且无法纠正学生英语发音,还会误导学生发音,对英语学习造成影响[2]。基于以上问题,文中研究了基于GLR算法的英语翻译智能识别模型,从而自动化识别英语翻译。为了验证模型的有效性,文中对模拟环境开展仿真实验。

1 英语智能识别算法

1.1 创建短语语料库

智能翻译模型中使用的语料库具有重要作用,语料库可用于存储双语短语资料,并且对英语、汉语中的短词语的词性进行精准标注,规范每个短语功能,提高英汉机器翻译过程中短语自动识别算法的时效性和精确性,使英汉机器翻译更加精准[3]。图1为短语语料库信息流程。

图1 短语语料库信息流程

图1 短语语料库信息流程   下载原图

文中所设计的英语翻译智能识别模型短语语料库中的单词有70多万个,满足实际使用需求。如图1所示,短语语料库的针对性比较强。文中通过英汉机器翻译短语语料,对不同的短语语料时态进行全面区分,标注英汉短语语料;语料标记方式包括层次、数据与加工3个部分,数据类型为文本格式,层次使用对齐和词性的方式,加工方式使用人机主动沟通方式直接互动,开展英文翻译的一系列常规操作,提高短语语料翻译的精准性[4]。

1.2 短语语料库词性识别

在机器智能识别算法中,短语词性识别尤为重要,其能够对大量的短语、句子、单词的语法歧义进行处理。利用标注短语语料库内容,可对短句中的单词进行划分。英语句子中的单词都是独立存在的,实现中文词句的分词处理判断翻译句子和单词词性,最后利用句法对短语依存关系进行分析,实现句子句法树的创建。利用该方法,可进一步提高机器翻译过程的精准性与实效性,并提高处理短语语料库的能力[5]。GLR算法被广泛应用到词性识别中,用于对短语前后文关系进行判断,并将动态识别表单作为基础的无条件转移语句。GLR在对短语进行翻译的过程中没有对语法歧义进行检测,因此要求再一次去重和校准。假如检测到语法歧义,则利用句法分析几何结构线性调用解析线性表,识别短语的内容,利用局部最优的原则提高内容的质量,通过不同的识别通道输送,以此识别符号,使识别结果的精准度得到提高[6]。

一般地,因为词性识别结果中的GLR算法偶然性比较大,识别数据点具有较高的重合概率,因此无法满足现有词性识别的精准度。文中所分析的改进经典GLR算法利用短语中心对短语结构进行分析,降低数据点重合概率,提高词性识别精准度。利用四元集群计算改进GLR算法的短语前后文似然性[7]:

式中,S为开始符号集群,为CN中元素,VN为循环符号集群,VT为终止符号集群,α为短语动作集群。

假如P表示α中任意动作并且存在于VN,通过推导可得出:

式中,θ、c、x、δ分别表示动作右侧符号、约束值、中心点符号、标记方式。

改进的GLR算法规定识别线性表最上面的符号和θ一致,约束值x需为真,中心点符号c需为数值,不能为空值。只有超过3个标准的识别结果,才是短语词性的识别结果[8]。

2 英语翻译智能识别模型

根据数据收集、处理与输出对智能识别模型进行规划,图2为英语翻译智能识别的总体架构。

图2 英语翻译智能识别的总体架构

图2 英语翻译智能识别的总体架构   下载原图

2.1 模型设计流程

对英语翻译智能识别模型所需要实现的功能进行规划整体模型设计,图3所示为模型设计流程。此模型能够实现数据的收集、输出与处理。使用数据采集装置收集语音信号,之后利用音频输入设备将英语信号输入到处理系统中,对数据信号进行处理,处理后结果在相应客户端与显示器中输出,用户通过显示器或者客户端能够对英语翻译自动化识别结果进行查看[9]。

图3 模型设计流程

图3 模型设计流程   下载原图

2.2 英语信号处理

对模型设计后就要开展详细设计,有计划收集英语信号并且处理,但是因为英语语音信号具有干扰因素,如人体本身发音不标准、设备不完善等,因此所收集的语音信号信息并不是百分百精准。为了提高精准度,要对收集的语音信号进行加工处理,包括分帧、加重、端点监测与加窗等[10],图4所示为英语信号的处理过程。

图4 英语信号的处理过程

图4 英语信号的处理过程   下载原图

利用数字滤波器实现语音信号加重处理,并完善重音检测系统,具体方法为:使用符号F1、F2分别表示元音谱特征的第一、第二共振峰,其和舌位前后、高低相关。基于此,利用神经网络对非重音和重音区分之后就能够利用分类器系统输出位置置信度,从而对元音音准进行衡量,进而选择最佳语音信号。文中使用信噪比为6 d B的高频信号提升预加重数字滤波器对语音信号高于800 Hz的频段进行技术处理。加重系数α位于0.9~1.0之间,加重处理信号y(n)的计算公式[11]为:

式中,x(n)是输入语音信号,信号处理之后对语音信号进行第二步处理,使用半帧交叠方法实现分帧操作。为了精准分析语音信号,将语音信号划分成为t帧,计算公式为:

实现分帧操作处理后对语音信号进行加窗操作,为了清楚地展现语音效果,选择矩形窗w(n),计算公式为:

利用双门限比较法实现加工后语音信号的端点监测,从而迅速寻找起始点与结束点,以便对数据处理和存储。利用该方法能够降低干扰项,提高监测精准性[12]。

2.3 提取特征参数

为了进一步提高系统运算效率,降低和语音信号无关的数据干扰,应统一整理相关信息数据,从而寻找参数特征,然后实现后续计算。图5为提取特征参数的结构。

图5 提取特征参数的结构

图5 提取特征参数的结构   下载原图

非周期性连续时间信号利用傅里叶变换计算信号的连续图谱,但是在实际控制系统中得出连续信号离散采样值,所以要通过离散采样值计算信号图谱。快速傅里叶变换FFT是以离散傅氏变换的奇偶虚实等特性对于离散傅里叶变换的算法改进得到的,一段有限长离散语音信号通过改进得出以下公式[13]:

式中,x[n]是通过采样得出的离散语音序列,X[K]是k点复位序列。

将离散语音序列转变为Mel频率尺度:

式中,Mel(f)是Mel频率,f是实际频率。

对滤波输出开展离散余弦变换DTC,得出语音信号w(n)的特征参数提取结果P,计算公式为:

一段语音信号生成谱图之后要进行加重、加窗、分帧等处理,每个短时分析窗通过快速傅里叶变换能够得到频谱信息,然后利用Mel滤波得出MFCC二维图。

使用上述方法,以英语语音智能识别为需求,通过节奏、语速、音准、语调等方面将相关语音信号参数进行提取[14]。

3 实验分析

3.1 有效性验证

为了全面验证英语翻译智能识别模型的有效性,通过实验实现了文中模型的英语翻译校对测试,记录实验过程中的数据,分析系统性能。实验中有400字符校对词汇量,500篇短文校对数量,25 k B/s词汇识别速度。对比校对后与校对前的英语翻译结果精准度,表1所示为校对前后英语翻译的精准度。

表1 校对前后英语翻译精准度    下载原表

表1 校对前后英语翻译精准度

通过表1可以看出,英语翻译结果校对前的最高精确度为75.1%,使用文中模块智能识别之后,精确度高达99.1%,两者精准度具有较大的差别,验证了系统英语翻译智能识别模型的有效性。

3.2 识别节点分布对比

为了将设计模型的优势充分展现出来,在实验过程中使用基于句法与短语的智能识别模型实现对比实验。记录实验过程中各个系统的节控点位数量,对节控分布情况进行分析。节控点位分布能够描述英语翻译语义、语境关联程度,节控点位密集分布表示系统英语翻译识别具有较高的精准度。图6和图7均为系统识别节控点位的分布情况,图6中的节控点位分布紧凑,说明系统识别性能比较高,校对结果更加精准,并且使英语翻译过程中语境不连贯问题得到解决;图7中基于句法和短语的识别系统节控点位分布松散,但是在第1、4、5次实验过程中具有节控点位分布紧凑问题,表示系统具有较高的校准精准度,但是翻译结果预警连贯性比较差。其次,此系统节控点位分布松散和紧凑交替变换,表示并不稳定[15]。

图6 文中识别系统节控点位分布

图6 文中识别系统节控点位分布   下载原图

图7 计算机智能校对系统节控点位分布

图7 计算机智能校对系统节控点位分布   下载原图

通过以上描述可知,文中设计英语翻译智能识别模型具有较高的校对精确度,能够对英语翻译结果中语境不连贯的问题进行识别,给出了符合语境连贯性、合理性的翻译结果。

4 结束语

文中针对英语翻译时存在的结构问题,为了解决传统GLR算法中的数据点重合问题,提出了改进的GLR算法。利用短语中心点设计改进算法中的短语结构,以解析线性表句法功能,对词性识别结构、英汉结构歧义进行矫正,解决传统计算方法中识别结果精准度比较低的问题,为短语识别提供合理方法。通过文中实验结果表示,基于改进GLR算法及其翻译对比其他算法计算比较简单,并且难度比较低,满足英语机器翻译工作的需求。


上一篇石蜡包埋组织中组蛋白的提取分离和翻译后修饰的定量分析
下一篇生态翻译学视角下的江西红色旅游景点公示语英译策略研究

相关内容

——

29

2021-09

基于改进GLR算法的英语翻译智能识别模型

基于改进GLR算法的英语翻译智能识别模型设计精读 收藏宋晓焕 梁金伟 刘晓连西北大学现代学院基础部导… [了解更多]


产品中心Focus on high-end precision positioning, service, help you realize value translation

专注高端 精准定位 用心服务 帮您实现价值翻译

——

严格的质量保证体系、规范的操作流程和优质可靠的服务。所提供的翻译服务项目有:文档资料翻译、影音翻译、同声传译、交互传译、软件本地化、网站本地化、翻译软件、定制翻译系统等。  

Learn more