b2科目四模拟试题多少题驾考考爆了怎么补救
b2科目四模拟试题多少题 驾考考爆了怎么补救

基于Android的智能中文输入法_IT /计算机_数据

电脑杂谈  发布时间:2020-08-15 18:12:07  来源:网络整理

如何输入带音调的拼音_输入汉字显示拼音_insun智能拼音输入法

卷37卷7卷37 No. 7·人工智能与识别技术·人工智能与识别技术·计算机工程货号: 货号: 1000-3428(2011)07-0225-03 — — —文件识别码: 文件识别码: 2011年4月2011年中文图书馆分类号: 中文图书馆分类号: TP18基于Android的智能中文输入法王业汉,唐布洲,王小龙,刘峰,王业汉,唐布洲,王小龙,王轩(计算机科学与技术系,哈尔滨工业大学深圳院,广东深圳518055)摘要: 介绍句子级汉语拼音输入技术的基本原理,讨论移动设备面临的问题和解决方案,并实现基于Android的操作系统句子级汉字拼音输入法. 该输入法应用于多普达A3288手机,操作良好,汉字输入流畅,语音字符转换精度为86.92%. 随着用户适应输入法和输入习惯,准确率将得到一定程度的提高. 关键字: 关键字: 输入法; Android操作系统;语音字符转换;基于Android的自然语言处理智能中文输入法刘峰,王业汉,唐步洲,王小龙,王璇(哈尔滨工业大学深圳院计算机科学与技术系,深圳518055) )【摘要】本文介绍了句子级汉语拼音输入法的基本原理,并讨论了在移动设备上实现该方法的难点和对策. 它在Android OS上实现了一种输入法. 到目前为止,它可以在多普达的手机A3288上高效运行. 转换精度为86.92%,通过输入法的训练,精度可以快速提高. 【关键词】输入法; Android OS;语音符号-字符转换; 【自然语言处理】DOI: 10.3969 / j.issn.1000-3428.2011.07.0761概述方法拼音输入汉字输出机器学习表1 INSUN句子级输入法的优点单词级输入法只能使用一个拼音或多个拼音输入,但用户需要手动分割拼音单词或单词作为输出单位. 候选者将不会根据上下文自动更新. 通常,没有这种功能,或者只是更新单词频率. 随着电子技术的飞速发展,移动设备的处理能力不断提高,越来越多的应用程序和服务在移动设备上实现,例如文本编辑,Web浏览和各种个人信息管理.

为了在全球范围内推广这些应用程序和服务,我们必须首先解决各个非英语国家和地区的输入问题. 因此,高效,快速的中文输入技术对于在中国推广此类应用程序和服务至关重要. 汉语拼音输入技术总体上经历了以下发展: 从基于单个字符的第一代输入技术到基于单词和短语的第二代输入技术,再到句子级输入技术. 句子级汉语拼音输入技术采用自然的拼音输入法,以短语和句子为输入单位. 它以“易于学习,符合人们的阅读和写作习惯,并且不会打扰人们的思维”而被用户广泛接受. 主流汉字输入技术[1-2]. 但是,句子级汉语拼音输入技术需要存储大量上下文知识(包括统计信息和规则),计算各种知识对所有可能的候选词的贡献,并对这些候选词进行排序,并且空间和时间开销相对较大大. 当移植到移动设备时,它受到存储空间和计算能力的限制. 移动设备上大多数现有的中文输入技术仍然使用单词和短语作为输入单位. 本文介绍了句子级汉语拼音输入技术的基本原理以及移动设备面临的问题和解决方案,介绍了Android操作系统及其IMM / IME框架,并介绍了在这种情况下句子级汉语拼音输入技术的具体实现方式Android操作系统. INSUN语句级输入法使用拼音流连续输入,并自动执行音节分割. 这是从拼音流到汉字流的转换. 输出单位是句子. 它将根据上下文输入自动更新候选者. 具有机器学习功能,输入方法将按照用户的输入习惯自动生成新单词并更新候选顺序. 3句级汉语拼音输入法是将输入的拼音字符串转换为汉字句子,然后将其输出到应用程序.

insun智能拼音输入法_输入汉字显示拼音_如何输入带音调的拼音

基本原理如图1所示. 拼音表用户输入信息获取提供数据拼音分段拼音字符串字典提供数据统计库提供数据最佳句子路径生成音节分段和语音词转换模块用户候选操作结果提交应用句子水平汉字语音输入技术语音单词转换的基本原理中间层生成数据并提供数据. 动态统计的候选操作信息. 用户词典更新. 用户词典更新. 学习模块ͼ1句级汉语拼音输入技术原理基金项目: 基金项目: 国家“ 863”项目资助项目“基于姿态的拟人化计算机交互系统”(2007AA01Z194);国家自然科学基金面上项目“多网络体系结构异构信息的收集与检索技术研究”(90612005)作者简介: 作者简介: 刘峰(1983-),男,硕士,主要研究方向: 自然语言处理;王业汉,硕士;唐布洲,博士;王晓龙,王轩,教授,博士收稿日期: 收稿日期: 2010-08-25电子邮件: : 2近年来,移动设备在存储空间和计算能力方面取得了重大突破,为发展带来了新的机遇. 移动设备上的句子级输入技术. INSUN语句级输入法与以前的单词级输入法相比具有优势,如表1所示.

INSUN句子级输入法226计算机工程2011年4月5日,整个过程包括三个部分: 接收用户输入信息;音节分割和语音单词转换;并将结果输出到应用程序. 用户输入信息由于硬件设计上的差异,移动智能设备主要有两种输入方法: 全键盘和全触摸屏. 也有同时包含这两种方法的模型. 无论配置如何,键盘事件器都可用于获取用户输入信息. 全触摸屏需要输入法来实现软键盘界面,以供用户单击和输入. 为了拦截来自应用程序的用户输入,应用程序需要使用IMM(输入法管理器)来通知操作系统,其输入可以被IME(输入法编辑器)程序拦截. 在中文输入法中,用户的输入信息是拼音流. 截获此信息后,可以执行后续的转换工作. IMM / IME的工作原理将在第5节中说明. 3.1 3.2音节分段和语音字符转换这部分主要由输入法软件的内部逻辑完成. 主要功能是将拼音流转换为汉字流. 使用以下两个模型. 在其中,使用最简单的阵列进行存储. 使用数组的原因是Java不支持结构,对象消耗大量内存和计算时间. 必要的存储空间开销被声明为静态类型. 这种类型的功能是,该类的所有对象引用都共享这种类型的变量的存储空间,并且在系统初始化期间将首先分配内存空间,但是应注意避免读写逻辑错误.

insun智能拼音输入法_如何输入带音调的拼音_输入汉字显示拼音

另一方面,我们需要注意内存回收. 尽管Java具有自己的垃圾回收机制,但它采用代码强制回收来避免在紧急需要资源时移动平台上的内存不足的问题. 运行时问题的解决方案运行时问题的解决方案避免了所有重复的计算,并使用后备机制仅计算已更改的零件. 例如,当用户添加或删除拼音时,仅重新计算最后一段的拼音,而句子路径仅重新计算修改后的节点. 优化拼音表和同义词库的存储格式,并采用Trie树索引方法来减少搜索时间. 添加学习模块以进一步提高转换精度. 4.2 N-gram模型基于统计的N-gram模型(N-gram)是一种常用的自然语言处理模型,可以更好地表示句子中单词之间的依存关系. 在此模型中,假定句子中第i个单词的概率P(wi)仅取决于出现在其前面的n-1个单词. 概率计算公式为: 3.2.1 P(wi)= P(wi | wi?n + 1,wi?n + 2,L,wi?1)= P(wi?n + 1,wi?n + 2 ,L,wi)C(wi?n + 1,wi?n + 2,L,wi)(1)= P(wi?n + 1,wi?n + 2,L,wi?1)C(wi ?n + 1,wi?n + 2,L,wi?1)55.1 Android操作系统及其IMM / IME框架,其中C(wi?n + 1,wi?n + 2,L,wi)是单词组合wi?n + 1,wi?n + 2,L,wi在语料库中出现的次数.

使用Bigram模型时,句子中第i个单词出现的概率P(wi)仅取决于出现在其前面的单词. 出现句子S = {w1w2 L wn}的概率为: P(S)= P(w1w2 L wn)= P(w1)P(w2 | w1)LP(wi | wi?1)LP(wn | wn?1)(2)平台简介Android智能操作系统版本1是由开放手机联盟开发的,后来通过Google Projects for Android进一步完善了该平台的功能. 该平台具有以下优点: (1)代码全部是开源的,降低了平台用户的开发成本; (2)基于Linux通用操作系统,具有良好的硬件兼容性; (3)丰富的图书馆资源支持多种功能; (4)大力支持第三方发展. 当前,该平台支持的主要开发语言是Java,推荐的开发环境是Eclipse,以及相应的虚拟设备软件. Android平台IME / IMM系统框架IME / IMM框架是操作系统的重要组成部分. 它主要协调操作系统,应用程序和输入法软件之间的事件和数据传输,并负责在输入法之间进行切换.

输入汉字显示拼音_insun智能拼音输入法_如何输入带音调的拼音

图2显示了IMM / IME结构和在Android平台下编写输入法所需的基本模块. 主输入法程序必须实现InputMethod接口,否则应用程序将无法控制输入法通过InputMethodManager类,它将不可用. 转换后的输入信息. 5.2用户单击触摸键盘界面上的按钮. 选择按键消息输入方法所需的功能模块候选操作. 使用单词之间的一元和二进制单词频率的统计语料库,可以计算出由这些单词组成的句子的概率. 3.2.2最佳句子的计算通过Bigram模型,可以获得任何句子S = {w1w2 L wn}的概率. 下一步是从中找到最合理的句子. 因为仅需要最佳句子路径,所以使用维特比算法来计算最大可能的句子路径. 计算公式为: max P(S)= max [P(w1)P(w2 | w1)LP(wn | wn?1)] =1≤≤ni候选窗口∏ max P(wi | wi?1)( 3)其中max P(wi | wi?1)表示P(wi | wi?1)转换项具有最高的值.

结果输出函数的这一部分必须使用IMM / IME之间的数据和消息传输机制来完成. 当输入法软件将转换后的汉字结果提交给应用程序时,通过IME接口获取应用程序中的IMM连接对象,并通过该对象发送数据,应用程序侧的IMM对象将处理事件和数据,并将数据交给应用程序处理. 3.3键盘操作输入数据输入法控制监视系统主程序数据消息转换后显示候选用户输入信息InputMethod接口InputMethod Manager类型IME控制消息显示用户输入应用程序编辑窗口ͼ2 Android平台IMM / IME结构4在移动设备上实现句子级输入法存在两个主要困难: (1)在移动设备的有限存储空间中,确保字体和程序的操作. (2)不仅要确保拼音分割和语音字符转换的准确性,还要确保计算在移动设备的允许范围内[3]. 内存空间问题解决内存空间问题的方法由于外部I / O占用大量时间,因此需要经常访问的内容存储在内存中. 初始化输入法后,整体读取字体文件4.1面临的问题及其解决方案66.1系统实现系统结构开发平台: Android Sdk Windows 1.5 r2; Eclipse V3.4.2; J2SE SDK 1.6.0_14.

输入汉字显示拼音_insun智能拼音输入法_如何输入带音调的拼音

系统结构为: 系统采用统一建模语言(UML)设计,系统的类图如图3所示. Android系统将Input Method归类为Service类型程序,并要求主要输入法类必须继承API类: 输入法第37卷第7期刘峰,王叶涵,唐布洲等: 基于Android输入法227MethodService的智能中文. 为了使系统结构更紧凑,该系统中使用了主类INSUN来实现API的键盘按钮监视接口KeyboardView.On KeyboardActionListener. INSUN_Keyboard类负责软键盘的生成,键盘绘制由API类KeyboardView完成. CandidateView类主要负责绘制候选和监视候选操作. 其他4个主要类别: PinyinProcessor完成拼音分割功能; Word UserWordProcessor管理用户单词. Processor完成语音单词转换功能;图书馆;学习者完成学习功能. INSUN主要类负责管理这些类的逻辑顺序,以处理用户输入数据,包括IMM / IME结构中IME端的所有逻辑.

系统的整体数据流程图如图1所示. 拼音表包含所有合法的拼音,字典包含大多数常用单词,统计由训练语料库生成,用户字典存储用户单词,动态统计记录用户输入的历史记录. 实现适应性用户输入习惯[4]. 句子路径生成功能的实现. (4)自适应学习: 采用了机器学习训练的思想,但是机器学习理论中全局最优解的计算量太大. 考虑到性能的可行性,设计了一个学习模块. 设计的学习方法为: 输入用户候选操作,输出用户词典和动态统计IF,用户选择非第一候选者,找出候选词的WordId IF. 这些单词满足组成用户单词以生成新用户单词的条件,并初始化单词频率ELSE将这些单词的一元单词频率提高到错误候选单词的频率+1增加这些单词和先前单词的二进制单词频率错误的候选词之间的二进制词的频率为+1以上算法可以将用户候选词和句子快速增加到第一个候选位置,并避免大多数词达到最大词频. 平台兼容性该输入法可以由Android SDK 1.5和OPhone SDK 1.5编译. 到目前为止已经通过的测试平台包括Android设备模拟器ADT 0.9.1,中国移动OPhone设备模拟器ODT 0.9.0和真实的手机平台Dopod A3288.

有关测试平台的更多详细信息,请访问相应的官方网站. 图4显示了在ODT和ADT上写入短消息的输入法示例. 6.4图3系统UML类图用户输入信息连接和输出应用程序结果用户输入信息接收和输出应用程序结果当用户在应用程序文本编辑框中选择输入方法时,应用程序将调用InputInputManager类的setInputMethod方法. 操作系统将在InputMethod接口中调用bindInput方法,以将用户选择的输入方法与应用程序绑定. 之后,系统调用INsun中的onCreate方法来初始化输入法程序. INSU_Keyboard类生成键盘接口. 主要类INSU实现了键盘侦听器的功能. 当用户触摸屏幕上的按钮时,键值将由INSU Capture类设置,并存储在要分段的拼音流中. 在拼音和汉字转换过程中,INsun通过调用继承的getCurrentInputConnection方法来获取与InputMethod接口连接的InputConnection对象. 通过调用InputConnection中的setComposedText方法(例如拆分的拼音流)来更新应用程序编辑窗口的显示信息.

当用户完成所有候选操作时,请在InputConnection中调用方法commitText将转换的最终结果发送到应用程序. 其中,InputConnection和应用程序之间的通信都通过InputMethod接口发送到应用程序中的InputMethodManager进行相应的处理(参见图2). 6.2拼音分段和语音词转换模块语音分段和语音词转换模块如下: (1)训练语料库: 使用30,000个常用词和一年《人民日报》的文章作为训练语料库,生成统计. 生成方法是: 使用词典将一年《人民日报》的文章进行细分,然后计算每个单词的出现频率以及单词之间的关系. (2)拼音分割: 算法的这一部分主要由两部分组成: 第一部分是构造一个包含所有合法拼音的拼音网格. 第二部分是从网格中查找所有合法的细分路径. (3)语音字符转换: 这部分分为两层来实现: 第一层是所有拼音输入法都具有的从拼音到汉字的映射功能的实现,这被称为语音的中间层构造. 该系统;第二层是专用于句子级输入法的最佳语言. 6.3(a)ODT操作示例(b)ADT操作示例of4输入法在ODT和ADT上写短信的操作示例7INSUN智能拼音输入法(Android版本)哈尔滨工业大学开发的深圳院智能计算中心的开发已经完成,并通过了严格的功能和性能测试[5].

它可以在基于Android 1.5及更高版本的智能移动操作系统上运行. 具有安装简单,输入效率高,拼音容错性好的特点. 欢迎下载和试用. 下载地址: /wenzi/INSUN/Android_INSUN.htm. 参考文献[1] [2] [3] [4] [5]王小龙. 关键词: 汉语拼音输入法中文信息学报,1993,7(2): 45-54. 王小龙语音字符流分割与互转换的理论研究与系统实现[D]. 哈尔滨: 哈尔滨工业大学,1989. 张振波,李王晓龙,关半社,2005. 唐布洲,王晓龙,王璇,等. 句子级汉语拼音输入技术评价方法研究[J]. 中文信息学报,2008,22(5): 51-55. Jun. 电视中文输入法的实现[J]. 计算机应用,2006,26(5): 1097-1101电脑易. 计算机自然语言处理[M]. 北京: 清华大学工程学报,2008,34(2): 278-279. 结束语编辑书征集


本文来自电脑杂谈,转载请注明本文网址:
http://www.pc-fly.com/a/shumachanpin/article-299569-1.html

    相关阅读
      发表评论  请自觉遵守互联网相关的政策法规,严禁发布、暴力、反动的言论

      • 窦巩
        窦巩

        #吴亦凡##挑战者吴亦凡#

      • 王莉
        王莉

        股市运行规律一个小节点也是国家资产

      热点图片
      拼命载入中...