
目前,几乎所有的输入法基本能实现在用户输入第一个字后预测用户接下来输入的文字,并进行推荐。AI 在输入法中的应用,能够通过大量的语言、语义的学习,了解人的用语习惯,甚至是性格和思维。
当输入法可以更加准确地了解用户之后,机器与人类之间的交流的以加深,人机交互的体验得以提升,进而提高用户粘度。输入法引擎 AI 化已成为输入法产品发展的趋势。
Kika 早在 2014 年就推出了首款输入法产品 Kika Keyboard,在海外进入了 140 多个国家,支持 173 种语言,全球用户数量达 4 亿,月活 6000 多万,这与此产品背后的输入法引擎有着密不可分的联系。
各位好,非常高兴能够有这样一个跟大家交流的机会。今天主要想为大家介绍一下手机输入法最核心的模块 - 输入法引擎的技术方案,为什么以及如何从传统 N-gram 引擎演化到深度神经网络引擎的。
主要的内容分为五个部分:
什么是输入法引擎;
基于传统 N-gram 语言模型的输入法引擎;
为什么要转向深度神经网络引擎;
深度神经网络输入法引擎的那些坑;
高级预测功能。
作为一家面向全球用户提供 173 种语言输入法的公司,Kika 利用 AI 技术,为用户提供了一流的输入体验,也在全球获得了大量的用户。

这张图中列出了目前全球输入法市场上用户量较大的产品,背后的公司既包括 Kika、百度、搜狗、Go 以及触宝这样国内的公司,也包括 Google(产品为 GBoard)、微软 (Swiftkey) 等国外大公司。大家都在输入法引擎的核心技术上投入大量研发精力,期望为全球各国用户提供一流的输入体验。
什么是输入法引擎
输入法 (Input Method,简称 IME) 是最常用的工具软件之一,也常被称为 Keyboard、键盘等。对每种语言,输入法会提供一个字母布局 (Layout),上面按照用户习惯将对应语言的基础字母放置在合适的位置,比如英文键盘的 QWERT、汉语键盘的九宫格等。用户输入文字其实就是按照顺序来敲击 Layout 上的字母,字母敲击序列称为键码序列;在用户敲击字母的过程中,键码序列以及之前用户输入的词会被传入 Layout 下层的「输入法引擎」,引擎会根据从数据中训练得到的语言模型,来预测用户当前以及接下来可能输入的词 / 词序列,并将最可能输入的词 / 词序列在键盘的候选区上展示给用户,供用户选择。
例如,如果一位用户期望输入的完整文本内容为「What’s the weather today?」,当前输入到了「weather」的第三个字母「a」,此时词序列「What’s the 」和键码序列「W h a t ’ s SPACE t h e SAPCE w e a」(SPACE 表示空格) 作为输入传送至输入法引擎,引擎基于训练好的语言模型进行预测,并将最有可能的候选词「weather」、「weapon」等展示给用户,供用户选择。在这个 case 中,如果「weather」排在第一位,则可以认为引擎是合格的,可以打 60 分。如果仅输入到「weather」的第一个字母「w」,就可以将「weather」排在第一位,则可以打 70 分。如果在输入到「weather」的第一个字母「w」后,就可以直接预测用户接下来要输入的词序列为「weather today?」,那就会更好,可以认为是 90 分。
总的来讲,输入法引擎的功能可以细分为「纠错」、「补全」和「预测」三类。
所谓纠错,指的是在用户输入一个错误的词,比如「westher」,会自动建议改为「weather」;
所谓补全,指的是输入一个词的一部分即预测整体,比如「w」预测「weather」;
本文来自电脑杂谈,转载请注明本文网址:
http://www.pc-fly.com/a/jisuanjixue/article-81276-1.html
既然同性如此重口的事都能想到去合法化了
IBM的笔记本业务不盈利了
谁都可以无害通过