牛雨离开之后,冯子默可以说已经完成了此次来帝都的所有任务。
原本冯子默打算着在事情办完之后在帝都游览一番,不过现在冯子默却是改变了主意,因为有了新的计划要完成。
至于新的计划,自然是关于翻译软件的神助攻了。
而被冯子默视为神助攻的,则是足以与超级语言互译相媲美的另一样法宝“智能语音输入法”。
现在市面上做的最好,应用最为广泛的语音输入法当数飞音语音输入法,飞音语音在长句语音识别方面做的相当不错,只要环境不是特别嘈杂,飞音语音可以通过结合上下文的语境方式,基本做到将大段的语音完全识别出来,准确率相当高。
不过冯子默认为,还不够好,尤其是在短词汇方面,比如人名、术语、同音词组等方面飞音语音都表现的不尽人意,而且在嘈杂环境的表现更是一场灾难!
冯子默想象中的语音输入法应该更加智能,分辨更加精准,抗干扰能力更加强大,足以同人耳媲美,甚至比人耳具有更强分辨力的软件。
简单来说,就是一种具有真正智能,可以在使用过程中根据用户的使用习惯不断进行调整和深度学习,最终达到完美识别用户语音的境界。
对于准备打造的这款智能语音输入法的核心智能模块,冯子默可以说是胸有成竹,毕竟有着之前版本的经验以及在扶桑开发的那款车辆应急系统都用到了类似的智能模块。
唯一让冯子默有些头痛的是对千差万别的用户群语音数据的收集和识别。
毕竟冯子默主打的是智能识别,但是哪怕再智能,也是需要进行深度的语言学习。
普通话,作为全国推广的官方语言自是需要首先被攻克的,不过普通话对冯子默想要打造的智能识别系统来说,恰恰最没有难度。
毕竟普通话有着规范且健全的发音准则,只要这些准则都深度学习一遍,就可以在相当程度上对普通话进行精准识别。
然后就是各地方言,在初步评估中,冯子默将方言分为两类,一类是粤语、闽南语这种总结出了类似于普通话那种成体系的发音规则,并且有一套所谓正宗发音原则的方言。
另一类则是只有语言的使用者可以意会,却是不能言传他人的方言。
对于第一类方言,倒是可以和普通话同样对待。
但是第二类方言就不能如此省事儿了。
能听懂普通话和第一类方言,是冯子默对智能语音识别系统的最基本要求。
在此基础上,冯子默将对第二类方言的识别与带有地方口音的普通话或者第一类方言的识别作为智能语音识别系统的需要具备的进阶版能力。
毕竟听的懂标准版的普通话乃至特色方言都没什么大不了,能听懂带有地方口音甚至个人口音的普通话以及特色方言才算牛。
冯子默之前就听过一个段子:说一位南闽籍的老板将一位员工叫到办公室,让他帮你买仙人掌,还特意交代要“黄糊色”。
员工当时就懵了,心中更是嘀咕着:黄糊色是的什么颜色,没见过仙人掌有黄糊色的啊!
老板看着一脸懵然的员工,又特意指着电脑桌面图案中高悬的太阳再次强调道:黄糊色、黄糊色!
员工晕晕乎乎的走出老板办公室,满面愁容,口中还一直念叨着“黄糊色”。
恰在此时,一位南闽籍同事问这位员工发生了何时,员工将事情完整的讲述了一遍,还一本正经的问同事,黄糊色到底是什么颜色。
这位南闽籍的同事却是哈哈大笑道:不是黄糊色,是防!辐!射!
段子虽然是段子,但冯子默深知这个段子反应的却是客观现状,不仅南闽群众“”、“”不分,自己作为千湖省的一员,哪怕在国家普通话考核中拿到了二级甲等的证书,同样经常在不经意间在发音上弄混“”与“”,至于像“灰化肥会挥发”这种简短的绕口令更是从来没有清晰、快速、正确的念出来过。
而诸如此类的口音迁移问题在各种版本的普通话和方言中数不胜数。
因此,想要具备分辨不同口音和不成体系的方言这种能力,冯子默能想到的唯一办法就是深入到群众中去学,向使用这种语言的人群去学。
当然,不是冯子默自己去学习,而是让准备打造的这款智能语音识别系统去学习。
至于智能语音识别系统如何到群众中去学习地道的当地语言,自然只能靠语音数据库了。
要说语音数据库,冯子默第一个想到的却不是飞音集团,尽管飞音集团所研发的语音输入早已进入市场多年,不仅有着不少忠实拥趸,更是有着数量众多的语音输入用户,势必收录有数量庞大且丰富的语音样本。
不过,飞音语音虽然支持普通话以及数十种方言,但是对于口音问题和第二类方言,飞音输入法自身都不能识别,自然也就没人会在使用飞音输入法的时候说不能被识别的方言。
因此,在这一类型的乡音、方言的语音标本,飞音集团应该也是寥寥。
真正被冯子默第一个想到拥有这种资源的公司则是国内社交领域的绝对霸主迅腾,该公司旗下的和微书信两款应用软件占据了社交领域绝大部分份额,可谓是无孔不入,装机量更是遥遥领先。
冯子默具体看中的正是具有发送语音消息功能的微书信,微书信作为社交领域的两座高峰之一,几乎成为了一