换了一张ppt,那是游戏的操作界面示意图,“出牌”按钮的下方是一个同等大小的麦克风按钮,旁边还有一个箭头样式的tips提示框,上面写着“请按下后说出想打的牌型”。
陆启连新手指引都做进示意图里了,引导第一次操作的用户如何使用语音操控。
“如图所示,当玩家按下这个按钮后系统将进入语音操控模式,玩家说出他想要打出的牌型,该牌型会自动突前显示,作为备出牌。”
这时候他终于看见栾红英微微侧头,这是更加专注的表现,陆启心里更有底气了。
“这个系统由我们与国内最大的语音识别技术支持商陵城汇讯科技合作,汇讯根据我们提出的需求,建立了本游戏单独的关键词库,并与识别结果进行匹配,而这个过程都会在汇讯的云服务器上完成。”
陆启又切换了一张ppt:“这是整个语音系统的数据交互过程。”
这张流程图非常清晰地将用户语音输入,端点检测降噪,消息封装,底层传输并将语音数据流在云服务器进行调度,加载斗地主应用脚本,返回结果并进行音频解码等一系列流程展示了出来。
当然在场的人应该没几个看得懂的,主要是为了体现专业。
“关键词库是什么?”栾红英表现出了她的兴趣,提问道。
陆启再次切换演示文档,上面罗列了几个比较有代表性的关键词,如“顺子”、“炸弹”、“对子”和各种单牌。
“栾总,请问你平时出对q时会怎么说?就日常习惯不用考虑机器识别的情况下。”
栾红英毫不犹豫答道:“对圈儿。”
“那刚好,在我们的关键词库里。”陆启指了指ppt上表格里的“对圈儿”。
这么多种可能,他当然只会问对方他做在演示文档里的罗列出来的。
栾红英望了望重明和擎火方,似乎希望他们也能提出一些问题来“考一考”陆启,可马腾那边似乎只想会议赶紧结束,而谢喜乐已经很清晰了解了陆启的方案,并且也同样认为可行,听得津津有味。
这似乎让云信那种三方激辩的预想落了空。
“这种识别准确率怎么样?”栾红英又问。
“根据我们目前自己进行的测试,准确率能达到96%以上,并且我们是刻意模拟了不同的人用不同的发音和说话习惯,在不同的近音场合进行了测试。”
“96%,这么高?”栾红英表示怀疑。
“当然,不过这个数据测试样本还是太少,不具备完全的说服力,但我觉得栾总你可以自己尝试一下。”
陆启拿出了他准备好已经于电脑连接的测试机,手机屏幕也投屏到了投影仪上。
“这几天我们做了一点微小的工作,一个简单的demo,可以测试识别结果,也方便我们修改关键词库,栾总,您可以过来试试。”
栾红英起身走到陆启电脑面前,拿起了手机。
“按下这个按钮后就可以说话了,比如你可以说‘吃饭了吗?’”
栾红英按下按钮,有些疑惑,不过还是对着手机麦克风用字正腔圆的普通话说了一句:“吃饭了吗?”
手机左上角输出了识别结果“吃饭了吗?”,然而主界面上并没有任何一张牌显示,她看向陆启表示需要解释。
陆启从容道:“对不起,我刚才跟你开了一个小玩笑,当然不会显示出任何结果,而这正是关键词库的意义,对没有在库中的词,我们的系统根本不会做出任何反应,因此才会有这么高的准确率。你说就算对着它用非常标准的普通话说‘顺治皇帝’,他也只会匹配成打牌里的‘顺子’。”
栾红英“哦”了一声,眉头舒展开来,好像是明白了其中的关键。
她又对着手机说了一声“顺治皇帝。”
此时屏幕左上角输出了“顺治皇帝”,而主界面则显示了“34567”这5张牌,因为陆启已经将“顺治”列入了关键词库,并映射为“顺子”。
“为什么是这几张,如果我想出的是其他顺子呢?”栾红英问得非常细致。
“这是我们设定的,因为这个demo只是测试语音用的,还不具备游戏规则逻辑,默认你手中有出不完的所有牌,如果是完成后的游戏中你这样说,会默认出你手里能打的最小的顺子,你可以试试说“五顺子”。”
栾红英这次没有完全听陆启的话,她说了句:“七顺子。”
结果得到的是“78910j”这五张牌。
她突发奇想,然后说了句:“四炸弹。”
屏幕上如她所愿,显示了四张“4”。
陆启笑道:“看来栾总已经融会贯通了。”
栾红英点点头,又自己测试了几次,都得到了完全匹配的结果,没有一次错漏。
她看着陆启点点头满意道:“识别准确率真的不错。”
陆启道:“云信的各位可以都试试,因为每个人说话发音各不相同,游戏也会面向各色各样的用户。”
“这个不用了,我们可以下来以后再详细测试,先不耽误大家时间了。”
栾红英回到了主席台,陆启又继续切换ppt道:“我们顺便还做了点课外作业,我把这个叫做‘小云同学’,是为云信手机深度定制的个人语音助手。”
投影仪上显示了语音助手的示意图,非常有科技感,demo没做弄个示意图还是来得及的。
“语音助手?”栾红英彻底动容了,陆启甚至相信他们自己内部就有讨论过类似产品。
而和栾红英差不多反应的还有谢喜乐,她本以为语音出牌就是陆启的绝招,没想到还有后手,摇头笑了笑,还是低估了这个人。
“是的,栾总应该也体验过友商品牌的语音助手吧,非常便捷,而小云同学是针对云信手机深度定制的。”
“举个例子,你可以对她说‘帮我充话费’,她将会自动在手机上打开内置的云信在线营业厅app并进入充值界面,这个就叫做深度定制,当然输入支付密码之类的还是需要用户自己操作。”
“不仅如此,小云同学未来完全可以应用在云信推出的许多系统和硬件上,并非只是手机。我比较随意地想像一下,智能客服,营业厅自助服务机器人,光猫,机顶盒,甚至全屋智能集成。”
陆启画了一个大饼,向栾红英描述着一张宏伟的蓝图,一个光明的未来。
并不虚无缥缈,毕竟刚刚对方才体验过语音识别的准确率。
但也只是点到即止,陆启很快道:“不过今天既然是《斗地主ol》的方案评审,语音助手的事我们就只稍微提一下,毕竟是另外一个项目了,如果栾总感兴趣的话我们会后可以更详细地探讨。”
“所以游戏开发将会分为以下几个模块,美术资源,服务器功能,app开发,语音系统集成,测试与完善,总计开发周期预计72个工作日,这是详细的开发计划表。”
“以上就是我们的项目方案了,大家还有什么疑问吗?”
身旁的文勉悄悄在桌下双手合十拜佛,谢天谢地,非常顺利。