自然语音二三事

兰海波
诗词歌赋全都会,一取名字王富贵。

关于自然语音发布后,大概率会引起许多讨论,甚至一部分人的争议这件事儿,我们在开发阶段是有一定预期的。从我个人的角度来说,作为读屏研发团队的一员,能够用我们集体的努力,让手机读屏用上稳定可靠的自然语音,让我们摆脱机械化的朗读方式,而听到一个更富情感,更有人味儿的声音为我们朗读。说实话,我和我的伙伴们还是很感到骄傲的。毕竟无论如何,要在几年前,这几乎就只能是一个妄想。所以仍然要忍不住感叹科技的发展,永远会在我们意想不到的地方带来惊喜。


当然,这篇文章不是来抒情的。从昨天软件发布到现在,包括点明圈在内的各大论坛和网站讨论不断,其间也出现了一些疑问和争议。我们也想就这些内容来做一个简单的探讨和答复,现在开始:


首先,关于语音库收费的问题。很显然,点明软件不可能去使用盗版的语音库和资源,我们所用的自然语音,实际上是向第三方付费购买的。语音库的授权模式不比其他,不是说开发者一次购买,就可以无限制提供给自己的用户使用。厂商也鸡贼的很啊,它的购买方式也按设备单独授权。简单的说,我们每向一个用户提供一个自然语音,就要向厂商交一个语音的钱。这还只是语音库的使用授权,还有发音角色,仍然需要单独购买,这部分的钱其实就我们出了,并没有再向大家收取什么费用。当然,谁的钱也不是大风刮来的,因此,即便在这样的情况下,我们也已经尽最大努力,将每个设备的授权价格压到了最低。15块钱的售价,相信很多人一包烟都不止这点钱。就目前的情况来说,我们大概只能做到这点了。


当然,自然语音并不强制。我们的本意,只是给大家提供一种更加个性化的选择。假如你想要更好听的声音,更自然的朗读,自然语音当然是一个很好的选择。而假如你对这方面并没有太高的要求,现有的讯飞语音也完全够用。关于讯飞语音,前期我们也专程和大家聊过。目前集成的64位语音库,我们也付出了巨大的成本,只是为了确保大家即便是基础使用,也能获得良好的体验。事实上,讯飞语音的授权模式也和自然语音一样,需要按设备授权。但作为读屏软件的基础保障,这个 费用不会向大家收取。


这里还有另一个不容回避的问题,那就是,自然语音为什么是按设备授权,为什么是绑定设备而不是账号。因为厂商的付费方式就是绑定设备而非账号,这件事其实完全不受我们控制。我们唯一能做的就是,确保你在软件重装,手机重置以后,你所购买的语音库还能正常使用。


第三个问题,为什么不提供体验版,为什么不能让大家先试用一下再决定是否购买。说实话,我们也想。但语音库的授权并没有体验一说,想要使用就得购买。因为这个原因,即便试听,也是我们预设好的文本内容,而并不支持你自行输入一个文本进行朗读。因为想要语音库朗读你手机上的文本,就必须先将语音库授权给您的设备。


第四个问题,关于不同手机上的性能差距。为什么需要在高配手机上才能获得更加流畅的语音体验。因为自然语音在对文本进行处理与合成的过程中需要更大的算力做支撑,而配置相对较低的机型,在算例满足方面相对更差一些。但实际上,这也并不耽误你将语音库用于读书或新闻等阅读类应用。


好了,写到这里,应该把大家主要的讨论和疑问点都说的差不多了吧。如果还有新的,也欢迎继续跟帖。最后一点篇幅,再说说笔者自己对自然语音的看法吧。我们看到,有一部分声音认为,自然语音是个华而不实的存在,读屏软件最后还是要回归虽然相对机械化,但效率更高的传统语音库。对于这个观点,曾经我也是赞同的。但主要原因不是因为自然语音不好听,而是,那时候的技术,不足以让自然语音真正的好用起来。最主要的问题有两个:第一、加速后不好听,甚至出现抖动之类的情况,而使用读屏软件又不可能一直慢慢的听下去。第二,合成效率低,响应速度慢。然而,随着技术不断的发展与迭代,如今,这两个问题都已经得到了很大的改善。我们在自然语音的接入与调试过程中,在这两方面更是发挥了自己的特长,尽最大努力将跟手度做起来,同时确保语音加速时声音能保持正常。到现在,在一些相对更高配置的手机上,即便将自然语音作为读屏语音,也不会感觉到明显的响应速度变慢。在这样的情况下,我们还有什么理由拒绝声音更自然,音色更漂亮的自然语音呢?毕竟说到底,追求美,就是我们每个人的本能,不是吗?

发表于:2024-07-30 18:01
本帖最后由 管理员-点明科技 于2024-07-30 20:00:58 置顶
92个回复
您还没有登录,登录后才可回复。 登录 注册