最近发布的文本语音模型Kokoro v0.19仅用8200万参数就在TTS Spaces Arena排名位居榜首。
高质量的AI语音朗读也许会让真人朗读的有声书变得越来越少。
Kokoro 模型权重使用 Apache 许可发布,当前已支持美式英语、英式英语、法语、韩语、日语及中文普通话。
开发者Claudio Santini在Kokoro v0.19的基础上开发出基于Python 3的应用Audiblez,能将电子书转为有声书。经过测试在苹果M2 MacBook Pro上,能将含10万单词的道金斯《自私基因》转为有声书,耗时2小时。