深耕音乐场景的语音助手科大讯飞推出一款「发条」APP

来源：互联网
|
2023-03-14
|
0 条评论
|
T小字　 T大字

　　人工智能语音行业如火如荼发展，语音助手、智能音箱已不是新鲜事，各大厂商都在纷纷布局。如果说通用型语音助手已经没多少坑可占，那么垂直领域的细分应用场景是否还有机会可挖呢？

　　近期，36氪接触到一款产品「发条」，为科大讯飞旗下创新产品，主打听音乐这个细分领域。9月底上线后，在没有推广的情况下，用户量已经达到4万多。目前，产品可以在四种场景下使用：音乐、导航、微信、电话。打开APP之后，默认是音乐场景，按下说话：邰肇玫墨绿的夜，即可打开网易云音乐自动播放：

　　科大讯飞在人机语音交互方向的尝试由来已久。2012年，讯飞联合中国移动做的灵犀语音助手，累计获得过亿用户量，积累了丰富的语义底层数据。谈到做发条的初衷，产品总监达达说，01年到现在，很多语音助手厂商转型做智能音箱等硬件，因为语音助手基于APP端的场景很局限。现在大部分助手是为了查询信息，但是很少用手机做事儿。实际生活中，人们在说话时候，不一定是按照逻辑的，所以要让机器理解也有难度。语音交互不够开放的时候，语音助手做到拟人化很难。要实现突破，首先需要缩小到一个话术体系里。讯飞团队分析发现，用户在语音助手上搜索音乐方面的数据占比最高，因此决定聚焦在音乐这个场景。

　　AI终局是无限接近于人，但是离人的距离还很远，需要基于场景，定点突破。在功能层面，发条通过语义处理引擎垂直在音乐场景，做到准确识别。比如用户说晴天，产品会找相关歌曲，而不是报天气。技术方面，使用讯飞的语音引擎技术，全双工语音交互，整合语音唤醒（成功率达到95%）、语音识别、自然语言理解和语音合成。

　　在搜索方面，发条通过与4家音乐平台合作，采用AI搜索引擎，实现全网搜歌，自动播放，并自动判断版权归属。因各家音乐平台分别持有不同音乐人和唱片公司的版权，发条在每一次用户请求时，会向所有对接的音乐平台发起请求，若用户偏好APP内没有对应曲目的版权，可自动跳转至有版权的音乐APP进行播放，保证每一首歌、每一位歌手的内容都能让用户听到。

　　关于后续的产品规划，发条第一阶段的目标是，做到更符合用户直觉的说话响应，听懂书面化、口语化的表达；再往后，将继续做好音乐内容的优先识别模型和混合语种识别模型，最终实现个性化的识别和响应。

　　目前，发条团队共有20多人，主要是产品和技术人员。谈到未来发展，达达表示将会继续做好面向用户的APP，优化在音乐垂直领域的模型，同时把能力连接到耳机、音箱等硬件上，通过与厂商合作，逐步探索商业化。

　　36氪认为，语音助手与垂直场景的结合是智能语音未来的发展方向。但是，如何选择好场景，如果做到智能化、生活化的理解，是摆在各个厂商面前的难题。音乐是最佳领域吗？欢迎关注智能语音助手行业的创业者、投资人与我们分享、交流观点，36氪将持续关注这一领域。

免责声明：本站所有信息均搜集自互联网，并不代表本站观点，本站不对其真实合法性负责。如有信息侵犯了您的权益，请告知，本站将立刻处理。联系QQ：1640731186