V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
vvtoo
V2EX  ›  问与答

如何增加听歌识曲的识别率

  •  
  •   vvtoo · 2016-06-24 22:30:41 +08:00 · 1590 次点击
    这是一个创建于 3072 天前的主题,其中的信息可能已经有所发展或是发生改变。
    soundhound, shazam, google 和网易对以下这段
    https://www.instagram.com/p/BG9-xDUoh7d/
    都没有识别成功。
    用编辑软件对音频做了一些简单的编辑,去对话,加一些拼接,还是没有成功。
    请问有什么好办法对一些时长较短的歌曲片段进行识别吗?
    编了那么多理由,有高手知道链接里的歌曲叫什么吗...
    谢谢!
    7 条回复    2016-06-25 13:26:39 +08:00
    fcicq
        1
    fcicq  
       2016-06-24 22:45:41 +08:00
    虽然没听楼主贴的是什么, 不过识曲做的是和现有库中的相似度识别, 而不幸的是这些系统的设计者根本就不了解乐理就把问题基本搞定了, 就和现在做机器翻译的专家也不是语言学家一样.
    rubytek
        2
    rubytek  
       2016-06-25 09:29:09 +08:00
    @fcicq 这叫幸运。我每开除一个语言学家,语音识别的准确率就上升一点。
    Aquamarine
        3
    Aquamarine  
       2016-06-25 11:22:53 +08:00
    估计可能是人声太强,背景音太弱,所以不好识别,建议楼主消除人声试试。
    不过背后这段音乐是已有音乐么?而不是为了电影专写的配乐?
    fcicq
        4
    fcicq  
       2016-06-25 13:06:18 +08:00
    @rubytek 你说的这确实是事实. 但是不懂乐理的声音搜索不太可能搜索到原唱以外的歌曲.
    rubytek
        5
    rubytek  
       2016-06-25 13:19:00 +08:00
    @fcicq 目前主流的原声和哼唱识别算法都是基于音频特征提取后进行检索的,跟乐理没有半毛钱关系。就好像懂棋理的人赢不了阿法狗一样,像棋理、乐理这种在垂直领域内积累了不过数千年的所谓规则,不过是人类这个群体的一点点小经验罢了。放在宇宙长河中,如同过家家一般。
    rubytek
        6
    rubytek  
       2016-06-25 13:21:42 +08:00
    @vvtoo 比较难处理,你可以试着按视频中人声部分的频率进行滤波,把背景音乐提出来(效果不一定好,伴奏提取本来就是技术难点。而且这个视频内容太杂了,不仅仅是唱歌)。然后调用下原声检索的 API 即可。
    fcicq
        7
    fcicq  
       2016-06-25 13:26:39 +08:00
    @rubytek 但是有音感的人可能就那么不喜欢用了. 最近个人好像有了一点根据和弦序列识曲的能力, 因为用现成服务注定搜不到是很有压力的. 有极少数软件确实支持这件事, 但是小众需求就没人管了.
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   4562 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 09:54 · PVG 17:54 · LAX 01:54 · JFK 04:54
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.