• 请不要在回答技术问题时复制粘贴 AI 生成的内容
wcwcxiaobin
V2EX  ›  程序员

有没有比 whisper large v3 更准更强的

  •  
  •   wcwcxiaobin · 6h 21m ago · 650 views
    我平时用来输出词级字幕,最近测试了 qwen 的 asr 感觉准确率和时间戳都不是很准啊。。
    10 replies    2026-06-02 15:39:29 +08:00
    106npo
        1
    106npo  
       6h 18m ago
    比 large v3 更准的是 medium. large 不管是中文还是日文,幻觉太多了
    heartleo
        2
    heartleo  
       6h 16m ago
    380cc
        3
    380cc  
       5h 56m ago
    @106npo 想问问,whisper large v3 精准度比 large v2 好吗?我记得我以前用的时候,large v3 结果比 large v2 要差啊,用的 whisper kit.
    ahci
        4
    ahci  
       5h 51m ago
    感觉 v3 不如 v2 ,尤其是处理日语方面
    neteroster
        5
    neteroster  
       5h 50m ago via Android
    那太多了,中文的话豆包,多语言的话

    elevenlabs ,soniox
    wcwcxiaobin
        6
    wcwcxiaobin  
    OP
       5h 44m ago
    @106npo 我一直以为它这个模型越大,越准,时间戳也越准
    wcwcxiaobin
        7
    wcwcxiaobin  
    OP
       5h 43m ago
    @ahci 你是懂日语的
    jackOff
        8
    jackOff  
       5h 32m ago
    https://github.com/RVC-Boss/GPT-SoVITS 这个项目我用 whisper large v3 跑似乎还行?其他的没有测过
    106npo
        9
    106npo  
       5h 29m ago
    @380cc v3 在大多数情况下没 v2 好,我曾经记得 openai 自己也承认这一点,不过现在找不到来源了.
    wcwcxiaobin
        10
    wcwcxiaobin  
    OP
       5h 25m ago
    @106npo 那我试试 v2
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3285 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 39ms · UTC 13:04 · PVG 21:04 · LAX 06:04 · JFK 09:04
    ♥ Do have faith in what you're doing.