V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
iOS 开发实用技术导航
NSHipster 中文版
http://nshipster.cn/
cocos2d 开源 2D 游戏引擎
http://www.cocos2d-iphone.org/
CocoaPods
http://cocoapods.org/
Google Analytics for Mobile 统计解决方案
http://code.google.com/mobile/analytics/
WWDC
https://developer.apple.com/wwdc/
Design Guides and Resources
https://developer.apple.com/design/
Transcripts of WWDC sessions
http://asciiwwdc.com
Cocoa with Love
http://cocoawithlove.com/
Cocoa Dev Central
http://cocoadevcentral.com/
NSHipster
http://nshipster.com/
Style Guides
Google Objective-C Style Guide
NYTimes Objective-C Style Guide
Useful Tools and Services
Charles Web Debugging Proxy
Smore
lllllin
V2EX  ›  iDev

录制视频结束,自动生成字幕,目前 APP 有这样的技术吗?

  •  
  •   lllllin · 2019-12-19 08:58:47 +08:00 · 20426 次点击
    这是一个创建于 1800 天前的主题,其中的信息可能已经有所发展或是发生改变。

    目前的需求是录制视频结束就自动生成字幕……想知道市面上现在有这样的 APP 么,

    49 条回复    2020-05-13 23:16:29 +08:00
    ozuikai
        1
    ozuikai  
       2019-12-19 09:06:05 +08:00 via iPhone   ❤️ 2
    试下快影 可以一键生成字幕
    fredcc
        2
    fredcc  
       2019-12-19 09:09:58 +08:00
    谷歌 pixel4 recorder 支持英文实时字幕
    aainidexiho
        3
    aainidexiho  
       2019-12-19 09:12:02 +08:00
    学习眼
    lllllin
        4
    lllllin  
    OP
       2019-12-19 09:15:44 +08:00
    @fredcc 是让在 APP 开发一个这样的功能😆
    lllllin
        5
    lllllin  
    OP
       2019-12-19 09:16:48 +08:00
    @ozuikai 看了一下和里面的字幕识别差不多😆😆😆
    lllllin
        6
    lllllin  
    OP
       2019-12-19 09:17:53 +08:00
    @aainidexiho App Store 没搜到这个 APP 啊
    easonHHH
        7
    easonHHH  
       2019-12-19 09:18:10 +08:00
    网易见外有提供 API
    li02
        8
    li02  
       2019-12-19 09:23:11 +08:00
    当然有
    hereIsChen
        9
    hereIsChen  
       2019-12-19 09:23:52 +08:00
    涉及两点:
    1.语音识别,语音转文字
    2.自动校对时间轴
    好像一些云厂商已经有相关技术,
    如腾讯云 ASR,会生成这种格式的,
    "[0:0.000,0:2.260,0] 腾讯云语音识别欢迎您。\n"
    binbinyouliiii
        10
    binbinyouliiii  
       2019-12-19 09:26:06 +08:00
    人人影视有
    airmour
        11
    airmour  
       2019-12-19 09:26:56 +08:00
    抖音有这个功能 自动生成字幕
    lllllin
        12
    lllllin  
    OP
       2019-12-19 09:27:35 +08:00
    @hereIsChen 对,就是这个意思,要转文字+时间轴 1 楼发的快影上确实有这样的功能
    miniwade514
        13
    miniwade514  
       2019-12-19 09:29:22 +08:00 via iPhone
    @lllllin 估计是“插眼,学习”的意思
    jason19659
        14
    jason19659  
       2019-12-19 09:30:28 +08:00
    没有。。。怎么的得先上传语音然后语音识别。百度倒是有实时语音识别。。https://ai.baidu.com/tech/speech/realtime_asr 但是也不开放给普通员工啊
    tsening
        15
    tsening  
       2019-12-19 09:31:59 +08:00
    抖音可以 2333
    Moyudawang
        16
    Moyudawang  
       2019-12-19 09:32:37 +08:00
    小米相机可以在录制时实时生成字幕
    lllllin
        17
    lllllin  
    OP
       2019-12-19 09:35:27 +08:00
    @jason19659
    @tsening 让我照着抖音做我也做不出来啊 233333333
    lllllin
        18
    lllllin  
    OP
       2019-12-19 09:40:08 +08:00
    @tsening
    @jason19659 刚才把抖音断网了试了一下,需要联网使用,算法是云计算在服务器的………………
    qzhai
        19
    qzhai  
       2019-12-19 09:41:15 +08:00
    锤子科技, 坚果 pro3 的大爆炸。 炸音频。。。
    460881773
        20
    460881773  
       2019-12-19 09:53:17 +08:00
    有的吧。
    upbenoit
        21
    upbenoit  
       2019-12-19 10:08:33 +08:00
    是 srt 字幕还是直接内嵌视频里的吖?内嵌视频的美颜相机就可以了。。
    mclxly
        22
    mclxly  
       2019-12-19 10:15:07 +08:00
    我实现过非实时的:把视频的语音分离,通过语音文件生成字幕文件,然后合并到视频。
    yisheyuanzhang
        23
    yisheyuanzhang  
       2019-12-19 11:12:59 +08:00   ❤️ 1
    前几天看到论坛上有人发过,Golang 的,https://www.v2ex.com/t/627277
    看样子是截取为音频文件,调阿里录音文件识别接口
    SteveLee
        24
    SteveLee  
       2019-12-19 11:15:58 +08:00
    powerpoint 可以在演示的时候拾取麦克风的声音实时生成字幕
    haozes
        25
    haozes  
       2019-12-19 11:19:51 +08:00   ❤️ 1
    传到 youtube 上,youtube 会自动生成字幕。然后把字幕文件下载下来,还有时间轴,这是免费的
    https://zhuwei.me/y2b/
    ansonsiva
        26
    ansonsiva  
       2019-12-19 11:20:50 +08:00
    科大讯飞有,但是收费的
    录制完成后还可以搜索文字来定位视频位置
    sizhengping
        27
    sizhengping  
       2019-12-19 11:31:18 +08:00
    @haozes YouTube 支持中文吗?
    lllllin
        28
    lllllin  
    OP
       2019-12-19 12:03:39 +08:00
    @mclxly
    @ansonsiva 字幕文件生成了有时间轴的位置吗……
    mclxly
        29
    mclxly  
       2019-12-19 12:21:22 +08:00
    @lllllin 有时间轴位置,中文需要考虑换行处理,识别准确率一般,总的来说还是省了很多事。

    具体可以试用我的 wx 小程序(小视频神器)智能字幕功能。
    jielong
        30
    jielong  
       2019-12-19 12:24:08 +08:00
    🔨
    longbye0
        31
    longbye0  
       2019-12-19 12:42:59 +08:00
    很多。
    我老东家的 Wide 短视频就有。
    poporange630
        32
    poporange630  
       2019-12-19 12:52:05 +08:00 via iPhone
    剪映就有 是抖音旗下的剪辑软件
    IGJacklove
        33
    IGJacklove  
       2019-12-19 12:53:08 +08:00
    YouTube 就有吧,可以根据声音生成字幕。YouTube 可以直播自动生成字幕
    x66
        34
    x66  
       2019-12-19 12:58:55 +08:00
    前几天 Redmi K30 发布会上卢伟冰专门讲了这个功能,MIUI 应该都支持的
    benjix
        35
    benjix  
       2019-12-19 13:04:35 +08:00 via iPhone
    Python 有个 autosub 库
    flyhaozi
        36
    flyhaozi  
       2019-12-19 13:20:11 +08:00
    利用微软 Azure 的 Video Indexer 是可以实现这种功能的,不知道市面上有没有
    https://vi.microsoft.com/zh-hans/#speechToTextHeading
    wxl1380610
        37
    wxl1380610  
       2019-12-19 13:33:41 +08:00
    公司项目需要 , 试过 google 和 ibm watson , google 还是比较强大 语言多 , 价钱低 , 中文不知道那个好些 ,中文觉得还是国内的服务商应该会更好些 .

    https://cloud.google.com/speech-to-text/
    https://www.ibm.com/watson
    muzuiget
        38
    muzuiget  
       2019-12-19 14:55:28 +08:00
    按准确率还是用大厂的云服务比较好,但是价格就是感人。
    GoTop
        39
    GoTop  
       2019-12-19 15:39:38 +08:00
    @hereIsChen #9

    可是是收费的
    xomix
        40
    xomix  
       2019-12-19 15:45:44 +08:00
    @wxl1380610 #37 咦 ibm 这个王八蛋当年卖了 ViaVoice 给微软,现在又搞出来一套新的?小娜跟着干爹一起气鼓鼓想打人
    pnongrata
        41
    pnongrata  
       2019-12-19 15:56:22 +08:00
    苹果自己的 Clips 就支持一边录视频一边自动生成字幕……

    并且各种语言都可以………………
    lllllin
        42
    lllllin  
    OP
       2019-12-19 16:56:17 +08:00
    @pnongrata 但是自己怎么出来这样的东西呢🤣
    mlboy
        43
    mlboy  
       2019-12-19 18:57:24 +08:00 via iPhone
    Youtube 了解一下
    wxl1380610
        44
    wxl1380610  
       2019-12-19 19:05:29 +08:00
    @xomix 哈哈 记得几年前 有一次公司开年会 搞了台 小娜 调戏 还挺惊艳的
    PixelMage
        45
    PixelMage  
       2019-12-19 19:27:47 +08:00
    autosub 了解一下 gayhub 开源
    ViggoSite
        46
    ViggoSite  
       2019-12-20 09:15:36 +08:00
    你可以试试我的开源项目,是一个能识别视频语音自动生成字幕 SRT 文件的开源 Windows 软件,基于 Golang。

    https://github.com/wxbool/video-srt-windows
    hereIsChen
        47
    hereIsChen  
       2019-12-20 09:24:00 +08:00
    @GoTop 如果是纯个人使用,可以考虑上面他们说的方法,但是如果是要做产品,商业化,那么还是要用收费的;关键就是要货比三家,看看哪家识别度高性价比高
    kimiszc
        48
    kimiszc  
       2019-12-20 10:43:11 +08:00
    Apple 自己有一个 app,不知道是否符合你的需求。
    https://apps.apple.com/cn/app/%E5%8F%AF%E7%AB%8B%E6%8B%8D/id1212699939
    lbj96347
        49
    lbj96347  
       2020-05-13 23:16:29 +08:00
    https://github.com/lbj96347/auto-caption-mac/

    迟些移植一个 iOS / iPadOS 上的版本,视频使用教程:
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5670 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 01:40 · PVG 09:40 · LAX 17:40 · JFK 20:40
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.