背景
已知有一个 github 项目基本上是我需要用的: https://github.com/serg-plusplus/meeper (本地监听会议音频,利用 Whisper 实时生成字幕,最后可以总结会议内容)。
为什么要使用这个而不用 otter ai ,fireflies ai 那些呢?第一,那些产品需要侵入到会议(需要添加一个 bot 并且录制会议内容)——其他参会者可能不同意/感觉不适。第二,会议内容会泄露给第三方,存在隐私担忧。
目前这个 Meeper 是我找到的最接近的解决方案(只支持浏览器加入会议)。唯一的遗憾是,它并没有实现 Speaker Diarization(识别不同声音,并且在会议纪要中区分开来)。
需求
有没有人熟悉 Whisper 以及相关项目( WhisperX ),可以在 Meeper 的基础上进行修改,添加 Speaker Diarization 这个 feature 。(会议记录中,每一条都在前方加入 Speaker X:用以区分发言人。如果可以的话,每一条都加上时间戳更好了)。
可以用到的相关资源: https://github.com/m-bain/whisperX https://github.com/pavelzbornik/whisperX-FastAPI https://whisperapi.com/ (或者其他类似的 API 服务——但是可能同样涉及隐私问题,偏向于仅使用 OpenAI 的 API )
联系
如果有大神有能力帮忙改这个插件,不胜感激!联系 WX:MjM1MTE4Mzk=