V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
echoless
V2EX  ›  发音

英语发音纠正软件

  •  
  •   echoless · 94 天前 · 1892 次点击
    这是一个创建于 94 天前的主题,其中的信息可能已经有所发展或是发生改变。
    1. 朗读一段文字并录音
    2. 上传录音
    3. 生成读错的单词列表已经所在的句子.

    有没有类似的软件?

    感觉所有的功能现在的技术都是可以实现的.

    工作原因, 我可以把工作的谈话录下来,然后借助软件快速纠正发音.

    30 条回复    2024-09-04 15:24:17 +08:00
    Chad0000
        1
    Chad0000  
       94 天前   ❤️ 1
    等 ChatGPT Plus 完全开放语音功能应该就行了。现在的语音经过了转换。
    echoless
        2
    echoless  
    OP
       94 天前
    @Chad0000 #1 多谢, 不是很明白. chatgpt 语音转文字或者文字转语音, 并不能纠错?
    Chad0000
        3
    Chad0000  
       94 天前   ❤️ 1
    @echoless #2
    转完了就像 V 站一样是文字了,AI 处理的是文字,肯定不知道你的发音。
    justplaymore
        4
    justplaymore  
       94 天前   ❤️ 1
    语音识别的一个目标就是能把发音不是那么清晰准确的单词也识别出来。
    哪怕是母语人士的发音也是有个体差异的,所以语音转文字是不能满足你找出“读错”的需求的。
    love060701
        5
    love060701  
       94 天前   ❤️ 1
    我知道的:
    1 、ELSA ,缺点是只能读软件提供的句子,能明确告诉你哪里发音不对;
    2 、GPT-4o 的完全版,GPT-4o 的完全版是多模态模型,支持语音输入语音输出,中间没有语音转文字的过程,写好 prompt 肯定是支持纠正发音的;
    3 、Gemini ,Gemini 支持语音多模态输入,可以直接分析。我用 Gemini 做了一个 Demo ,可以识别哪里发音错误: https://english-practice-app-nine.vercel.app/
    echoless
        6
    echoless  
    OP
       94 天前
    @love060701 #5 感谢你做的 demo, 感觉基本可用. 比我想象的好一点.

    我提一下几个改进的点:

    1. 语音输入保留, 用户可以回放. (甚至定位到说错的地方)
    用户可以练习.
    2. 支持上传语音文件. (我的需求是这个)
    3. 长语音的拆分, 比如我开会可能有一个小时长. 或者更精细的选定某个人的, 我更关心自己的.
    4. 更多的就是用户历史文件管理之类的.

    用 gpt 来分析倒是给我提供了很好的思路. 如果我有时间有可能剽窃你的 idea, 多谢!
    echoless
        7
    echoless  
    OP
       94 天前
    @justplaymore #4 这个确实有困难, 但是有明显错误的应该可以. 不需要 100%, 只要能够 50%就可以了, 毕竟用途是英语练习, 允许有错误
    enihcam
        8
    enihcam  
       94 天前   ❤️ 1
    最简单就是 Microsoft Translator 的聊天室持续录音能力,实时识别。找一本语法书大声朗读即可,错了重来,一直到连续念对三遍为止。
    love060701
        9
    love060701  
       94 天前   ❤️ 1
    @echoless 我是产品,不会写代码,这个 Demo 是我让 Sonnet 3.5 写的,再往下写有些难度,所以就只是个 Demo 。
    coolmint
        10
    coolmint  
       94 天前   ❤️ 1
    等 gpt4o 完全版了,或者找真人,其实我就比较擅长😂
    echoless
        11
    echoless  
    OP
       94 天前
    @love060701 #9 哈哈, 很厉害了.
    echoless
        12
    echoless  
    OP
       94 天前
    @coolmint #10 你百万 token 多少钱? 哈哈
    coolmint
        13
    coolmint  
       94 天前 via iPhone
    @echoless #12 哈哈,其实纠正发音这个事儿,我觉得还真未必需要量大。通常一段一分钟左右的语音文本就可以发现很多核心问题了,完后针对性改正,训练,即可。
    echoless
        14
    echoless  
    OP
       94 天前
    @coolmint #13 不开玩笑, 你怎么收费? 我现在主要是纠正明显错误的发音, 比如 receipt 这种, 如果能够及时纠正还是好的.
    echoless
        15
    echoless  
    OP
       94 天前
    不是要求发音标准读的好, 就是要基本上读对,
    mustcool
        16
    mustcool  
       94 天前
    每日英语听力
    流利说英语

    这两都可以
    coolmint
        17
    coolmint  
       94 天前
    @echoless #14 在你找到靠谱的付费服务之前,可以加个联系方式你发我几段 mp3 我给你些意见,不收费,当然肯定也不保证服务质量,本着助人为乐(我雅思口语 8 而已,也不能算是口语大拿
    FuzzySloth2
        18
    FuzzySloth2  
       94 天前 via iPhone
    一堆 pte 练习软件就是
    yoiteshaw
        19
    yoiteshaw  
       94 天前 via iPhone   ❤️ 1
    wtf12138
        20
    wtf12138  
       94 天前   ❤️ 1
    做一个产品,给三哥推广,这不血赚
    Cascable
        21
    Cascable  
       94 天前   ❤️ 1
    Rosetta Stone
    HenryHE
        22
    HenryHE  
       94 天前 via iPhone   ❤️ 2
    试试 enjoy https://github.com/ZuodaoTech/everyone-can-use-english, 前两天使用还不错,符合你诉求。
    echoless
        23
    echoless  
    OP
       94 天前
    @HenryHE #22 这个有点牛逼, 试了一下, 出了 UI 交互比较慢(我的文件比较大) , 好像很牛逼
    sloppysop
        24
    sloppysop  
       94 天前 via Android
    猩际 PTE ,有口语考试模拟
    smqk2020
        25
    smqk2020  
       93 天前
    有道 echo 支持你说的功能,效果可以自己去试用验证下,收费比较贵
    asaworld
        26
    asaworld  
       93 天前 via iPhone   ❤️ 2
    我前几天找到一个不错的纠音软件,ios 的 boldvoice ,前两天有免费的纠音课程,每天都可以免费纠音 5 次朗读,虽然不多,但坚持下来绝对强很多
    jiandandkl
        27
    jiandandkl  
       93 天前
    试了楼上的 boldvoice ,感觉还不错,有想用的兄弟可以从我的链接下,帮我白嫖点额度 https://start.boldvoice.com/RJF1YQ?d=R10&z=1
    liukjx
        28
    liukjx  
       91 天前
    试试 Enjoy 下载地址 1000h.org
    echoless
        29
    echoless  
    OP
       65 天前
    我尝试在弄, 感觉第三个目标还有点远

    https://github.com/swuecho/audio_practice

    目前我再用, 主要是朗读书籍, 然后自己听自己的声音然后记笔记.

    后续功能完善中.
    echoless
        30
    echoless  
    OP
       65 天前
    @love060701 #9 哈哈 我提出的这些功能 我基本上实现了. 再把你的 prompt 超过来就差不多了.

    我现在是把语音上传到 google ai studio
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   4157 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 10:12 · PVG 18:12 · LAX 02:12 · JFK 05:12
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.