V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
这是一个专门讨论 idea 的地方。

每个人的时间,资源是有限的,有的时候你或许能够想到很多 idea,但是由于现实的限制,却并不是所有的 idea 都能够成为现实。

那这个时候,不妨可以把那些 idea 分享出来,启发别人。
dapangyu
V2EX  ›  奇思妙想

设计“通用语”,从而尽可能消除翻译时所产生的误差问题。

  •  
  •   dapangyu · 2021-03-14 15:11:24 +08:00 · 2538 次点击
    这是一个创建于 1348 天前的主题,其中的信息可能已经有所发展或是发生改变。
    众所周知,把文字从一种语言翻译到另一种语言的时候,译文的含义和原文的含义会出现误差,有时误差会严重影响理解。而翻译所产生的误差大致可分为几类(具体另外讨论),其中之一则是词不达意,有的词汇所表达的意思,在另一种语言里,是找不到与这个意思所对应的词汇的。

    说得更具体一点。从数学角度上讲,将所有“含义”的集合命名为 M ( meaning )。任一词汇 A 都对应着 M 的一个子集 M_A,而在翻译词汇 A 的时候,则寻找一词汇 B,使得 B 所对应的子集 M_B 尽可能接近 M_A (接近的定义另外讨论)。

    有时原文语言中的某词汇 S 非常独特(或是译文语言词汇过于缺乏),任何译文语言中的其他词汇 B 所对应的子集 M_B 都与 M_S 相差甚远,此时翻译所造成的误差就会相当大。

    或许在未来会设计一种语言作为通用语,这种语言包含的词汇可以(几乎)对应任何别的语言里的词汇,让翻译误差不至于夸张。探讨此“通用语”的可行性以及实用价值。

    (如果上文中有错漏之处还请指出)
    16 条回复    2021-03-18 17:25:36 +08:00
    Darkatse
        1
    Darkatse  
       2021-03-14 15:22:50 +08:00 via Android
    现在想要建造巴别塔还为时过早
    rekulas
        2
    rekulas  
       2021-03-14 15:59:31 +08:00
    就我所知,如果没有"官方"指定的翻译,很多学术词翻译都是这样来的
    某个专 /业余翻译家将 EN_A 翻译成了 ZH_A
    BCD 在再次翻译 or 使用翻译词的时候觉得 ZH_A 不错,也沿用了这个说法
    随着 ZH_A 的被引用次数越来越多,权重越来越大,后续就会越倾向于使用 ZH_A,最后就变成了"官方"翻译

    基本思想跟论文和 PR 权重类似,引用的越多,越权威,例如 blockchain-区块链 就是这样来的,虽然最开始并不是专业翻译 /专业机构这样叫的,但是大家都觉得好都在用,现在相当于官方翻译了

    但是要靠人力来提前定义新词的各个语言的标准说法,工作量太大了,太难实现
    所以我估计更可行的是做一个平台?如果要翻译新词汇就都把每个人的想法 push 上去,然后以后翻译词汇采用 star 最多的词汇,就可以避免各种千奇百怪的说法

    于是你得到了一个 transhub
    rekulas
        3
    rekulas  
       2021-03-14 16:02:21 +08:00
    有点跑题了,不过说起来英语在某些时候已经担任了部分新事物通用语的功能了,例如 CPU,单独创建个通用语则不够现实
    no1xsyzy
        4
    no1xsyzy  
       2021-03-15 02:16:24 +08:00
    > 这种语言包含的词汇可以(几乎)对应任何别的语言里的词汇

    这个语言 a 和任意语言 X
    你想说的是 a -> X 是永远可行的,还是 X -> a 是永远可行的?即,该语言是所有语言的交集还是所有语言的并集?
    二者是不可能共存的。
    可行性甚至不如所有人共用同一种语言。
    Contextualist
        5
    Contextualist  
       2021-03-15 11:16:53 +08:00
    借助一个通用语言作为翻译的桥梁并不能解决语言间差异的问题。如果把所有语言的词汇(假设有 N 个)放在一个超高维度的空间,通用语言的词汇就像是这些词汇的 K-means clustering 的中心点。中心点为 N 个时就是现在的翻译系统,中心点小于 N 个时就会同时牺牲表达能力和互译的精确度。另外,有些语言间的差异远超过词汇层面的差异,比如有的语言的一些独特句子结构是很难用另一个语言表示的。

    @no1xsyzy 作为接收信息的工具的话,感觉 “X -> a 永远可行” 稍微实际一点;作为一个交换信息的系统,“a -> X 是永远可行” 则是一个表达能力弱且不精确的系统。
    no1xsyzy
        6
    no1xsyzy  
       2021-03-15 12:19:37 +08:00   ❤️ 1
    @Contextualist 其实也不实际。人们之所以产生一种语言之间能够相互翻译的感觉,是因为大部分人用的是印欧语系的语法结构。就算区分屈折语和分析语,仍然意味着存在一种 “主体(主语、主题部分、本体) - 声明(谓语、描述部分、命题)” 的对应关系。即使省略,也只是 “省略”,而不是没有(通常是通过谓词的不同衍变或者上下文暗示)。但世界上存在一些语言根本没有主语,比如只有 “跑”,用印欧语系的话解释就是 “跑这一动作发生了”,只有这样的句子。这也影响到传统哲学的术语和一般构造。
    (《一般系统论:基础、应用和发展》 贝塔朗菲 1968 )

    也有听说过,某个土著民族的语言中包含了一整套传统医学。整个语言就是该民族的传统医学体系。有人尝试了把这个医学体系搬运到其他语言中去,结果就是整个体系崩溃了,消失了。

    也有说,妥协在阿拉伯语(?)中是单方面妥协的意思,导致联合国的协调专员闹了个乌龙。(《谈判力》)
    Contextualist
        7
    Contextualist  
       2021-03-15 13:36:00 +08:00
    @no1xsyzy 哈哈,没想到能在这里遇见正经的语言学讨论。作为多数人的语言(如中文、英文)的使用者,我们的确容易将自己语言中的许多句法和语法规则想当然地推导到其他语言。语言对人的思维方式有着更深的影响。

    那个包含其传统医学体系的语言莫非是 The Linguists 那部纪录片里提到的 Kallawaya ?

    另外想补充一下,其实早在上个世纪就有各种出于不同目的的实用人工语言的探索,推广的阻力基本上都是由于大家更习惯使用自己的母语和已经被广泛使用的自然语言。让我印象比较深的是以词汇中立和减少歧义表达为目的的逻辑语( Lojban )。
    tsening
        8
    tsening  
       2021-03-16 09:42:34 +08:00
    第二代世界语?
    no1xsyzy
        9
    no1xsyzy  
       2021-03-16 09:47:02 +08:00
    @Contextualist 只是一旦稍微接触到点(指高中图书馆一本语言学的薄书)就会有意识地发现这一角度,我更多地从哲学上去考虑。

    另有一说认为语言的结构存在于人脑。几乎所有的语言都是二值逻辑,一说正是因为神经元的状态是二值的。超二值逻辑的自然产生需要多个神经元的有效联动。

    贝塔朗菲立( 1968 )认为科技的发展可以通过数学等 “非人性化” 的设施自动地演绎出来(这里 “自动” 并不是指不需要人工参与,而是相对于 “能动” 来说会缺乏人类的主观干扰)。
    一个结果是,“爱因斯坦以后的科学对于大众来说是不可理解的”。比如相对论只需要知道光速不变就能推导出大部分内容。量子力学则是黑体辐射强行内插法,甚至量子化假设的引入最初普朗克自己都不相信。
    namelosw
        10
    namelosw  
       2021-03-16 12:58:06 +08:00
    其实英语在这方面反而比较好, 词汇量大概念多. 本土语言, 拉丁语, 法语, 还有现代世界各地语言的集大成者.

    不过我感觉其实有很多词汇没必要存在, 我理想中的“通用语”是反过来的, 去除一些不必要词汇的精简语言.

    比如 value 和 worth, 其实就是拉丁词汇和日耳曼词汇, 一个比较高级一个比较 low, 因为有了这两个词, 就会逐渐分化这两种用法, 成为固定的 idiom. 但是假如历史不一样, 同时受更多文化的影响, 可能也可以有不止两个, 所以这个问题是无限的, 感觉如果是一个通用语的话, 不如把这些概念折叠回一个, 需要描述必须用词组直接描述, 而不是一个晦涩的和文化历史相关的词汇, 这样才能比较通用.

    中文也有类似的例子, 中文词汇会融入很多情感的褒贬和评判, 比如侵略一定程度上是负面词汇, 即使我们进攻其他地方, 也很少说我们“侵略”某地. 但是英文是完全可以说自己 invade 其他地区的.

    可想而知, 不同的文化价值取向不同, 每个词汇都会有大量微妙的情感差异(比如假设一个类似维京文化的语言“侵略”就是带有褒义的), 如果要有一个全集的“通用语”, 那词汇量就会指数级爆炸了. 而且新时代的通用语, 也不应该揉进这么多价值观, 特别是很多惯用的语言体现的价值其实是不太符合现代的, 如果真的需要一个通用语, 去除这些评判的部分, 中立一些会更好更长久(因为现代价值观在未来也会有很多被视为落后价值观).

    PS: 举个语言之间不好翻译的例子, 复仇者联盟里面的“复仇 /avenge”在中文怎么翻译都不合适, 在英语里面就特别自然, 但是实际上这个和文化相关性就非常强, 不是翻字典就够的.
    Contextualist
        11
    Contextualist  
       2021-03-16 13:00:46 +08:00
    (以下内容与本帖关系不大)
    @no1xsyzy 啊,个人感觉人类目前对语言的本质和大脑的工作原理都理解得太少了。

    科学理论说白了就是:基于一个或多个假设,演绎出一套自洽的系统,而后,如果这套系统能解释我们在世界中观测的结果,那很好。与之相比,(我感觉)人们日常的思考会更倾向于使用归纳而非演绎。这是我对你所指的科学的“非人性化”的理解。因此当科学发展到需要用来解释日常观测不到的现象(接近光速的运动和原子层面的尺度)时,用归纳法来理解就会有些难度。
    tikazyq
        12
    tikazyq  
       2021-03-16 13:34:26 +08:00
    最好进化到用眼神交流,这样就不存在语言一说了,你的问题都不存在了
    borisz
        13
    borisz  
       2021-03-16 15:27:34 +08:00
    神圣的卡拉连接着我们
    shyrock
        14
    shyrock  
       2021-03-16 17:55:36 +08:00
    实名反对 up 的第一句话:众所周知,把文字从一种语言翻译到另一种语言的时候,译文的含义和原文的含义会出现误差。
    实际上误差绝大部分不是在原文到译文这个环节产生的,在读者阅读译文转换为自身的理解这个环节会根据读者的知识水平、情感倾向以及语言使用能力产生更多相对于作者原意的偏差。
    如果发明通用语言,要么为了易于学习和理解而缩减词库,这样翻译精度会上升,但是表达能力会下降,某种意义上说也引入了更大的误差;
    要么为了满足不同人的不同特定需求而包容一个大词库,结果是表达能力够强了但是学习成本极高,大部分人对新语言的掌握程度参差不齐,从而导致翻译误差无解。
    IvanLi127
        15
    IvanLi127  
       2021-03-16 21:12:44 +08:00 via Android
    不是有一个叫 世界语的东西嘛
    907285792
        16
    907285792  
       2021-03-18 17:25:36 +08:00
    历史已经做出了回答 具体解决方案参见秦始皇
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5417 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 29ms · UTC 06:47 · PVG 14:47 · LAX 22:47 · JFK 01:47
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.