很好奇两台 AlphaGo 对战，会是怎样的厮杀场面？ - V2EX

首页注册登录

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

这是一个创建于 3252 天前的主题，其中的信息可能已经有所发展或是发生改变。

这样训练是不是更好？

21 条回复 • 2016-03-15 12:11:56 +08:00

1

ngloom

2016-03-14 10:39:36 +08:00

好像是会自我对弈做训练的 :P

2

Sequencer

2016-03-14 10:53:36 +08:00

貌似有一个阶段就是这样训练的...

3

jackwow

2016-03-14 11:04:30 +08:00

它和人在下棋的时候，当人落子之后， AlphaGo 就是在自己和自己下后面的几步，然后判断落子在哪里接下去胜率最大。

4

dxwwym

2016-03-14 11:09:35 +08:00 via iPhone

其实每走一步都在和自己下来预演，个人感觉应该是这样

5

alex321

2016-03-14 11:09:55 +08:00

人家已经明说有 18 个 AlphaGo 版本了，和李对战的是第 18 个版本，并且是单机模式。
此前 Google 一直在用 18 个 AlphaGo 做相互之间的对战训练的。。
AlphaGo 虽然是 AI ，但是是无形的，就像机器宝宝，最终那个小盒子也不过是它临时的容身之所罢了，本质上就是个应用。

6

hahastudio

2016-03-14 11:16:10 +08:00

https://deepmind.com/alpha-go.html
"..., and by reinforcement learning from games of self-play."
"This program was based on general-purpose AI methods, using deep neural networks to mimic expert players, and further improving the program by learning from games played against itself."

7

Sivan

2016-03-14 11:18:03 +08:00

详见微软小冰 vs 微博聊天机器人

8

Jackiepie

2016-03-14 11:18:42 +08:00

@alex321 记者会上我听到的是分布式版本

9

clino

2016-03-14 11:36:25 +08:00

@alex321
http://sports.sina.com.cn/go/2016-03-11/doc-ifxqhmve9078783.shtml
"这次比赛我们使用的是分布式版的 AlphaGo ，并不是单机版。分布式版对单机版的 AlphaGo 胜率大约是 70%。"

10

alex321

2016-03-14 12:00:53 +08:00

@Jackiepie
@clino

单机是这里看到的： http://www.techweb.com.cn/column/2016-03-08/2291955.shtml 呃。。。。。
我看完那个之后就没看后续的了。

11

Jackiepie

2016-03-14 12:56:11 +08:00

@alex321 之前看那些报道也是说用的单机版，但是昨天狗狗的爸爸明确的说了，虽然单击也不错，但是正式比赛只用分布式版。

12

birdccc

2016-03-14 13:22:00 +08:00

会死机吧

13

imdoge

2016-03-14 14:38:13 +08:00

@alex321 好像是记者误报了，人家说的是为了避免作弊嫌疑，没有连互联网（但是是连到了服务器集群的），结果被说成了单机版

14

charlie21

2016-03-14 14:46:39 +08:00

木遥：关于 AlphaGo 论文的阅读笔记
http://songshuhui.net/archives/93895

15

RyNex

2016-03-14 14:53:06 +08:00 via iPhone

@alex321 和李对战的是分布式

16

menc

2016-03-14 14:55:53 +08:00

4

若干月后， alphago 和 betago 两台 AI 对弈，人们已经做好看不懂两位 AI 下棋的思路的准备，可是结果还是出人意料。

alphago 执黑先走一子， betago 思考良久，认输。

17

picasso250

2016-03-14 15:30:46 +08:00

@menc 按照现在的贴目规则，更有可能是：
alphago 执黑先走一子， betago 应了一手， alphago 思考良久，认输

18

strwei

2016-03-14 19:17:26 +08:00

期待中。。。。。。

19

firstinout

2016-03-15 09:10:07 +08:00

@alex321 U R being watched

20

alex321

2016-03-15 09:18:26 +08:00

@firstinout 哈哈，后面撒玛利亚人上线的时候就变成 We are being watched 了，然后两个交叉在片首出来。

21

firstinout

2016-03-15 12:11:56 +08:00

@alex321 太赞的片子有空二刷

关于 · 帮助文档 · 博客 · API · FAQ · 实用小工具 · 3851 人在线 最高记录 6679 ·

Select Language

创意工作者们的社区

World is powered by solitude

VERSION: 3.9.8.5 · 25ms · UTC 05:12 · PVG 13:12 · LAX 21:12 · JFK 00:12
Developed with CodeLauncher
♥ Do have faith in what you're doing.