想了解下大数据时代大网站都是怎么处理高并发的,最好能举个例子说明.本人菜鸟一只 - - 现在连mysql 几百并发都搞不定啊

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

Recommended Services

› Amazon Web Services

› LeanCloud

› New Relic

› ClearDB

这是一个创建于 4164 天前的主题，其中的信息可能已经有所发展或是发生改变。

并发

搞不定

菜鸟

18 条回复 • 1970-01-01 08:00:00 +08:00

Livid

MOD

2013-06-30 01:16:12 +08:00

大数据需要的也是大机器，而且是不止一台大机器。当你手上有一堆大机器时，需要做的就是设计一个能够应对灾难状况的架构，及尽可能在流量高峰能够吃透这些机器的性能。到一家大公司参与一个有规模的项目，是学习这些技术最快的方式。

likuku

2013-06-30 01:41:25 +08:00

「现在连mysql 几百并发都搞不定啊」

烂的SQL语句可以让机器表现变慢1万倍。

充分利用缓存了没？用好缓存能解决绝大部分「性能问题」。

web静态缓存(varnish/squid)，对象内存缓存(memcached)，db 查询缓存，等等。

jjx

2013-06-30 08:59:22 +08:00

都是靠横向和纵向扩展的

业务系统的关系数据库查询和插入都很复杂的，就算你能把操作平均到10毫秒，一秒也就能处理100个，但实际情况是远远达不到。但你可能通过扩展多个工作进程达到n倍的性能改进。

但最终，数据库又是瓶颈，你只好再对数据库做扩展（但对关系数据库做扩展都比较麻烦），或使用内存数据库。很多人使用mongdb, 无非就是他标称的快和所谓的扩展能力。

kennedy32

2013-06-30 10:43:45 +08:00

可以考虑把数据库分离出来，aws或者aliyun都有提供单独的数据库服务器

dongbeta

2013-06-30 10:46:57 +08:00

高性能MySQL ＋靠谱的生产环境项目

timepast

2013-06-30 13:38:32 +08:00

@likuku 只用了memcache

timepast

2013-06-30 13:39:32 +08:00

@Livid 确实需要这样一个机会

akalanala

2013-06-30 13:57:30 +08:00

搞着几百并发的事, 操着几千万并发的心... 楼主还是先歇歇吧.

keakon

2013-06-30 14:02:58 +08:00

1. 尽量别依赖数据库来实现数据的关联关系。
知乎内部的 MySQL 使用准则中，就禁止使用 JOIN、GROUP BY、子查询和外键。
说实话，这等于使用非关系型数据库了。

2. 查询主要靠缓存和索引。
但千万别乱加缓存和索引，它们和表的结构、业务逻辑、使用频率之间有且只有一个最优解。
你只能靠经验和测试来寻找，而且越到后期，这些就越难改动。

做到这 2 点还有瓶颈的话，基本也是价值不菲司了，也不会缺有经验的 DBA 了。
这时的瓶颈主要在写了，就通过分离读写、分库、使用 SSD 的方式来满足吧。这部分我也不熟。