大量数据存储在 HBase 中，如何提高效率

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

For Existing Member Sign In

This topic created in 3982 days ago, the information mentioned may be changed or developed.

是这样，我现在把 HBase 当作一个中转站，所以需要读取一定量的数据后再写进 hdfs 中，但效率比原始直接读写 dhfs 还要差，我觉得主要原因是因为我只是用单缓冲，所以耗时主要在这里了。双缓冲提升应该会有提升，但还是不如用文件流快，所以问题就是 HBase 怎么流式的读取呢？

另外 HBase 在表的设计上有什么更好的优化呢？我所知道的只是 column family 不宜过多

No Comments Yet

Hbase 读取缓冲