This topic created in 3982 days ago, the information mentioned may be changed or developed.
是这样,我现在把 HBase 当作一个中转站,所以需要读取一定量的数据后再写进 hdfs 中,但效率比原始直接读写 dhfs 还要差,我觉得主要原因是因为我只是用单缓冲,所以耗时主要在这里了。双缓冲提升应该会有提升,但还是不如用文件流快,所以问题就是 HBase 怎么流式的读取呢?
另外 HBase 在表的设计上有什么更好的优化呢?我所知道的只是 column family 不宜过多