zhxjdwh
V2EX  ›  问与答

使用 impala insert, hive insert 后 表查询性能出现巨大的差距?

  •  
  •   zhxjdwh · Feb 5, 2020 · 1756 views
    This topic created in 2308 days ago, the information mentioned may be changed or developed.

    源数据表是a , 目标数据表是b, 格式:parquet-snappy

    insert sql: insert owerwrite table b select * from a

    1. 使用 impala 执行 insert sql , 再用 impala 对 b 表查询
    2. 使用 hive 执行 insert sql ,再用 impala invalidate metadata/ refresh table, 再用 impala 对 b 表查询

    用 impala 查询这两种方式 生成的表数据,性能会差别非常大,impala insert的方式 比 hive insert性能要几十倍??为什么会这样子,同一个表,一模一样的数据

    No Comments Yet
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   5558 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 28ms · UTC 07:45 · PVG 15:45 · LAX 00:45 · JFK 03:45
    ♥ Do have faith in what you're doing.