• 请不要在回答技术问题时复制粘贴 AI 生成的内容
dododada
V2EX  ›  程序员

没有相关经验,求大数据样本分析思路

  •  
  •   dododada · Jul 23, 2015 · 2556 views
    This topic created in 3971 days ago, the information mentioned may be changed or developed.

    要做样本分析,每个样本大概30M,有两千万的样本,大概不到600T
    没接触过过这方面的技术,所以腆着脸上来问一问
    技术随便,集群大小也不论,就是要快速的处理掉,最好2个小时内处理掉
    有没有什么可用的技术思路,可用做这种处理的,谢谢

    4 replies    2015-07-23 22:36:10 +08:00
    lujiajing1126
        2
    lujiajing1126  
       Jul 23, 2015 via Android
    etl
    dododada
        3
    dododada  
    OP
       Jul 23, 2015 via iPad
    @lujiajing1126 谢谢,我了解一下
    dododada
        4
    dododada  
    OP
       Jul 23, 2015 via iPad
    @taowen 谢谢😄
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2934 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 32ms · UTC 07:34 · PVG 15:34 · LAX 00:34 · JFK 03:34
    ♥ Do have faith in what you're doing.