爱意满满的作品展示区。
august

二千万条数据的一些分析

  •  
  •   august · Nov 1, 2013 · 7183 views
    This topic created in 4577 days ago, the information mentioned may be changed or developed.
    首先感谢某酒店提供的数据。

    页面在这里:

    http://august.hk/2000w.html

    没事拿来练习一下 sql, 有些校准,有些忽略,大致上准确。

    欢迎提供更多统计意见。
    Supplement 1  ·  Nov 1, 2013
    追加了星座統計,天秤躺槍
    34 replies    1970-01-01 08:00:00 +08:00
    senghoo
        1
    senghoo  
       Nov 1, 2013 via iPad
    Goodjob
    liuhk388
        2
    liuhk388  
       Nov 1, 2013 via iPhone
    地区分布那张亮了
    问一下图是用什么做的?
    drush
        3
    drush  
       Nov 1, 2013 via iPad
    drush
        4
    drush  
       Nov 1, 2013 via iPad
    ...點錯,不是圖,用Google chart 做的
    liuxurong
        5
    liuxurong  
       Nov 1, 2013
    看不到 图??
    cctvsmg
        6
    cctvsmg  
       Nov 1, 2013
    yelite
        7
    yelite  
       Nov 1, 2013   ❤️ 1
    我做了个生日的统计发现9月和10月出生的特别多,有9.9%和9.5%, 相对来讲3月到6月出身就比较少,最低的好像是7.8%
    Mihuwa
        8
    Mihuwa  
       Nov 1, 2013 via iPhone
    很有意思的表
    DearMark
        9
    DearMark  
       Nov 1, 2013
    喜闻乐见系列
    august
        10
    august  
    OP
       Nov 1, 2013
    @cctvsmg 我没想到统计入住时间,另外我发现82年的人是最多的,但如果地址是“香港” 的,所有生日都好像是默认为“19821228”,不知你有没有去除。
    august
        11
    august  
    OP
       Nov 1, 2013
    @yelite 生日这个我觉得要跟身份证号码来校验而身份证又分15位同18位,而且有上面的情况出现,略复杂,不会用sql来做,所以没做过统计。
    ChiangDi
        12
    ChiangDi  
       Nov 1, 2013
    越年輕,男女差別越小;經濟越發達地區人越多;排名第一的居然是張偉
    kurtrossel
        13
    kurtrossel  
       Nov 1, 2013
    看女性年龄分布,三十如狼果然不是盖的
    yelite
        14
    yelite  
       Nov 1, 2013
    @august 我没有看birthday字段,只看非重复18位身份证的,然后从身份证里提取生日,数量大概有1800w吧。

    待我学一下数据展示的js,也像你这样做个网页出来
    detailyang
        15
    detailyang  
       Nov 1, 2013
    数据库地址多少。从网上下的解开来全错的 = =。也想练练手
    imganquan
        16
    imganquan  
       Nov 1, 2013
    贊,做得非常棒。
    felix021
        17
    felix021  
       Nov 1, 2013
    我前两天用它来跑压测了。。
    august
        18
    august  
    OP
       Nov 1, 2013
    @detailyang 就在百度網盤一搜一大把
    cctvsmg
        19
    cctvsmg  
       Nov 1, 2013
    @august 也只过滤了一下一些明显有错误的
    csx163
        20
    csx163  
       Nov 1, 2013
    @august
    @cctvsmg

    怎么做的啊,手写sql么,除了使用excel都很麻烦的样子
    august
        21
    august  
    OP
       Nov 1, 2013
    @csx163 用 sql 跑到數字再填上去畫出來
    romisanic
        22
    romisanic  
       Nov 1, 2013
    赞!做的很不错啊
    光数据量搞来玩玩也不错
    romisanic
        23
    romisanic  
       Nov 1, 2013
    呃。。。天蝎仅次于天枰了。。。
    aku
        24
    aku  
       Nov 1, 2013
    好像男的总数比女的多很多 -_-!
    yelite
        25
    yelite  
       Nov 1, 2013
    gmbsfd
        26
    gmbsfd  
       Nov 1, 2013
    男的好多....
    Cambean
        27
    Cambean  
       Nov 1, 2013
    图很好看!打开速度也很快,这个是预先生成好的吗?
    tontech
        28
    tontech  
       Nov 1, 2013
    双子座的好少啊。。。
    tonitech
        29
    tonitech  
       Nov 1, 2013
    我也下载了一个,但是这个数据太大了,根本打不开。。。该怎么分析呢?
    august
        30
    august  
    OP
       Nov 1, 2013   ❤️ 1
    @Cambean 是預先跑好數據的。

    @tonitech 我是下了 csv 版的導入 mysql 裏跑的
    ydeng
        31
    ydeng  
       Nov 2, 2013
    @cctvsmg what happened on 2012年4月9日?……
    asdftu
        32
    asdftu  
       Nov 5, 2013
    赞 @august , @cctvsmg , @yelite
    byteboy
        33
    byteboy  
       Feb 15, 2014
    @august 只找到MSSQL的版本,好麻烦,还要重新安装一个sqlserver。请问哪里有直接可以导入 mysql的下载啊?方便发个网盘链接到邮箱 [email protected] 吧,非常谢谢!
    august
        34
    august  
    OP
       Feb 15, 2014
    @byteboy 找個 csv 格式的可以導入 mysql
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1070 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 85ms · UTC 22:48 · PVG 06:48 · LAX 15:48 · JFK 18:48
    ♥ Do have faith in what you're doing.