V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
sakila
V2EX  ›  分享发现

分享个好玩的,看 19 年哪个大学的学生在 github 提交最多

  •  
  •   sakila · 2020-03-27 17:01:16 +08:00 · 5748 次点击
    这是一个创建于 1703 天前的主题,其中的信息可能已经有所发展或是发生改变。

    referencehttps://www.gharchive.org/

    how to use:

    image.png

    code:

    SELECT REGEXP_EXTRACT(email, r'@(.*)') domain, COUNT(*) c
    FROM (
      SELECT REGEXP_EXTRACT(payload, r'([a-zA-Z0-9_.+-]+@[a-zA-Z0-9-]+\.[a-zA-Z0-9-.]+)') email
      FROM `githubarchive.year.2019`
    )
    -- WHERE REGEXP_CONTAINS(email, r"@[a-zA-Z0-9-]+\.[a-zA-Z0-9-]")
    WHERE REGEXP_CONTAINS(email, r"@[a-zA-Z0-9-]+\.edu")
    GROUP BY 1
    ORDER BY 2 DESC
    LIMIT 500;
    

    result - wordwide:

    image.png

    result - chinese universities:

    image.png

    32 条回复    2020-04-07 20:25:31 +08:00
    wpblank
        1
    wpblank  
       2020-03-27 17:03:46 +08:00
    竟然能看到我校。。。
    fish267
        2
    fish267  
       2020-03-27 17:24:47 +08:00
    按照邮箱后缀来的? 好多同学没用 edu 吧.
    sakila
        3
    sakila  
    OP
       2020-03-27 17:29:26 +08:00
    @fish267 对 因为邮箱后缀是硬的标识
    Wondertainment
        4
    Wondertainment  
       2020-03-27 20:45:18 +08:00
    竟然能看到我校。。。
    Moverisk
        5
    Moverisk  
       2020-03-27 21:05:03 +08:00
    建议统计一下人均
    xiri
        6
    xiri  
       2020-03-27 21:13:40 +08:00   ❤️ 2
    然而不是所有人都会用学校的邮箱
    MaxSoloware
        7
    MaxSoloware  
       2020-03-27 22:04:34 +08:00
    大部分经常编程的同学还是会用学校邮箱的,毕竟有免费的高级帐号可以用
    iasuna
        8
    iasuna  
       2020-03-27 22:18:16 +08:00 via iPhone
    thu 没上榜不合理啊
    learningman
        9
    learningman  
       2020-03-27 22:24:25 +08:00 via Android
    @fengyiqicoder 那个只需要绑定就行了,主账号可以不是。
    VShawn
        10
    VShawn  
       2020-03-27 22:45:41 +08:00
    @learningman #9 +1
    我就从来没用过 edu 邮箱当主邮箱,毕竟学习的邮箱 UI 太烂了
    minami
        11
    minami  
       2020-03-27 22:51:42 +08:00
    我校计科果然彩笔,榜上无名
    litmxs
        12
    litmxs  
       2020-03-27 23:06:24 +08:00 via Android
    一般学校邮箱都做的挺烂的,而且名字老长老长(十几位的学号 @mails.xxxx.edu.cn ),除非有什么教育优惠一般很少人用这玩意。
    zst
        13
    zst  
       2020-03-27 23:08:49 +08:00 via Android
    不知道有没算上私有库诶 用了 overleaf 同步一天提交好几次
    AngryPanda
        14
    AngryPanda  
       2020-03-27 23:23:59 +08:00
    竟然看不到我校
    aragakiyuii
        15
    aragakiyuii  
       2020-03-27 23:27:10 +08:00 via Android
    看见 bjtu 恍惚了一下😂还以为是我校
    Mistwave
        16
    Mistwave  
       2020-03-28 02:09:57 +08:00 via iPhone
    竟然能看到我校.......
    Perry
        17
    Perry  
       2020-03-28 02:12:43 +08:00
    很多学校自建 GitLab 或者 GitHub Enterprise,这些信息应该不是公开的?
    wmc
        18
    wmc  
       2020-03-28 03:41:07 +08:00   ❤️ 1
    nyu.edu 排名国外第一的原因可能是因为 NYU 邮箱是 life-time 的,很多毕业生都在用……

    而没有清华的原因,大概是因为,清华学生的邮箱是 [email protected] ,并且绝大多数学生都不用……
    ra1983
        19
    ra1983  
       2020-03-28 03:48:48 +08:00 via Android
    nyu 不但是 lifetime 的,还能设置 alias,不存在楼上说的学号 @xxx.edu 的问题。
    yech1990
        20
    yech1990  
       2020-03-28 04:00:02 +08:00 via Android
    估计是用 [email protected] 匹配的学校吧?
    国内很多学校的邮箱地址又臭又长,还有像 [email protected] 这玩意的
    ldm0
        21
    ldm0  
       2020-03-28 04:40:26 +08:00
    我组成了我校的十五分之一???
    telnetning
        22
    telnetning  
       2020-03-28 07:22:43 +08:00 via Android   ❤️ 2
    楼主怕是不知道某些高校甚至不提供邮箱或者很难申请到
    cht
        23
    cht  
       2020-03-28 08:47:28 +08:00
    想 cv 一下结果花了五分钟都没注册好 😔
    Kirscheis
        24
    Kirscheis  
       2020-03-28 09:00:06 +08:00 via Android
    清华的学生邮箱是一串乱码一样的缩写,不能自己设置别名,所以学生不习惯用。北大的邮箱可以设置 3 个别名,稍微比清华的好用一点。不过我这很多人都常用自己的域名邮箱,我早年 github 上也用的 pku 邮箱,后来换成个人域名了,所以靠邮箱后缀并不怎么准。。
    alphatoad
        25
    alphatoad  
       2020-03-28 09:12:34 +08:00 via iPhone
    我校毕业后会收回邮箱,不是很乐意用
    jackchao7432
        26
    jackchao7432  
       2020-03-28 09:55:57 +08:00
    样本不合理,所以这是一个没有意义的统计
    Woodywuuu
        27
    Woodywuuu  
       2020-03-28 09:56:59 +08:00
    我校估计是最低的
    因为我校邮箱毕业不回收,可以拿去各处薅羊毛
    在 github 认证的时候会提示我上传学生证作为佐证:doge
    qwertqwert12345
        28
    qwertqwert12345  
       2020-03-28 10:43:27 +08:00
    说样本不合理的人,可以想一想怎么才能囊括所有

    我直接说:不可能
    miona
        29
    miona  
       2020-03-28 16:33:47 +08:00 via Android
    学校邮箱安全么?
    CismonX
        30
    CismonX  
       2020-03-28 16:50:27 +08:00 via iPhone
    @Woodywuuu 我怀疑我们是校友🤣
    tianxin8431
        31
    tianxin8431  
       2020-03-29 17:39:47 +08:00
    竟然能看到我校+1 。。。
    sakila
        32
    sakila  
    OP
       2020-04-07 20:25:31 +08:00
    @jackchao7432 样本不合理,所以这是一个没有意义的统计
    -------
    确实不合理,确实意义小,看个乐呵就行

    @qwertqwert12345 说样本不合理的人,可以想一想怎么才能囊括所有

    我直接说:不可能
    -------
    同意, 基本不能囊括所有人, 特别是 github 不像 linkedin, google scholar 有明确的个人认证机制

    @telnetning 楼主怕是不知道某些高校甚至不提供邮箱或者很难申请到
    -------
    我还真不知道有的高校不提供邮箱, 直觉不太可能吧
    即使邮箱在中国高校不怎么常用, 不至于没有吧

    @cht1995 想 cv 一下结果花了五分钟都没注册好 😔
    -------
    哈哈复现过程比较复杂, 代码的技术含量并不复杂

    @Perry 很多学校自建 GitLab 或者 GitHub Enterprise,这些信息应该不是公开的?
    -------
    同意 不过内网的东西 谁也拿不到吧

    @fengyiqicoder 大部分经常编程的同学还是会用学校邮箱的,毕竟有免费的高级帐号可以用
    -------
    对 比如我 但是我校 laji 邮箱死活收不到 github 验证 于是作罢
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2729 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 28ms · UTC 11:20 · PVG 19:20 · LAX 03:20 · JFK 06:20
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.