V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
liangjie123
V2EX  ›  分享创造

GitHuber.info:自动统计某个 GitHub 帐号的重要信息

  •  1
     
  •   liangjie123 · 2015-01-04 22:12:49 +08:00 · 9089 次点击
    这是一个创建于 3610 天前的主题,其中的信息可能已经有所发展或是发生改变。
    最近这几周一直在做这个东西,简单说来,输入GitHub用户名,可以利用GitHub的API自动统计出这个人的各方面信息,比如个人信息、项目信息等等,非常方便。

    http://githuber.info

    大家没事可以去玩玩看啊~有什么意见建议也欢迎提出~

    最后解释一下oauth的事情,我们的oauth没有要求任何权限,你在授权的时候可以看GitHub的权限说明,我们只能拿到public的数据。之所以要oauth授权,唯一的目的就是突破GitHub调用API的次数限制。如果不授权,每个IP每小时只能调用60次GitHub的API,但是授权之后可以调用5000次,所以不得不让大家授权。
    第 1 条附言  ·  2015-01-06 13:30:46 +08:00
    更新了周平均动态和日平均动态的统计图~~
    40 条回复    2018-01-02 15:45:28 +08:00
    lujiajing1126
        1
    lujiajing1126  
       2015-01-04 23:08:54 +08:00
    赞!
    liangjie123
        2
    liangjie123  
    OP
       2015-01-04 23:38:33 +08:00
    @lujiajing1126 多谢~~~
    zhangxiao
        3
    zhangxiao  
       2015-01-04 23:43:57 +08:00
    Nice

    看了下自己,不知道为什么代码量统计里第一名是lua (8,262,515),看数量级应该是个bug
    liangjie123
        4
    liangjie123  
    OP
       2015-01-04 23:47:28 +08:00
    @zhangxiao 代码量统计目前无法区分项目中哪些代码是手写的,哪些代码是应用了第三方库,只要出现在项目中的代码就全部会统计,可能你的某个项目引用了一个非常大的lua框架吧。。。
    zhangxiao
        5
    zhangxiao  
       2015-01-04 23:50:09 +08:00
    @liangjie123 呃.. 不好意思,我自己问题。以前写过一个wow插件 ;)
    liangjie123
        6
    liangjie123  
    OP
       2015-01-04 23:50:11 +08:00
    @zhangxiao 还有就是代码量的单位是Byte。。。我也知道这个很操蛋,不过确实不是行数。。。
    liangjie123
        7
    liangjie123  
    OP
       2015-01-04 23:50:26 +08:00
    @zhangxiao 哈哈 高端
    GhostFlying
        8
    GhostFlying  
       2015-01-04 23:52:20 +08:00
    试了下,感觉还不错,就是速度有点慢
    liangjie123
        9
    liangjie123  
    OP
       2015-01-04 23:54:09 +08:00
    @GhostFlying 嗯,目前的实现是纯前端+API,文件全部host在GitHub上,而且大量调用了GitHub的API,所以比较慢。不过我们用LeanCloud实现了大缓存,第二次打开就会快很多了~~之后这边会继续优化的!
    spacewander
        10
    spacewander  
       2015-01-04 23:59:13 +08:00
    Cool!我以前也想做个类似的应用,但是后来放弃了……
    lsmgeb89
        11
    lsmgeb89  
       2015-01-05 00:04:35 +08:00
    出错信息很萌哈
    liangjie123
        12
    liangjie123  
    OP
       2015-01-05 00:08:03 +08:00
    @spacewander 这个是开源的,可以来一起写代码,哈哈
    liangjie123
        13
    liangjie123  
    OP
       2015-01-05 00:08:14 +08:00
    @lsmgeb89 哈哈 被你发现了~
    lujiajing1126
        14
    lujiajing1126  
       2015-01-05 00:32:30 +08:00
    @liangjie123 我居然写了3千万行js- -我也是醉了。。速度略慢。。其他还好。。不知道有木有缓存的
    Delbert
        15
    Delbert  
       2015-01-05 01:27:29 +08:00
    thonatos
        16
    thonatos  
       2015-01-05 03:38:08 +08:00 via Android
    好吧,我也遇到访问次数问题,今天写完学年论文想赶时间完善了文档站,改到一半发现访问次数超限了,只好睡觉了。
    NSTongG
        17
    NSTongG  
       2015-01-05 05:10:55 +08:00
    @lujiajing1126 应该是算上 fork 的项目的代码量。
    NSTongG
        18
    NSTongG  
       2015-01-05 05:11:42 +08:00   ❤️ 1
    很不错,建议搞一个英文版,毕竟 GitHub 上的非中文用户还是最多的。
    liangjie123
        19
    liangjie123  
    OP
       2015-01-05 08:47:10 +08:00
    @lujiajing1126 那个代码量的单位是Byte不是行数~~缓存目前做了一些,第二次查询时候就会快很多了
    @thonatos 哈哈 这个确实很蛋疼
    @NSTongG 其实目前代码量统计已经去掉了fork项目 不过自有项目中可能会包含一些第三方库 所以总代码量应该会大于实际代码量
    xcv58
        20
    xcv58  
       2015-01-05 09:00:38 +08:00
    建议统计代码量的时候从 commit 记录里统计。
    xcv58
        21
    xcv58  
       2015-01-05 09:01:38 +08:00
    这个网站貌似功能多点 https://osrc.dfm.io 但交互没你们做得好。
    liangjie123
        22
    liangjie123  
    OP
       2015-01-05 09:10:09 +08:00
    @NSTongG 确实,我昨天用GitHub的API大致查了一下,现在GitHub的总注册用户已经超过了1000W,但是location里面有China的只有3W多,即使乘10也只占3%。。。英文版势在必行啊
    其实翻译成英文倒是问题不大 关键是不知道去哪找老外用。。。
    liangjie123
        23
    liangjie123  
    OP
       2015-01-05 10:11:57 +08:00
    @xcv58 commit其实一样 如果用到了第三方库 那加入第三方库的那个commit中还是会包含第三方库的代码。。。如何区分第三方库和自己写的代码是个大难题啊 我们也一直没找到好办法。。。

    其实最早我就是看到osrc那个网站才知道可以这么做 哈哈 我们再研究研究那个的功能 多谢啦!
    hcymk2
        24
    hcymk2  
       2015-01-05 10:22:08 +08:00
    我fork别人的代码也算啊?
    format
        25
    format  
       2015-01-05 10:38:03 +08:00
    以前见过类似的,还会计算每行代码的价格, 得出这个coder的价值 0 0.
    liangjie123
        26
    liangjie123  
    OP
       2015-01-05 11:12:04 +08:00
    @hcymk2 fork的库不会计算代码
    @format 这么厉害。。。还记得网址吗?我去看看
    xcv58
        27
    xcv58  
       2015-01-05 11:13:41 +08:00
    @liangjie123 你可以用 commit author 的用户名和邮箱啊。
    format
        28
    format  
       2015-01-05 11:34:50 +08:00
    @liangjie123 gurudigger上的一个东西,刚才看了下。 链接已经没了 - -
    hcymk2
        29
    hcymk2  
       2015-01-05 11:40:40 +08:00
    @liangjie123
    抱歉。 看错了 ,不算fork的代码量。
    liangjie123
        30
    liangjie123  
    OP
       2015-01-05 12:09:18 +08:00
    @xcv58 嗯 这个思路可以过滤掉其他人提交的代码 我们思考一下 主要是成本太高 要调用超级多次GitHub的API。。。
    @hcymk2 没事~还有什么问题尽管提
    hufuman
        31
    hufuman  
       2015-01-05 12:19:40 +08:00
    有乱码,头像下面的绿色按钮里。
    hufuman
        32
    hufuman  
       2015-01-05 12:21:54 +08:00
    还有现在的方式不利于分享我的信息给别人看,因为带了Token,其实可以做下缓存,发现没有Token的时候,尽量用缓存,不行再走队列请求,反正几天内不会有大量的提交
    xcv58
        33
    xcv58  
       2015-01-05 12:21:55 +08:00
    @liangjie123 你的意思是用 Get a single commit 实现。需要每个 commit 都调用一遍吗?
    special
        34
    special  
       2015-01-05 12:34:56 +08:00
    @Delbert 我也是 js 最多... 可我是 Ruby、Android 程序员啊。囧
    liangjie123
        35
    liangjie123  
    OP
       2015-01-05 19:25:14 +08:00
    @hufuman 哈哈 那个其实就是问号~token确实是个问题 多谢你的建议!我们看下怎么处理比较好


    @xcv58 嗯 一次应该能拿到多个commit 不过相比之下会比拿一次总量多出很多次请求 主要这个项目是纯前端实现的 性能方面实在捉急 如果是服务器端的话倒是不在乎这些了。。。


    @special 是不是项目当中引用了许多js库啊?暂时确实没有办法分辨项目中哪些是自己写的 哪些是第三方代码
    cattail
        36
    cattail  
       2015-01-06 17:08:25 +08:00
    需要增加org仓库代码的统计
    cj1324
        37
    cj1324  
       2015-01-06 18:11:20 +08:00
    有意思, 赞。
    awkun
        38
    awkun  
       2015-01-06 18:17:34 +08:00
    nice~
    liangjie123
        39
    liangjie123  
    OP
       2015-01-06 22:40:07 +08:00
    @cattail 也有一些朋友提出统计组织,我们正在研究,非常感谢你的建议,敬请期待~


    @cj1324 多谢~~

    @awkun 堃哥也逛v2ex啊 哈哈
    xjtushilei
        40
    xjtushilei  
       2018-01-02 15:45:28 +08:00
    能否有开源代码的地址?
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2733 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 05:40 · PVG 13:40 · LAX 21:40 · JFK 00:40
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.