sakila

sakila

V2EX 第 220510 号会员,加入于 2017-03-12 16:42:38 +08:00
26 S 4 B
根据 sakila 的设置,主题列表被隐藏
二手交易 相关的信息,包括已关闭的交易,不会被隐藏
sakila 最近回复了
2020-04-08 14:47:19 +08:00
回复了 xiao38245 创建的主题 程序员 三年爬虫需要什么技能树?
@scukmh 三年爬虫经验:
1. 熟练使用 python 编写爬虫两年
2. 坐牢一年
----
谢谢兄弟, 有被笑到
2020-04-08 08:31:55 +08:00
回复了 xiangyuecn 创建的主题 程序员 正则 \s 不同语言的差异 \u0020 \u00A0 快来入坑吧😂
回复不能用 markdown?? 题主将就看吧
2020-04-08 08:31:22 +08:00
回复了 xiangyuecn 创建的主题 程序员 正则 \s 不同语言的差异 \u0020 \u00A0 快来入坑吧😂
关于这个问题你可以看一下字符的类别, `unicodedata.category(unichr)`可以返回 str 的常规类别([general category]( https://en.wikipedia.org/wiki/Unicode_character_property)). 比如中文或一些外文的的声调符号的 category 是`Mn`.

`unicodedata.normalize(form, unistr)`可以返回 Unicode 字符串 unistr 的普通形式“form”, 有`NFC`, `NFKC`, `NFD`和`NFKD`等, 详细解释见[unicode equivalence]( https://en.wikipedia.org/wiki/Unicode_equivalence)

比如一段代码:

```python
>>> s = 'Ślusàrski'
>>> print(s)
'Ślusàrski'
```

现在是 NFC composition 形式, 也就是'Ś' = 'Ś'

转换成 NFD decomposition 形式:

```python
>>> print(ascii(unicodedata.normalize('NFD','Ślusàrski')))
'S\u0301lusa\u0300rski'
```

'Ś' = 'S\u0301'

因此可以写一个 unicode_to_ascii 的函数:

>>> s = 'Ślusàrski'
>>> def unicode_to_ascii(s):
>>> return ''.join(c for c in unicodedata.normalize('NFD', s)
>>> if unicodedata.category(c) != 'Mn')
>>> print(unicode_to_ascii(s))
Slusarski
```

不知道是否满足题主的问题
2020-04-07 20:25:31 +08:00
回复了 sakila 创建的主题 分享发现 分享个好玩的,看 19 年哪个大学的学生在 github 提交最多
@jackchao7432 样本不合理,所以这是一个没有意义的统计
-------
确实不合理,确实意义小,看个乐呵就行

@qwertqwert12345 说样本不合理的人,可以想一想怎么才能囊括所有

我直接说:不可能
-------
同意, 基本不能囊括所有人, 特别是 github 不像 linkedin, google scholar 有明确的个人认证机制

@telnetning 楼主怕是不知道某些高校甚至不提供邮箱或者很难申请到
-------
我还真不知道有的高校不提供邮箱, 直觉不太可能吧
即使邮箱在中国高校不怎么常用, 不至于没有吧

@cht1995 想 cv 一下结果花了五分钟都没注册好 😔
-------
哈哈复现过程比较复杂, 代码的技术含量并不复杂

@Perry 很多学校自建 GitLab 或者 GitHub Enterprise,这些信息应该不是公开的?
-------
同意 不过内网的东西 谁也拿不到吧

@fengyiqicoder 大部分经常编程的同学还是会用学校邮箱的,毕竟有免费的高级帐号可以用
-------
对 比如我 但是我校 laji 邮箱死活收不到 github 验证 于是作罢
2020-03-27 17:29:26 +08:00
回复了 sakila 创建的主题 分享发现 分享个好玩的,看 19 年哪个大学的学生在 github 提交最多
@fish267 对 因为邮箱后缀是硬的标识
2019-10-12 11:27:54 +08:00
回复了 wanwushengzhang 创建的主题 程序员 求助! 总被刷票,大佬们给支支招?
@lscho 如果涉及到羊毛的话,加个短信验证码之类的提高刷票成本就行了。
----------------------------------------------------
加短信验证码会不会同时提高自己的成本呢
@sakila 用这俩纯粹因为电脑上装着,顺手。如果没装这俩我可能现在会用记事本
我觉得工具不是目的,关键是意识。千万不要陷入一个误区:如果我有了 XXX 工具,我就会 XXX
同理:如果我买了 XXX,我就会 XXX
记住:工具永远是是一个手段,而些什么才是重要的东西。
我一般用 notepad++或 vscode
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   973 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 11ms · UTC 21:05 · PVG 05:05 · LAX 13:05 · JFK 16:05
Developed with CodeLauncher
♥ Do have faith in what you're doing.