V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  sakila  ›  全部回复第 1 页 / 共 2 页
回复总数  33
1  2  
2020-04-08 14:47:19 +08:00
回复了 xiao38245 创建的主题 程序员 三年爬虫需要什么技能树?
@scukmh 三年爬虫经验:
1. 熟练使用 python 编写爬虫两年
2. 坐牢一年
----
谢谢兄弟, 有被笑到
2020-04-08 08:31:55 +08:00
回复了 xiangyuecn 创建的主题 程序员 正则 \s 不同语言的差异 \u0020 \u00A0 快来入坑吧😂
回复不能用 markdown?? 题主将就看吧
2020-04-08 08:31:22 +08:00
回复了 xiangyuecn 创建的主题 程序员 正则 \s 不同语言的差异 \u0020 \u00A0 快来入坑吧😂
关于这个问题你可以看一下字符的类别, `unicodedata.category(unichr)`可以返回 str 的常规类别([general category]( https://en.wikipedia.org/wiki/Unicode_character_property)). 比如中文或一些外文的的声调符号的 category 是`Mn`.

`unicodedata.normalize(form, unistr)`可以返回 Unicode 字符串 unistr 的普通形式“form”, 有`NFC`, `NFKC`, `NFD`和`NFKD`等, 详细解释见[unicode equivalence]( https://en.wikipedia.org/wiki/Unicode_equivalence)

比如一段代码:

```python
>>> s = 'Ślusàrski'
>>> print(s)
'Ślusàrski'
```

现在是 NFC composition 形式, 也就是'Ś' = 'Ś'

转换成 NFD decomposition 形式:

```python
>>> print(ascii(unicodedata.normalize('NFD','Ślusàrski')))
'S\u0301lusa\u0300rski'
```

'Ś' = 'S\u0301'

因此可以写一个 unicode_to_ascii 的函数:

>>> s = 'Ślusàrski'
>>> def unicode_to_ascii(s):
>>> return ''.join(c for c in unicodedata.normalize('NFD', s)
>>> if unicodedata.category(c) != 'Mn')
>>> print(unicode_to_ascii(s))
Slusarski
```

不知道是否满足题主的问题
2020-04-07 20:25:31 +08:00
回复了 sakila 创建的主题 分享发现 分享个好玩的,看 19 年哪个大学的学生在 github 提交最多
@jackchao7432 样本不合理,所以这是一个没有意义的统计
-------
确实不合理,确实意义小,看个乐呵就行

@qwertqwert12345 说样本不合理的人,可以想一想怎么才能囊括所有

我直接说:不可能
-------
同意, 基本不能囊括所有人, 特别是 github 不像 linkedin, google scholar 有明确的个人认证机制

@telnetning 楼主怕是不知道某些高校甚至不提供邮箱或者很难申请到
-------
我还真不知道有的高校不提供邮箱, 直觉不太可能吧
即使邮箱在中国高校不怎么常用, 不至于没有吧

@cht1995 想 cv 一下结果花了五分钟都没注册好 😔
-------
哈哈复现过程比较复杂, 代码的技术含量并不复杂

@Perry 很多学校自建 GitLab 或者 GitHub Enterprise,这些信息应该不是公开的?
-------
同意 不过内网的东西 谁也拿不到吧

@fengyiqicoder 大部分经常编程的同学还是会用学校邮箱的,毕竟有免费的高级帐号可以用
-------
对 比如我 但是我校 laji 邮箱死活收不到 github 验证 于是作罢
2020-03-27 17:29:26 +08:00
回复了 sakila 创建的主题 分享发现 分享个好玩的,看 19 年哪个大学的学生在 github 提交最多
@fish267 对 因为邮箱后缀是硬的标识
2019-10-12 11:27:54 +08:00
回复了 wanwushengzhang 创建的主题 程序员 求助! 总被刷票,大佬们给支支招?
@lscho 如果涉及到羊毛的话,加个短信验证码之类的提高刷票成本就行了。
----------------------------------------------------
加短信验证码会不会同时提高自己的成本呢
@sakila 用这俩纯粹因为电脑上装着,顺手。如果没装这俩我可能现在会用记事本
我觉得工具不是目的,关键是意识。千万不要陷入一个误区:如果我有了 XXX 工具,我就会 XXX
同理:如果我买了 XXX,我就会 XXX
记住:工具永远是是一个手段,而些什么才是重要的东西。
我一般用 notepad++或 vscode
YouTube 视频看你设置的画质啊,我 720p 的显示器也可以开 4k 画质,跟显示器没关系
2019-08-08 09:14:16 +08:00
回复了 sakila 创建的主题 问与答 大家用笔记本时用鼠标吗?
一年后更新:
arctouch 真香。
笔记本从 surface book 换成了 xps15.
@HolosLee 谷歌的实例不支持 IPV6,但是谷歌的负载均衡是支持的。我用这个原理建了校园网免流。也就是说我用 ssr 等协议连接到谷歌负载均衡的 IPV6 地址,然后负载均衡用内网连接到我的实例,实例来访问 IPV4 网站并且包转发给负载均衡,负载均衡再通过 IPV6 将信息传给我。当时全网没有这种思路,我一路摸爬滚打做出来后特别有成就感。
1  2  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5418 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 41ms · UTC 03:31 · PVG 11:31 · LAX 19:31 · JFK 22:31
Developed with CodeLauncher
♥ Do have faith in what you're doing.