如何用正则或者 bs4 提取日期？

V2EX 不能上传图片真麻烦。
[网页显示内容]
北京大学国际法学院（深圳）招聘传讯与市场推广专员 2016-06-13
中山大学数据科学与计算机学院印鉴教授团队 2016 年 6 月公开招聘 2 名工作人员启事 2016-06-13
华中科技大学电气学院聚变与等离子体研究所 2016 年 6 月招聘 8 名社会用工 2016-06-13
杭州师范大学钱江学院 2016 年招聘 1 名化学实验技术人员公告 2016-06-13

[代码]
...
<li><a href="http://www.pinjiao.com/gaoxiaojiaoshizhaopin/guangdonggaoxiaojiaoshizhaopin/584881.html" title="北京大学国际法学院（深圳）招聘传讯与市场推广专员" target=_blank>北京大学国际法学院（深圳）招聘传讯与市场推广专员</a> 2016-06-13</li>
<li><a href="http://www.pinjiao.com/gaoxiaojiaoshizhaopin/guangdonggaoxiaojiaoshizhaopin/584882.html" title="中山大学数据科学与计算机学院印鉴教授团队 2016 年 6 月公开招聘 2 名工作人员启事" target=_blank>中山大学数据科学与计算机学院印鉴教授团队 2016 年 6 月公开招聘 2 名工作人员启事</a> 2016-06-13</li>
<li><a href="http://www.pinjiao.com/gaoxiaojiaoshizhaopin/hubeigaoxiaojiaoshizhaopin/584879.html" title="华中科技大学电气学院聚变与等离子体研究所 2016 年 6 月招聘 8 名社会用工" target=_blank>华中科技大学电气学院聚变与等离子体研究所 2016 年 6 月招聘 8 名社会用工</a> 2016-06-13</li>
<li><a href="http://www.pinjiao.com/gaoxiaojiaoshizhaopin/zhejianggaoxiaojiaoshizhaopin/584880.html" title="杭州师范大学钱江学院 2016 年招聘 1 名化学实验技术人员公告" target=_blank>杭州师范大学钱江学院 2016 年招聘 1 名化学实验技术人员公告</a> 2016-06-13</li>

...

我现在想根据页面的日期采集相应的内容，不同的页面挺多的，日期格式也不一样，“ 2016-06-13 ”“ 2016 年 06 月 13 日”“ 06-13 ”格式有好多种，请问如果做一个通用的系统，怎样用正则表达式或者 bs4 把日期提取出来？

2016-06-13

href

招聘

bs4

13 replies • 2016-06-13 21:07:57 +08:00