这是一个创建于 4126 天前的主题,其中的信息可能已经有所发展或是发生改变。
比如象嵌套的Table,而且可能很不规范
传下一个正则表达式的列表,循环匹配,直到正则列表为空
def extract(text,pattenList):
if len(pattenList) == 0:
return text
if len(pattenList) > 0:
patten=pattenList.pop(0)
found=filter(text,patten)
if len(found) > 0:
return extract(''.join(found),pattenList)