type
status
date
slug
summary
tags
category
icon
password
内容提取
假定一个字符串:
[2024年9月25日09:40:41] “the string need to extract.”
单边限制提取
本例中,我们只想提取出”]”后面的内容““the string need to extract.””
这里需要注意的有两点,一是正则表达式的书写,二是使用的re方法。
pattern = r”\](.+)”
r”******”就是正则表达式的格式,类似输出格式中的f”******”
第一个字符是\]这个是反斜杠转义],因为在正则中,中括号被赋予了含义,需要转义会单纯的符号。
后面一组字符是(.+), 以组的形式而不是单字符的形式返回符合表达式的一个字符串,也就是这里不返回[”, t, h, e…]而是”"the string need to extract."“如此,括号中.+表示是字符串即可,并且匹配多个。
更多正则表达式的模式,建议找参考书或者菜鸟教程、百科上查询,就我目前的印象,还是书上会写的清楚一些。很明确用法,网上大多笼统而且含糊不清。不过我忘记了哪本书了,是学R还是MATLAB,还是就是Python的参考书里的,记不太清了。所以建议只有一点点哈哈哈。
双边限制提取
本质就是在单边的条件上加上结束条件。
这样就是找到括号中的内容。
总结归纳
个人觉得,写正则表达式需要试的次数比较多,才能找到你心中满意的表达。但是如果有高效的生产工具,例如小chat,可能会事半功倍哦!
- Author:Kecilimu
- URL:https://kecilimu-notion.vercel.app//article/20240925093807
- Copyright:All articles in this blog, except for special statements, adopt BY-NC-SA agreement. Please indicate the source!