Post on: Sep 25, 2024Last edited: Sep 25, 2024Words 00 min

type
status
date
slug
summary
tags
category
icon
password

内容提取

假定一个字符串:
[2024年9月25日09:40:41] “the string need to extract.”

单边限制提取

本例中,我们只想提取出”]”后面的内容““the string need to extract.””
这里需要注意的有两点,一是正则表达式的书写,二是使用的re方法。
pattern = r”\](.+)”
r”******”就是正则表达式的格式,类似输出格式中的f”******”
第一个字符是\]这个是反斜杠转义],因为在正则中,中括号被赋予了含义,需要转义会单纯的符号。
后面一组字符是(.+), 以组的形式而不是单字符的形式返回符合表达式的一个字符串,也就是这里不返回[”, t, h, e…]而是”"the string need to extract."“如此,括号中.+表示是字符串即可,并且匹配多个。
更多正则表达式的模式,建议找参考书或者菜鸟教程、百科上查询,就我目前的印象,还是书上会写的清楚一些。很明确用法,网上大多笼统而且含糊不清。不过我忘记了哪本书了,是学R还是MATLAB,还是就是Python的参考书里的,记不太清了。所以建议只有一点点哈哈哈。

双边限制提取

本质就是在单边的条件上加上结束条件。
这样就是找到括号中的内容。

总结归纳

个人觉得,写正则表达式需要试的次数比较多,才能找到你心中满意的表达。但是如果有高效的生产工具,例如小chat,可能会事半功倍哦!

  • Twikoo
CSV写入时设为不分列

🗒️CSV写入时设为不分列


使用参数设定Pandas.read_csv()是否读取列名

🗒️使用参数设定Pandas.read_csv()是否读取列名


Announcement
🎉欢迎来到我的博客🎉
👏欢迎更新体验👏