从Excel工作表中捕获具有RegEx的date
我知道捕获一个date通常是一个足够简单的RegEx任务,但我需要这个如此具体以至于我挣扎。
1 SUSTAINABLE HARVEST SECTOR | QUOTA LISTING JUN 11 2013 2 QUOTA 3 TRADE ID AVAILABLE STOCK AMOUNT PRICE 4 130196 COD GBW 10,000 $0.60 5 130158 HADDOCK GBE 300 $0.60
这就是我的Excel电子表格的开始,以及更多的样子,date和数据变化,但格式保持不变。
我的想法是捕获后面列出的所有东西,直到换行符为止……然后将非数字( JUN
)放在我的交易月列中,将第一个捕获的数字( 11
)放在我的交易日列中,并放置最后捕获的数字( 2013
)在我的贸易年的专栏…但我无法弄清楚如何。 以下是我到目前为止:
pattern = re.compile(r'Listing(.+?)(?=\n)') df = pd.read_excel(file_path) print("df is:", df) a = pattern.findall(str(df)) print("a:", a)
但是没有任何回报。 任何帮助解决这个问题,我知道可能是超级简单的,表示赞赏。 谢谢。
使expression式不区分大小写(即LISTING
!= Listing
):
pattern = re.compile(r'Listing(.+?)(?=\n)', re.IGNORECASE)
另外,在这种情况下换行符的前瞻可以归结为平等的expression:
pattern = re.compile(r'Listing(.+)', re.IGNORECASE)
在这里看到你的工作模式 。