从Excel工作表中捕获具有RegEx的date

我知道捕获一个date通常是一个足够简单的RegEx任务,但我需要这个如此具体以至于我挣扎。

1 SUSTAINABLE HARVEST SECTOR | QUOTA LISTING JUN 11 2013 2 QUOTA 3 TRADE ID AVAILABLE STOCK AMOUNT PRICE 4 130196 COD GBW 10,000 $0.60 5 130158 HADDOCK GBE 300 $0.60

这就是我的Excel电子表格的开始,以及更多的样子,date和数据变化,但格式保持不变。

我的想法是捕获后面列出的所有东西,直到换行符为止……然后将非数字( JUN )放在我的交易月列中,将第一个捕获的数字( 11 )放在我的交易日列中,并放置最后捕获的数字( 2013 )在我的贸易年的专栏…但我无法弄清楚如何。 以下是我到目前为止:

 pattern = re.compile(r'Listing(.+?)(?=\n)') df = pd.read_excel(file_path) print("df is:", df) a = pattern.findall(str(df)) print("a:", a) 

但是没有任何回报。 任何帮助解决这个问题,我知道可能是超级简单的,表示赞赏。 谢谢。

使expression式不区分大小写(即LISTING != Listing ):

 pattern = re.compile(r'Listing(.+?)(?=\n)', re.IGNORECASE) 

另外,在这种情况下换行符的前瞻可以归结为平等的expression:

 pattern = re.compile(r'Listing(.+)', re.IGNORECASE) 

在这里看到你的工作模式