在转换为csv Pythonpandas的同时,只从xls的第一行删除\ n个字符
Excel的第一行包含每个单元格中带有\ n字符的单词。 例如:
月“东中北\\(NSA)”\\“东北中\南(南)
所以,当使用此代码转换为csv时:
data_xls = pd.read_excel('/home/scripts/usless/HP_PO_hist.xls', 'sheet1', index_col=4,skiprows=3) data_xls.to_csv('HH_PO_output.csv', encoding='utf-8')
它将\ n之后的字符转换为新的行,如:
,月,“东北中环 (NSA)“,”东中北部“ (SA)“,”东南中环“ (NSA)“,”东南中环“
但预期的产出是这样的:
月东中北部(NSA)东中北部(SA)东南中部(NSA)东南中部(SA)
如何删除这个\ n字符只能从这个索引行转换为Python df中的csv?
我用了下面的虚拟数据框:
import pandas as pd columns=["Month", "East North Central\n(NSA)", "East North Central\n(SA)", "East South Central\n(NSA)"] df = pd.DataFrame(columns=columns)
当通过df.to_csv
导出到csv时,我得到了相同的换行符(pandas 0.19.2):
,Month,"East North Central (NSA)","East North Central (SA)","East South Central (NSA)"
对此的一个解决scheme是简单地用这样的空格replace\n
:
df.columns = df.columns.str.replace("\n", " ")
这提供了期望的结果:
,Month,East North Central (NSA),East North Central (SA),East SouthCentral (NSA)