在Python中select正确的值
总体概述:
我正在创build一个大型数据集的graphics,但是我已经创build了一个示例文本文档,以便更容易地克服这些问题。 数据来自Excel文档,将被保存为CSV。
问题:
我能够编译数据,它将图表(见下文)然而,我怎么拉数据将不适用于所有不同的Excel表格,我将要脱离。
更详细的问题:
正在从数字26和31(参见图片和代码)的Excel表中拉出Y值(标记的“值”和“值1”)。 这是一个问题,因为值26和31对于每个图都不相同。
让我们看看这个更有意义。 这是我的代码
import pandas as pd import matplotlib.pyplot as plt pd.read_csv('CSV_GM_NB_Test.csv').T.to_csv('GM_NB_Transpose_Test.csv,header=False) df = pd.read_csv('GM_NB_Transpose_Test.csv', skiprows = 2) DID = df['SN'] Value = df['26'] Value1 = df['31'] x= (DID[16:25]) y= (Value[16:25]) y1= (Value1[16:25]) """ print(x,y) print(x,y1) """ plt.plot(x.astype(int), y.astype(int)) plt.plot(x.astype(int), y1.astype(int)) plt.show()
输出:
数据集:
在下面的评论中,你会发现0bin到我的数据集这是因为我没有足够的声望发布两个链接。
正如你可以从数据集看到的
X- DID = Blue Y-Value = Green Y-Value1 = Grey Troublesome Values = Red
再次的问题是,Y值的数据从第10行和第11行的SN值中的值26,31被拉出
让我知道是否需要更多的信息。 谢谢
不知道你为什么要创build转置的CSV版本。 也可以直接从您的原始数据中工作。 例如:
import pandas as pd import numpy as np import matplotlib.pyplot as plt df = pd.read_csv('CSV_GM_NB_Test.csv', skiprows=8) data = df.ix[:,19:].T data.columns = df['SN'] data.plot() plt.show()
这会给你:
您可以使用pandas.DataFrame.ix()
为您提供使用整数位置的数据的切片版本。 [:,19:]
说给你19
列以后。 最后的T转换它。 然后可以使用.columns
将SN
列的值作为列标题.columns
来指定名称。