在Python中select正确的值

总体概述:

我正在创build一个大型数据集的graphics,但是我已经创build了一个示例文本文档,以便更容易地克服这些问题。 数据来自Excel文档,将被保存为CSV。

问题:

我能够编译数据,它将图表(见下文)然而,我怎么拉数据将不适用于所有不同的Excel表格,我将要脱离。

更详细的问题:

正在从数字26和31(参见图片和代码)的Excel表中拉出Y值(标记的“值”和“值1”)。 这是一个问题,因为值26和31对于每个图都不相同。

让我们看看这个更有意义。 这是我的代码

import pandas as pd import matplotlib.pyplot as plt pd.read_csv('CSV_GM_NB_Test.csv').T.to_csv('GM_NB_Transpose_Test.csv,header=False) df = pd.read_csv('GM_NB_Transpose_Test.csv', skiprows = 2) DID = df['SN'] Value = df['26'] Value1 = df['31'] x= (DID[16:25]) y= (Value[16:25]) y1= (Value1[16:25]) """ print(x,y) print(x,y1) """ plt.plot(x.astype(int), y.astype(int)) plt.plot(x.astype(int), y1.astype(int)) plt.show() 

输出:

产量

数据集:

数据集

在下面的评论中,你会发现0bin到我的数据集这是因为我没有足够的声望发布两个链接。

正如你可以从数据集看到的

  X- DID = Blue Y-Value = Green Y-Value1 = Grey Troublesome Values = Red 

再次的问题是,Y值的数据从第10行和第11行的SN值中的值26,31被拉出

让我知道是否需要更多的信息。 谢谢

不知道你为什么要创build转置的CSV版本。 也可以直接从您的原始数据中工作。 例如:

 import pandas as pd import numpy as np import matplotlib.pyplot as plt df = pd.read_csv('CSV_GM_NB_Test.csv', skiprows=8) data = df.ix[:,19:].T data.columns = df['SN'] data.plot() plt.show() 

这会给你:

情节截图

您可以使用pandas.DataFrame.ix()为您提供使用整数位置的数据的切片版本。 [:,19:]说给你19列以后。 最后的T转换它。 然后可以使用.columnsSN列的值作为列标题.columns来指定名称。