Tag: numpy

如何在列上使用尾随行来计算同一列| pandasPython

我想弄清楚如何比较列的前一行的元素与pandasDataFrame中当前行上的不同列。 例如: data = pd.DataFrame({'a':['1','1','1','1','1'],'b':['0','0','1','0','0']}) 输出: ab 0 1 0 1 1 0 2 1 1 3 1 0 4 1 0 现在我想创build一个新的列,询问是否(data ['a'] + data ['b'])大于同一列的前一个值。 从理论上讲: data['c'] = np.where(data['a']==( the previous row value of data['a'] ),min((data['b']+( the previous row value of data['c'] )),1),data['b']) 所以我可以理论上输出: abc 0 1 0 0 1 1 0 0 […]

如何将数据框转换为Python中的数组?

我从excel中读取数据如下: import numpy as np import pandas as pd Location = r'C:\temp\test.xlsx' data = pd.read_excel(Location, '4bar', header=0, parse_cols=0) data Out[80]: 10V 11V 0 -60.531006 -31.539307 1 -2.547607 -30.776367 2 58.487549 48.569336 3 72.220459 74.509277 4 64.591064 74.509277 5 54.672852 60.013428 我想把“10V”和“11V”列放到两个数组中。 为了处理具有滤波器系数的数据。 但我不知道如何将列复制到数组或如何直接在DataFrame中访问/操作元素? 任何人都可以给我一个提示吗? 谢谢。

使用Pandas从Dataframe的两列中过滤非数字数据

我正在加载一个有很多数据types(从Excel加载)的Pandas数据框。 两个特定的列应该是浮动的,但偶尔一个研究人员随机发表评论,如“未测量”。 我需要删除任何两列之一的值不是数字的行,并在其他列中保留非数字数据。 一个简单的用例看起来像这样(真正的表有几千行…) import pandas as pd df = pd.DataFrame(dict(A = pd.Series([1,2,3,4,5]), B = pd.Series([96,33,45,'',8]), C = pd.Series([12,'Not measured',15,66,42]), D = pd.Series(['apples', 'oranges', 'peaches', 'plums', 'pears']))) 结果在这个数据表中: ABCD 0 1 96 12 apples 1 2 33 Not measured oranges 2 3 45 15 peaches 3 4 66 plums 4 5 8 42 pears 我不清楚如何到达这个表格: […]

保存一个numpy数组作为jpg格式的io.BytesIO

我正在使用xlsxwriter插入图像到Excel代码中的Python代码。 现在,我有opencv过程后的图像数据(numpy数组)。 我想插入这个图像数据,以优秀。 但是xlswriter只支持io.BytesIOstream。 问题:我不知道如何将numpy数组转换为jpg格式的io.BytesIO 。 我已经尝试numpy.tostring,但没有JPG格式。 _f = open('test.jpg') # I would like to insert test.jpg worksheet.insert_image('E2', 'abc.jpg', {'image_data': _f.read()}) 任何人都可以帮助我? 非常感谢。

将numpy数组转储到excel文件中

我想使用savetxt方法将numpy数组转储到excel文件中,但在控制台上出现这个奇怪的错误: .18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e') Process finished with exit code 1 这是我想转储的numpy数组的细节: [[[ 0.47185326 0.07954808 0.02773202 …, 0.05631305 0.08299649 0.03780528] [ 0.62651747 0.06029205 0.01570348 …, 0.03766847 0.06287122 0.02287979] [ 0.72675145 0.04626036 0.0107195 …, 0.02535284 0.04664176 0.01519825] …, [ 0.10476404 0.57678992 0.04675674 …, 0.02255989 0.06741234 0.0170289 ] [ 0.13148287 0.47490281 0.06038339 …, 0.03263607 0.07844847 0.02505469] [ 0.14134221 0.35699606 0.07600202 […]

通过Pandas和Numpy.ndarraytypes将Excelmatrix转换为JSON

我正在从Excel文件中读取matrix。 matrix看起来像这样: 10100300 10100400 10100500 10100600 10100200 243 0 42 54 10100300 243 23 42 5443 10100400 243 110 42 543 10100500 243 0 432 543232342 10100600 243 440 42 544 10100700 243 0 42 54 最终,我希望将其转换为一个字典列表,最后是一个JSON文件。 这看起来像这样: [{"Origin" : 10100200, "Destination" : 10100300, "flow" : 243}, {"Origin" : 10100400, "Destination" : 10100300, "flow" : […]

pandas:将特定的Excel单元格值读入一个variables

情况: 我使用pandas来parsing工作簿中的单独Excel( .xlsx )工作表,使用以下设置: Python 3.6.0和Windows 7 x64.上的Anaconda 4.3.1 Windows 7 x64. 问题: 我一直无法find如何设置一个variables到一个特定的Excel工作表单元格值,例如var = Sheet['A3'].value 'Sheet2'使用pandas ? 题: 这可能吗? 如果是这样,怎么样? 我曾经尝试过: 我已经通过pandas在dataframe和各种论坛上的文档进行了search,但没有find答案。 我知道我可以解决这个使用openpyxl (我可以指定一个单元格坐标),但我想: 使用pandas – 如果可能的话; 只能在文件中读取一次。 我input了numpy ,以及pandas ,所以能够写: xls = pd.ExcelFile(filenamewithpath) data = xls.parse('Sheet1') dateinfo2 = str(xls.parse('Sheet2', parse_cols = "A", skiprows = 2, nrows = 1, header = None)[0:1]).split('0\n0')[1].strip() 'Sheet1'被读入'data'是好的,因为我有一个函数来收集我想要的范围。 我也试图从单独的表格( […]

将分组的项目保存到不同的Excel表单

我有一个excel文件,我想根据列名“步骤号”进行分组。 并想要相应的值。这里是我写的一段代码: import numpy as np import pandas as pd import matplotlib.pyplot as plt fpath=('/Users/Anil/Desktop/Test data.xlsx') df=pd.read_excel(fpath) data=df.loc[:,['Step No.','Parameter','Values']] grp_data=pd.DataFrame(data.groupby(['Step No.','Values']).size().reset_index()) grp_data.to_excel('/Users/Anil/Desktop/Test1 data.xlsx') 数据被分组,就像我想要的那样。 Step No. Values 1 62 1 62.5 1 63 1 66.5 1 68 1 70 1 72 1 76.5 1 77 2 66.5 2 67 2 69 3 75.5 3 77 […]

用NumPy重现Excel的LINEST函数

我必须使用Excel的LINEST函数来计算线性回归中的错误。 我希望用Numpy的polyfit函数重现结果。 我希望重现以下LINEST用法: LINEST(y's, x's,,TRUE) 与polyfit。 我不知道如何让这两个函数产生相同的值,因为我没有尝试过类似的结果。 我尝试了以下内容: numpy.polyfit(x,y,3) 和其他各种价值在第三的位置。

Matplotlib:使用.csv直接导入和绘制多个时间序列

我有几个电子表格包含以逗号分隔(.csv)文件保存为以下格式的数据:第一行包含列标签作为string('时间','Parameter_1'…)。 数据的第一列是时间,每个后续列都包含相应的参数数据,如浮点数或整数。 我想在同一个图上绘制每个参数与时间的关系,参数图例直接来自.csv文件的第一行。 我的电子表格具有不同数量的(列)参数,可以根据时间绘制; 所以我想find一个通用的解决scheme,这也将直接从.csv文件派生的列数。 附加的最小工作示例显示了我试图使用np.loadtxt(减去图例)实现的; 但我找不到从.csv文件中导入列标签以使用此方法制作图例的方法。 np.genfromtext提供了更多的function,但我不熟悉这一点,并正在努力find一种方法来使用它来做到上述。 从.csv文件中以这种风格绘制数据必须是一个常见问题,但是我一直无法在网上find解决scheme。 我非常感谢您的帮助和build议。 非常感谢 """ Example data: Data.csv: Time,Parameter_1,Parameter_2,Parameter_3 0,10,0,10 1,20,30,10 2,40,20,20 3,20,10,30 """ import numpy as np import matplotlib.pyplot as plt data = np.loadtxt('Data.csv', skiprows=1, delimiter=',') # skip the column labels cols = data.shape[1] # get the number of columns in the array for n in range […]