Tag: numpy

如何在列上使用尾随行来计算同一列| pandasPython: 我想弄清楚如何比较列的前一行的元素与pandasDataFrame中当前行上的不同列。例如： data = pd.DataFrame({'a':['1','1','1','1','1'],'b':['0','0','1','0','0']}) 输出： ab 0 1 0 1 1 0 2 1 1 3 1 0 4 1 0 现在我想创build一个新的列，询问是否（data ['a'] + data ['b']）大于同一列的前一个值。从理论上讲： data['c'] = np.where(data['a']==( the previous row value of data['a'] ),min((data['b']+( the previous row value of data['c'] )),1),data['b']) 所以我可以理论上输出： abc 0 1 0 0 1 1 0 0 […]

如何将数据框转换为Python中的数组？: 我从excel中读取数据如下： import numpy as np import pandas as pd Location = r'C:\temp\test.xlsx' data = pd.read_excel(Location, '4bar', header=0, parse_cols=0) data Out[80]: 10V 11V 0 -60.531006 -31.539307 1 -2.547607 -30.776367 2 58.487549 48.569336 3 72.220459 74.509277 4 64.591064 74.509277 5 54.672852 60.013428 我想把“10V”和“11V”列放到两个数组中。为了处理具有滤波器系数的数据。但我不知道如何将列复制到数组或如何直接在DataFrame中访问/操作元素？任何人都可以给我一个提示吗？谢谢。

使用Pandas从Dataframe的两列中过滤非数字数据: 我正在加载一个有很多数据types（从Excel加载）的Pandas数据框。两个特定的列应该是浮动的，但偶尔一个研究人员随机发表评论，如“未测量”。我需要删除任何两列之一的值不是数字的行，并在其他列中保留非数字数据。一个简单的用例看起来像这样（真正的表有几千行…） import pandas as pd df = pd.DataFrame(dict(A = pd.Series([1,2,3,4,5]), B = pd.Series([96,33,45,'',8]), C = pd.Series([12,'Not measured',15,66,42]), D = pd.Series(['apples', 'oranges', 'peaches', 'plums', 'pears']))) 结果在这个数据表中： ABCD 0 1 96 12 apples 1 2 33 Not measured oranges 2 3 45 15 peaches 3 4 66 plums 4 5 8 42 pears 我不清楚如何到达这个表格： […]

保存一个numpy数组作为jpg格式的io.BytesIO: 我正在使用xlsxwriter插入图像到Excel代码中的Python代码。现在，我有opencv过程后的图像数据（numpy数组）。我想插入这个图像数据，以优秀。但是xlswriter只支持io.BytesIOstream。问题：我不知道如何将numpy数组转换为jpg格式的io.BytesIO 。我已经尝试numpy.tostring，但没有JPG格式。 _f = open('test.jpg') # I would like to insert test.jpg worksheet.insert_image('E2', 'abc.jpg', {'image_data': _f.read()}) 任何人都可以帮助我？非常感谢。

将numpy数组转储到excel文件中: 我想使用savetxt方法将numpy数组转储到excel文件中，但在控制台上出现这个奇怪的错误： .18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e,%.18e') Process finished with exit code 1 这是我想转储的numpy数组的细节： [[[ 0.47185326 0.07954808 0.02773202 …, 0.05631305 0.08299649 0.03780528] [ 0.62651747 0.06029205 0.01570348 …, 0.03766847 0.06287122 0.02287979] [ 0.72675145 0.04626036 0.0107195 …, 0.02535284 0.04664176 0.01519825] …, [ 0.10476404 0.57678992 0.04675674 …, 0.02255989 0.06741234 0.0170289 ] [ 0.13148287 0.47490281 0.06038339 …, 0.03263607 0.07844847 0.02505469] [ 0.14134221 0.35699606 0.07600202 […]

通过Pandas和Numpy.ndarraytypes将Excelmatrix转换为JSON: 我正在从Excel文件中读取matrix。 matrix看起来像这样： 10100300 10100400 10100500 10100600 10100200 243 0 42 54 10100300 243 23 42 5443 10100400 243 110 42 543 10100500 243 0 432 543232342 10100600 243 440 42 544 10100700 243 0 42 54 最终，我希望将其转换为一个字典列表，最后是一个JSON文件。这看起来像这样： [{"Origin" : 10100200, "Destination" : 10100300, "flow" : 243}, {"Origin" : 10100400, "Destination" : 10100300, "flow" : […]

pandas：将特定的Excel单元格值读入一个variables: 情况：我使用pandas来parsing工作簿中的单独Excel（ .xlsx ）工作表，使用以下设置： Python 3.6.0和Windows 7 x64.上的Anaconda 4.3.1 Windows 7 x64. 问题：我一直无法find如何设置一个variables到一个特定的Excel工作表单元格值，例如var = Sheet['A3'].value 'Sheet2'使用pandas ？题：这可能吗？如果是这样，怎么样？我曾经尝试过：我已经通过pandas在dataframe和各种论坛上的文档进行了search，但没有find答案。我知道我可以解决这个使用openpyxl （我可以指定一个单元格坐标），但我想：使用pandas – 如果可能的话; 只能在文件中读取一次。我input了numpy ，以及pandas ，所以能够写： xls = pd.ExcelFile(filenamewithpath) data = xls.parse('Sheet1') dateinfo2 = str(xls.parse('Sheet2', parse_cols = "A", skiprows = 2, nrows = 1, header = None)[0:1]).split('0\n0')[1].strip() 'Sheet1'被读入'data'是好的，因为我有一个函数来收集我想要的范围。我也试图从单独的表格（ […]

将分组的项目保存到不同的Excel表单: 我有一个excel文件，我想根据列名“步骤号”进行分组。并想要相应的值。这里是我写的一段代码： import numpy as np import pandas as pd import matplotlib.pyplot as plt fpath=('/Users/Anil/Desktop/Test data.xlsx') df=pd.read_excel(fpath) data=df.loc[:,['Step No.','Parameter','Values']] grp_data=pd.DataFrame(data.groupby(['Step No.','Values']).size().reset_index()) grp_data.to_excel('/Users/Anil/Desktop/Test1 data.xlsx') 数据被分组，就像我想要的那样。 Step No. Values 1 62 1 62.5 1 63 1 66.5 1 68 1 70 1 72 1 76.5 1 77 2 66.5 2 67 2 69 3 75.5 3 77 […]

用NumPy重现Excel的LINEST函数: 我必须使用Excel的LINEST函数来计算线性回归中的错误。我希望用Numpy的polyfit函数重现结果。我希望重现以下LINEST用法： LINEST(y's, x's,,TRUE) 与polyfit。我不知道如何让这两个函数产生相同的值，因为我没有尝试过类似的结果。我尝试了以下内容： numpy.polyfit(x,y,3) 和其他各种价值在第三的位置。

Matplotlib：使用.csv直接导入和绘制多个时间序列: 我有几个电子表格包含以逗号分隔（.csv）文件保存为以下格式的数据：第一行包含列标签作为string（'时间'，'Parameter_1'…）。数据的第一列是时间，每个后续列都包含相应的参数数据，如浮点数或整数。我想在同一个图上绘制每个参数与时间的关系，参数图例直接来自.csv文件的第一行。我的电子表格具有不同数量的（列）参数，可以根据时间绘制; 所以我想find一个通用的解决scheme，这也将直接从.csv文件派生的列数。附加的最小工作示例显示了我试图使用np.loadtxt（减去图例）实现的; 但我找不到从.csv文件中导入列标签以使用此方法制作图例的方法。 np.genfromtext提供了更多的function，但我不熟悉这一点，并正在努力find一种方法来使用它来做到上述。从.csv文件中以这种风格绘制数据必须是一个常见问题，但是我一直无法在网上find解决scheme。我非常感谢您的帮助和build议。非常感谢 """ Example data: Data.csv: Time,Parameter_1,Parameter_2,Parameter_3 0,10,0,10 1,20,30,10 2,40,20,20 3,20,10,30 """ import numpy as np import matplotlib.pyplot as plt data = np.loadtxt('Data.csv', skiprows=1, delimiter=',') # skip the column labels cols = data.shape[1] # get the number of columns in the array for n in range […]