Tag: scipy

曲线拟合具有未知公式(SciPy)的数据集

我试图曲线拟合Waldram图,以便我可以绘制自己的图。 我使用了一个程序,从图中得到一条曲线作为点数据,并且想要计算出公式。 我对SciPy有一个大概的了解,在我看来,你需要有一些想法,曲线的公式应该是什么,我不知道。 有没有办法解决一个最佳拟合曲线而不知道一个通​​用的公式? Waldram图 我的自定义点的Python代码

在Python(或Excel)中同步数据

我经常使用Python(偶尔Excel)来处理和比较多个实验之间的testing数据。 在某些情况下,数据可能不同步,这使得直接比较困难。 例如,典型的testing规范是: 1) Stabilize test temperature to a value of 20 +/- 2 degrees C 2) Hold test temperature at stabilized value for 15-25 seconds 3) Increase temperature by 20 degrees C at a rate of 0.5 degree C/second 对数据进行归一化是非常简单的,因此它们在时间= 0秒时都以20℃的标称温度值开始,但是我真正想要的是同步数据,使得温度斜坡同时开始。 我已经尝试了简单的algorithm来检查数据的斜率,以确定何时开始温度boost,但由于仪器导致的测量结果的局部波动导致的斜率实际上并不能反映整体温度变化率。 在Numpy,Scipy,Pandas等有function可以过滤掉这些局部波动,并确定何时实际开始增加温度。 我偶尔会在Excel中工作,所以如果在电子表格中有更方便的方法,我可以使用Excel来处理数据。 任何build议,将不胜感激。

噪音最大的公约数

我有一组数据,如下所示。 数字是未知值X的整数倍。例如:1466 = N * X,但N和X都有噪声,所以N可能不是一个完美的整数。 如果我对数据进行sorting和绘图,它看起来像是一个步骤序列,缺less一些步骤(在一个更大的数据集中)。 任何想法如何解决这个问题? 1466 4466 5671 6131 6246 7123

excel和scipy累积二项式分布p值的区别?

我有这张表(NumSucc =成功次数,NumberTrials =试验次数,Prob是成功概率): Gene NumSucc NumTrials Prob Gene1 16 26 0.9548 Gene2 16 26 0.9548 Gene3 12 21 0.9548 Gene4 17 27 0.9548 Gene5 17 27 0.9548 Gene6 17 27 0.9548 Gene7 8 15 0.9548 Gene8 10 17 0.9548 我想要一个累积二项分布P值为每一行。 当我把这个精确的表格放入excel列AD中,然后在E列中input函数(例如,对于第2行): =BINOMDIST(B2,C2,D2,1) 输出表如下所示: Gene NumSucc NumTrials Prob Binomial Gene1 16 26 0.9548 9.68009E-08 Gene2 16 […]

在Matplotlib中仿真Excel的“光滑曲线散点图”样条函数3点

我试图效仿Excel的 插入>散点图>具有平滑线条和标记的散点图 命令在Matplotlib scipy函数interpolate创build了一个类似的效果,以及如何在这里简单地实现一些很好的例子: 如何在matplotlib中绘制三次样条曲线 然而,Excel的样条algorithm也可以通过三个点(例如x = [0,1,2] y = [4,2,1])生成一条平滑的曲线。 而且不可能用三次样条来做到这一点。 我见过的讨论表明,Excelalgorithm使用Catmull-Rom样条曲线; 但是不太了解这些,或者他们如何适应Matplotlib: http ://answers.microsoft.com/en-us/office/forum/office_2007-excel/how-does-excel-plot-smooth-curves / c751e8ff-9f99-4ac7-a74a-fba41ac80300 有没有一种简单的方法来修改上面的例子,通过三个或更多点使用插值库实现平滑的曲线? 非常感谢

使单元格inputpandas数据框中列的名称

比方说,我有一个数据框(使用pandas数据分析库),看起来像这样: Unnamed Column1: 1 'Puppies' 2 6 3 15 4 13 5 12 我想让数据框看起来像这样: 'Puppies' 1 6 2 15 3 13 4 12 5 80 一个人如何转移一切,包括replace列名的条目。 有没有办法做到这一点?

Python Pandas将string转换为NaN

所以我用大pandas来阅读excel文件和csv文件。 这些文件包含string和数字不只是数字。 问题是我所有的string都被转换成了我不想要的NaN。 我不知道列的types是什么时候会提前(实际上我的工作是处理这个系统),所以我不能告诉大pandas他们将会是什么样的(后来肯定会来的)。 我只想在每个单元格中读取一个string。 这是我的代码 if csv: #check weather to read in excell file or csv frame = pandas.read_csv(io.StringIO(data)) else: frame = pandas.read_excel(io.StringIO(data)) tbl = [] print frame.dtypes for (i, col) in enumerate(frame): tmp = [col] for (j, value) in enumerate(frame[col]): tmp.append(unicode(value)) tbl.append(tmp) 我只需要能够生成列明智的二维列表,我可以做任何事情从那里。 我也需要能够处理Unicode(数据已经在Unicode)。 我如何构build'tbl',使得应该是string的单元格不会以“NaN”出现?

SciPy使用“eq”约束函数来最小化函数,但不能使用SLSQPalgorithm(最好是GRG)

我正在使用NumPy和SciPy将Excel解算器转换为python,虽然我在技术上已经将其工作,但与结果略有不同。 正在通过公式提供示例数据: array_1 = [ 0.0943417538897551, 0.0799476059590533, 0.0486689860368342, 0.052434296201351 , 0.231614207638357, 0.0808322159046283, 0.0819215585688325, 0.140991841045595, 0.189247534431047 ] matrix_1 = [ [0.0235147682238835, 0.0194641686338689, 0.0116344823277316, 0.0214041868628604, 0.010980242438382, 0.013085897256736, 0.0107928914491097, -0.000350116147653561, 0.000323182155233255], [0.0194641686338689, 0.0227374787807333, 0.0147128129866735, 0.023168038099643, 0.00899606198312112, 0.0108035747784655, 0.00989996824509696, -0.000271072225966624, 0.000337765823991017], [0.0116344823277316, 0.0147128129866735, 0.0265282312707786, 0.0140689757522423, 0.021443195995926, 0.0252024393105442, 0.0187159868856209, 0.000969972826332724, -0.0000408711850838449], [0.0214041868628604, 0.023168038099643, 0.0140689757522423, 0.0288819629130722, 0.00890430456025532, 0.00987603454385401, 0.00914278195359995, -0.000127719476583381, 0.000340663672172775], […]

什么是Excel的Beta发行版的Python等价物?

什么是Excel中的Beta版本的Python等价物? 在Excel中,公式是: =BETA.DIST(A2,A3,A4,FALSE,A5,A6). 这给出了给定参数的Beta概率密度函数,我们得到的结果是一些十进制值。 但是Python SciPy参考并没有给出与Excel相似的函数参数及其定义。 我没有得到如何在SciPy中做到这一点,并正确传递参数。

scipy curve_fit与excel

我一直在scipy.optimize curve_fit ,并将其与Excel 2010中的求解器进行比较。 虽然Python对于大数据集来说会好得多,但是Excel的非线性GRG求解器似乎比curve_fit为我的小规模实践数据集做了一个更好(也更可靠)的参数拟合工作。 Excel似乎总是趋于理性的参数猜测,并且curve_fit很容易在漂亮的select(或更多的依赖于Excel的初始条件)上漫步。 我的一个拟合function是: def f(x,a,b,c,d,e,f): return a/(abs(b)+x)**abs(c) + d/(abs(e)+x)**abs(f) 其中x是一个数组, a , b , c , d , e & f是参数。 我想知道如果有人有任何build议的曲线拟合与scipy和numpy,可能使用其他方法有效可比的Excel的方法。