Tag: python 3.x

Matplotlib / Pandas从Python dict / JSON生成特定的graphics

我正在寻找从特定格式的Python数据,但数据可能是文本,string,或其他Python对象的特定graphics布局。 我可以用XlsxWriter(见下面)做到这一点,但数据超载(1400万行…没有笑话,脱氧核糖核酸数据)。 是否有可能/如何使用Matplotlib或PAndas(或更稳定的大数据)? 详细信息:它必须能够实时完成 ,并根据数据是否“相同”(不pipe数字,文本或其他Python对象)进行可视格式化决策。 单元格中的着色是基于{1:"A", 2:"A"}是否相等 (不是同一个对象)。 绿色为True , 红色为False 。 例如: "A" == "A" (如前面的句子)或(10/5) == (20/10)或["A", 1, <test object at 0x1052c9b70>] == ["A", 1, <test object at 0x1052c9b70>]都是绿色的。 出现在单元格中的文本只是对象的__str__表示。 示例… { 1000:{ "Sample1":{1:"A", 2:"A"}, "Sample2":{1:"A", 2:"A"}, "Sample3":{1:"A", 2:"A"}, }, 1001:{ "Sample1":{1:"A", 2:"A"}, "Sample2":{1:"A", 2:"A"}, "Sample3":{1:"A", 2:"A"} }, 1002:{ "Sample1":{1:"C", 2:"A"}, "Sample2":{1:"A", 2:"A"}, […]

从pandas获得csv输出后,Excel函数无法正常工作

最近,我在Microsoft Excel中遇到了一件非常奇怪的事情。 我在Python 3.6中创build了一个数据框,并填充了一些整数,然后我使用“to_csv”函数来获取csv输出。 我用Microsoft Excel打开文件进行基本的统计分析和绘制一些图表,但是; Microsoft Excel不会将数字中的数字识别为数字。 例如,当我添加两个单元格时,无论数字是多less,结果都是零。 这是我的Excel环境中的截图: 在黄色单元格(C101)中,我试图获得列C中的单元格的总和,但正如我所解释的总和函数(和所有其他function,如计数或最大)不能正常工作。 我也不得不说,所有的单元格都有“Number”数据types。 我很困惑,任何build议都会有所帮助。

增加+2pandas,超越

我有一个数据框的列表。 有没有办法每个循环增加+2的增量每次? 所以我的数据框在Excel中看起来像: while True: writer = pd.ExcelWriter("C:\\xzx.xlsx") worksheet = writer.sheets['Sheet1'] df3.to_excel(writer, startrow=0, startcol=+2, index = False) dataframe: AB 2000-01-01 0.469112 -0.282863 2000-01-02 1.212112 -0.173215 2000-01-03 -0.861849 -2.104569 2000-01-04 0.721555 -0.706771 2000-01-05 -0.424972 0.567020 2000-01-06 -0.673690 0.113648 2000-01-07 0.404705 0.577046 2000-01-08 -0.370647 -1.157892 理想: ABCDE 0.469112 -0.282863 0.469112 -0.282863 1.212112 -0.173215 1.212112 -0.173215 -0.861849 -2.104569 […]

Python 3.5 | 分割列表并导出到Excel或CSV

我用Python 3.5(BeautifulSoup)刮了一个网站,结果是一个列表。 这些值存储在一个名为“project_titles”的variables中。 值如下所示: project_titles = ['I'm Back. Raspberry Pi unique Case for your Analog Cameras', 'CitizenSpring – App to crowdsource & map safe drinking water', 'Shoka Bell: The Ultimate City Cycling Tool'] 我想在逗号分隔值,并将其导出到Excel文件或CSV。 我需要在Excel中的值,如: 单元格A1:我回来了。 树莓派独特的案例为您的模拟相机 单元格B1:CitizenSpring – 应用程序来源和地图安全的饮用水 细胞C1:Shoka Bell:终极城市骑行工具

Python 3.5 | 分割列表并转换为csv

我有两个值保存在两个列表。 那些看起来像: project_titles = ['T1', 'T2', 'T3'] project_loc = ['L1', 'L2', 'L3'] 实际上,我把这个代码的值写入一个csv: with open('data.csv', 'w') as f: csv.writer(f).writerow(project_titles) 当我把csv变成excel时,我得到: 单元格A1 = T1 单元格B1 = T2 单元格C1 = T3 这很好,但我需要在CSV导出后的以下结果: 单元格A1 = T1; 单元格B1 = L1 单元格A2 = T2; 单元格B2 = L2 单元格A3 = T3; 单元格B3 = L3 你有好主意吗?

如何读取范围('A5:B10')并使用openpyxl将这些值放入数据框中

能够以类似于excel的方式定义范围,即“A5:B10”对于我所需要的非常重要,因此将整个表格读取到数据框并不是很有用。 所以我需要做的是从Excel工作表中的多个范围读取多个不同的数据框。 valuerange1 = ['a5:b10'] valuerange2 = ['z10:z20'] df = pd.DataFrame(values from valuerange) df = pd.DataFrame(values from valuerange1) 要么 df = pd.DataFrame(values from ['A5:B10']) 我已经搜查,但无论我做了一个非常糟糕的search工作,或者其他人已经得到解决这个问题,但我真的不能。 谢谢。

如何复制csv内容并粘贴到Excel工作表?

我正在使用python v3 xlwings库与MS Excel进行交互。 我有一个csv文件ToCopy.csv并希望将这个CVS文件的全部内容复制到一个Excel文件。 import xlwings as xw Book_name = 'C:/Temp/ExcelBook.xlsm' sheet_name = 'SheetName' #paste into this sheet wb = xw.Book(Book_name) sht = wb.sheets[sheet_name] 我看了xlwings的文档,但是如何开始还是处于亏损状态。 有人可以给我一个开始? 我很乐意使用其他不基于xlwings库的方法。 但是,我的Excel文件是密码保护,我知道xlwings可以处理密码保护的Excel文件。 我不确定其他方法。

Pythonmatrix输出到Excel

我试图输出4行(第一行是标题)和超过6000列的matrix。 每个列标题是来自不同文本文档的单词(第1-3行)。 我想导出为Excel,所以我可以很容易地筛选出最高的10个单词的最高频率。 我没有错误,但没有出现在Excel文件中。 我哪里错了? np.savetxt('file.csv', matrix_TF, delimiter = ',', newline = '\n', encoding='utf8')

在Python中创build一个简单的点图

我应该在一个语料库中计算n-gram,并创build一个点图,显示单词的等级和他们的计数,作为validationZipf定律的练习。 最终的结果应该是这样的: 我使用nltk来提取分布(这里仅用于unigrams): import nltk with open(r'./1.txt', 'r') as file: text = file.read() file.close() tokens = nltk.word_tokenize(text) tokens = [token.lower() for token in tokens if len(token) > 1] fdist = nltk.FreqDist(tokens) ranks = fdist.most_common() 这给了我一个所有的单词和他们的计数从最常见到最less的2元组长列表。 我想知道如何从这里出发。 我只需要在双轴飞机上绘制它。 我没有安装matpotlib / numpy,在这些库中没有任何经验。 不过,我有Microsoft Excel,所以我想知道如果我能以某种可读的格式导出这些数据并将其绘制在那里。

如何在python中创buildopenpyxl中的列表

import openpyxl infoFilePath='test.xlsx' workbook = openpyxl.load_workbook(infoFilePath,read_only=True) first_sheet = workbook.get_sheet_names()[0] worksheet = workbook.get_sheet_by_name(first_sheet) workbook.active def iter_rows(ws): for row in ws.iter_rows(): yield [cell.value for cell in row] rows = list(iter_rows(worksheet)) print(rows) 正如你所看到的,我已经成功地将打印“行”列为一个列表。 但是如何打印“列”作为列表? 当我使用ws.iter_cols()时,发生错误。