Tag: python

为什么循环覆盖我的文件,而不是写在文本之后?

i = 1 # keep track of file number directory = '/some/directory/' for i in range(1, 5170): #number of files in directory filename = directory + 'D' + str(i) + '.txt' input = open(filename) output = open('output.txt', 'w') input.readline() #ignore first line for g in range(0, 7): #write next seven lines to output.txt output.write(input.readline()) output.write('\n') […]

如何使用Python从Excel中检索已保存的集合

我已经使用python 2.7 xlsxwriter在excel文件中保存数据。 对于检索部分,当我打印文件第一行时,它是这样的: set([u'1707242470', u'643602863', u'1677452893]) ,types是unicode 。 我把这个unicode转换成了set然后pop来,但是打印的时候什么也看不到。 问题是我如何检索保存的设置并正确地popup它们。 例如,第一个pop是1707242470 。 这里是我的代码: from xlrd import open_workbook book1 = open_workbook('processed_data.xlsx') sheet1 = book1.sheet_by_name('sheet'); # I want to pop the first element of my set in my first row set third column which is 1707242470 print (set)(sheet1.cell(0, 3).value).pop();

如何使用pandas将数据写入现有的Excel文件?

我想从一个Python模块tushare请求一些数据。 通过使用这个代码,我可以每次获得一行数据。 不过,我想每隔5秒向服务器发送一个请求,并将所有数据在4小时内放入一个excel文件中。 我注意到pandas已经build在了tushare。 如何把数据放在一起,只生成一个Excel文件? import tushare as ts df=ts.get_realtime_quotes('000875') df.to_excel(r'C:\Users\stockfile\000875.xlsx')

如何使用python连接到外部API?

我正在尝试编写一个脚本,它从循环中的Excel表中取得用户名,然后连接到网站的外部API,并从中获取用户标识,并在Excel表中给出响应。 请帮助我一个示例代码。 我需要两件事情的帮助: 1: – 如何读取Excel表格中的特定列元素 2: – 在脚本中编写一个代码,使用网站的API将循环中的Excel工作表用户名提供给用户,并检索用户标识

使用selenium下载数据

我是一个研究分析师,试图整理数据和执行分析。我需要从这个页面的数据。 我需要磨料的数据vanspati油(你会发现它在左侧)。 我总是遇到这样的问题,我发现selenium能够处理这些东西。 但我坚持如何将这些数据下载到Excel中。 我需要每个类别的Excel表单。 我确切的技术问题是如何解决下载表格数据的问题。我做了一些背景研究,并了解如果表格具有class_name,则可以提取数据。 从这里 。 我看到表中class="tbldata14 bdrtpg"所以我用它在我的代码。 我得到这个错误 InvalidSelectorException:消息:给定的select器tbldata14 bdrtpg无效或不会导致WebElement。 我怎样才能下载这个表格数据? 指向我可以阅读和解决这个问题的任何引用。 我的代码: from selenium import webdriver from selenium.webdriver.common.keys import Keys driver = webdriver.Firefox() driver.get("http://www.moneycontrol.com/stocks/marketinfo/netprofit/bse/index.html") elem=driver.find_element_by_class_name("tbldata14 bdrtpg") 在此先感谢。还请build议,如果有另一种简单的方法[我试过复制粘贴它太乏味了!

使用Python在Excel中使用数据透视表进行报告

我有数据 ID,"address","used_at","active_seconds","pageviews" 0a1d796327284ebb443f71d85cb37db9,"vk.com",2016-01-29 22:10:52,3804,115 0a1d796327284ebb443f71d85cb37db9,"2gis.ru",2016-01-29 22:48:52,214,24 0a1d796327284ebb443f71d85cb37db9,"yandex.ru",2016-01-29 22:14:30,4,2 0a1d796327284ebb443f71d85cb37db9,"worldoftanks.ru",2016-01-29 22:10:30,41,2 但是这么大, Excel不能打开它。 我需要把所有的时间分到不同的星期,并把结果打印到每个address每个id 。 它应该看起来像 ID vk.com 2gis.ru yandex.ru 0a1d796327284ebb443f71d85cb37db9 23 40 56 465a3fc01a62fd89a8094abdaccdcc99 0 100 45 … 我数数到所有的时间 data = pd.read_csv("desktop-visits-dnp.csv") group = data.groupby(['ID', 'address']).active_seconds.sum() 但是我需要把它分成几个星期 但是我没有太多的python技能,也不知道我能否完成这个任务

openpyxl保存只读工作簿

我似乎无法find解决这个问题。 如何closures使用openpyxl打开的工作簿? 我以只读模式打开工作簿以读取信息,而不是更改它。 现在,当我的代码运行时,如果有人同时使用它,则不可能保存excel文档。 我得到以下错误: 'path + filename'目前正在使用中。 稍后再试。 closures工作簿的方法似乎是wb.save("filename") 。 但是这不适用于我,因为我以只读模式打开它。 我能做什么? 感谢您的帮助!

在Python上读取Excel文件 – 文件无法追踪

这是我的问题: 我有一个uni的分配,我们被要求分析一些问题(不重要)。 我们给出的Excel文件的数据,我们应该使用Python来编码和解决我们的问题。 我已经通过互联网找出我必须安装点和安装xlrd和openpyxl库(我不知道哪一个)。 我希望能够通过Python最终使用这些文件,并操作数据只是由于一些简单的行命令,我想现在我已经修复了一切,除了一件事情。 在Python Shell上,我正在写下面的说明: import xlrd import openpyxl file_location = C:/Audrey/Desktop/CW/time.xlsx" workbook = xlrd.open_workbook(file_location) 然后我得到了线 “无此文件或目录”。 虽然,我相信,我没有任何错误。 我完全不知道该怎么做。 我忘了一步吗? 有人可以帮忙吗?

在Python中使用Web Scraper格式

所以我刮了一个网页收集一些信息,然后希望信息被放在一个Excel表。 我已经完成了这部分。 我正在努力的部分是在列A中写入与列B中的所有数据相关的标题。所以我想在新数据开始的地方打印标题。 这里是html: <div class="result"> <span class="number"><a href="####">#### <span class="d" id="number"> </span> </span></a> <div class="rm"> <span class="detail"><span class="cloud" title="system"></span> information</span> <span class="detail"><span class="marker" title="location"></span> information</span> <br/> <span class="detail"><span class="cog" title="public"></span> information</span> <br/> <span class="detail"><span class="lock" title="name"></span> information</span> <br/> </div> <span class="default">word</span> 所以,当有多个名为“rm”的类时,就会出现问题。 有两个解决scheme我可以想到,但似乎无法得到的代码。 本质上,我需要系统,位置,公共,并在B列中的每一个名称,然后在列A中的数字。然后,一旦下一个“RM”的div来,我希望号码是在新的信息旁边的单元格。 我可以统计每个rm div有多less“细节”,或者我可以打印整个“结果”类。 打印整个课程“结果”的唯一问题是,所有的信息都放到一个单元格中,我需要把它分离出来。 任何帮助表示赞赏! i = br.open(url).read() soup = BeautifulSoup(i) […]

如何在MS Excel中testing从pandaspython获得的EMA Crossover

指数移动平均值在此链接中解释: http : //www.investopedia.com/terms/e/ema.asp 我已经使用了下面的代码: import pandas_datareader.data as web from datetime import datetime # aapl_df = web.get_data_yahoo('AAPL', datetime(2016, 1, 1), datetime(2016, 03, 31)) aapl_df['SMA5'] = aapl_df['Adj Close'].rolling(window=5,center=False).mean() aapl_df['SMA20'] = aapl_df['Adj Close'].rolling(window=20,center=False).mean() aapl_df['EMA5'] = aapl_df['Adj Close'].ewm(span=5).mean() aapl_df['EMA20'] = aapl_df['Adj Close'].ewm(span=20).mean() #aapl_df['EMA20'] = aapl_df['Adj Close'].ewm(span=20,min_periods=20).mean() # commented to explain the min_periods # Plot price vs various mean […]