我如何在Python中开始我的第一个项目? (比较date,使用文件和xlrd)

我对Python非常了解,并且对我的第一个项目有了一个想法,但是由于我的经验不足,看起来很复杂。 可能你们可以帮我弄清楚如何devise它,使其更简单或更高效。

我每周都会收到这些电子邮件,一个XLS文件,整个星期的业务运作。 下面是关于XLS如何的一个虚构的例子。

03/12/2014 04/12/2014 05/12/2014 Initial cash 20000 19000 19800 account receivable 30 50 60 account payable 40 60 90 net cash 20000 19800 19500 

我打算做的是,每次从特定的文件夹中读取这个XLS文件,并在一个单独的文本文件上build立一个日常操作数据库(我select输出到一个文本文件,因为我认为这对我来说更容易写入比用XLWT模块编写另一个XLS文件)。

输出文本文件应该看起来像这样(所以你可以有一个想法),

  20/10/2014 A/C 75200051479 

这是我的问题:

  1. 我想让程序从文本文件中检查最后一行的最后一个date,比较第一行的date是从XLS追加的。 这是可行的,如何?

  2. 我应该输出到一个元组,一个列表或一个简单的string,使我更容易提取date,并将其与XLS的第一行进行比较以追加。 我的例子是一种CSV文件。

  3. 我应该如何看待代码的顺序:打开TXT,获取date数据,使用xlrd比较date和XLS,使用xlrd从XLS获取数据并将数据附加到文本文件。

感谢您通过这篇文章,我很感激任何帮助,因为我从Python 3.3.5开始。

将问题分解成子目标,并首先解决问题。 例如:

  1. 从Python中的XLS文件(或转换的CSV文件)中读取和打印某种数据。

  2. 将列和行标题和数据读入某种数据结构(可能是列表的列表,或者是每列的对象)。

  3. 找出如何阅读和比较两个date。

…等等。如果你遇到了一些更具体的问题,并且找不到任何相关的search结果,那么可能是回到堆栈溢出的好时机。

我同意kazagistar

一些提示,我将如何做到这一点….

比较问题可能是通过将所有内容都读入字典来解决的。 比方说,你设置一个唯一的ID,如时间戳。 然后将每个键的值设置为整行作为列表,通过索引位置访问(基本上是列nr)。 然后将其更新为sqllite数据库进行存储和查找。

从xlrd的这个链接开始: