Tag: 数据集

如何统计数据集的正面和负面差异的实例

我目前有一个数据集看起来像这样: |A1|A2|B1|B2|C1|C2| ——————- | 1| 3| 3| 4| 2| 2| | 5| 4| 2| 3| 5| 5| | 4| 1| 5| 5| 3| 5| etc 每列分组,即A对B与C,我想结束三个数据点… 数据点1:A1> A2的计数 数据点2:A1 <A2的计数 数据点3:A1 == A2的计数 在Excel / Gdocs中,你会推荐什么公式来实现这些数据点? 提前致谢!

在一个拥有25年价值数据的Access表中计算每月的logging数量

这可能是一个非常简单的问题,但我无法find一个与在这么长时间内传播的数据集有关的答案。 对于初学者来说,这是从一个较早的职位继续进行的,我想从一个跨越数年的每个月的数据中统计出logging的数量 – 问题的主体如下: 我已经下载了一个数据集,详细介绍了1979年1月至2004年12月期间在英格兰报告的所有车祸事件 – 该文件采用csv格式,可以理解的是相当大(准确的说是6,224,199行)。 由于文件的大小超过了Excel 2010可以处理的行数,因此我必须将文件拆分为更小的文件才能在Excel中一次打开。 我尝试使用记事本和记事本+ +,但记事本崩溃,记事本++拒绝打开如此之大(720MB)的文件。 我已经考虑使用像Delimit这样的Excelreplace,但是它不支持macros。 现在,忽略大小问题,我需要计算每个月的崩溃总数,并记下它们。 有一个列来指定每个崩溃的date,但行不是根据崩溃datesorting。 我正在考虑使用CTRL + F来计算具有特定的月份/年份值的行数,然后logging每个search的结果数量,但考虑到数据跨越了25年,我不得不手动search并logging从300个月结果。 对这个问题的评论告诉我,将包含数据的csv文件导入到Microsoft Access中会更容易,然后查询数据。 我遵循这些评论者的build议,并将(6,224,199)logging导入到一个新的Access表中,但现在我一直在写SQL查询。 我对Access没有多less经验,但是我收集到了我应该用一个COUNT命令来声明每个月的事故报告数量。 问题是这个数据跨越了25年,所以在我拼凑起来的(基本)声明中,为了得到每年每个月的报告总数,我必须运行它300次。 编辑 我已经删除了起始表中的很多列 – 我这样做是因为我只需要知道每个月发生了多less事故,并且csv文件/起始表有很多信息对我没有用处(如道路types,警力,光线条件)。 该表在以下数据types中具有以下列: ID(自动编号) date(date/时间) Day_of_Week(数字) 时间(date/时间) 在输出中,我只需要按照最早(1979年1月)到最近(2004年12月)的顺序每月发生的事故数量。 由于每年每个月只有一个数字,因此可能会有第二列列出月份/年份,但这对于我使用这些数据不是必要的。

C#读取excel文件忽略第一行

我正在使用OLEDB读取Excel文件。 阅读后,我将其保存到DataSet以备将来使用。 下面的代码工作得很好,但总是忽略 Excel文件的第一行。 这怎么解决? 请忽略评论和例外的文本。 有结果的屏幕(我正在显示结果DatatSet的第一个DataTable到DevExpress GridView 。 public static class ExcelHelperFasad { /// <summary> /// Прочитать excel'евский файл и вернуть DataSet с заполненными DataTable'ами для каждой страницы. /// </summary> /// <param name="filename">Имя файла.</param> /// <returns></returns> public static DataSet OpenExcelFile(string filename) { if (File.Exists(filename) == false) throw new MyException("Файл не существует : " + […]

帮助奇怪的行为阅读Exceldate通过ole db连接

我正在使用以下代码通过ole db连接将简单的Excel电子表格导入数据集。 从电子表格中读取date时,我会看到不同的行为,具体取决于电子表格是否由其他进程打开。 行为可以很容易地重新生成。 使用date字段创build一个包含标题行和一行数据的xlsx文件。 尝试2011年1月1日。 保持电子表格打开并运行以下代码并检查xml输出。 如果closures电子表格并运行相同的代码,则会在2011年1月1日的xml输出中看到2011年1月1日的值,您将看到值为40544的值。 任何想法或build议如何获得一致的行为? var fileName = @"C:\Test.xlsx"; var connectionString = String.Format(@"Provider=Microsoft.ACE.OLEDB.12.0;Data Source={0};Extended Properties=""Excel 12.0;HDR=NO;IMEX=1;""", fileName); var adapter = new OleDbDataAdapter("SELECT * FROM [Sheet1$]", connectionString); var ds = new DataSet(); adapter.Fill(ds); ds.WriteXml(@"c:\test.xml");

将Excel文件读入SAS数据集

我几乎没有SAS的经验。 但是我想要做的是将2个excel电子表格读入2个独立的临时数据集。 文件名是C:\ signature_recruit.xls和C:\ acceptance_recruit.xls。 我如何做到这一点?

最简单的方法从dynamicCRM获取数据

我们目前的设置如下,如果我们的数据集更改,相当难以维护。 我们目前将数据从CRM导出到Excel表格中,通过使用Excel-CRM插件定期更新。 这已经遇到了一个问题,因为如果有人把它打开(当前在非工作时间运行脚本,但有时候人们有点“特殊”),那么到位的自动脚本不能更新和保存文件。 在提取和保存数据之后,我们有一些脚本可以处理python中的数据,并将JSON输出到公司rest室中的指标仪表板,这个仪表板提供了多个来源的信息(这就是为什么我们不能只使用Dynamics CRM内置仪表板)。 因此,我的问题是,我想要一个更直接的方法,从CRM获取数据到我们的仪表板 – 从而削减了作为中间人的excel-CRM插件的需求 – 我一直在寻找的select,我不知道哪一个最适合我们的情况。 目前的选项如下: Javascript和Microsoft REST API或SOAP事务 Python和SOAP事务使用PyCurl或其他可以执行SOAP调用的系统(不知道它是否允许REST,但我不这么认为)。 使用Microsoft SDK和C#获取所需的信息(不是一个很好的select,因为我不知道C#) 使用Microsoft SDK和IronPython? (这是甚至可行?有其他人试过) 这些是我已经充实的选项,我正在寻找一些简单的,相当容易实现的东西,以达到获得CRM数据的目标,并能够操纵它,而不必从插件拉出数据。

将Excel导入到DataTablestring是空的

为了将excel导入到数据表,我使用简单的代码: string connectionString = string.Format("Provider=Microsoft.ACE.OLEDB.12.0; data source={0}; Extended Properties=Excel 12.0;", physicalFolder + FileUpload1.FileName); OleDbDataAdapter adapter = new OleDbDataAdapter("SELECT * FROM [Sheet1$]", connectionString); DataSet ds = new DataSet(); 当在其中一行的Excel中,如果我的行看起来像下面 stringommited和我的数据集看起来像这样 但是,如果我添加一些string,如果我的上传看起来像这样: 然后我的数据集看起来像不会省略string:

将DataSet拖放到工作表中的最快方法

一个有16000 x 12条目的higeisch数据集需要被转储到工作表中。 我现在使用下面的函数: for (int r = 0; r < dt.Rows.Count; ++r) { for (int c = 0; c < dt.Columns.Count; ++c) { worksheet.Cells[c + 1][r + 1] = dt.Rows[r][c].ToString(); } } 我把这个例子给了中间的一块 这是我读完Dave Zych的build议后实施的。 这很好。 private static void AppendWorkSheet(Excel.Workbook workbook, DataSet data, String tableName) { Excel.Worksheet worksheet; if (UsedSheets == 0) worksheet = […]

将Excel范围转换为ADO.NET DataSet或DataTable等

我有一个Excel电子表格,将坐在networking共享驱动器上。 它需要由我的Winforms C#3.0应用程序访问(许多用户可能正在使用该应用程序,并同时打这个电子表格)。 一张工作表上有很多数据。 这些数据被分解成我已经命名为范围的区域。 我需要能够单独访问这些范围,将每个范围作为数据集返回,然后将其绑定到网格。 我发现使用OLE的例子,并得到这些工作。 不过,我已经看到了一些有关使用这种方法的警告,另外在工作中我们已经使用Microsoft.Office.Interop.Excel作为标准。 除非必须,否则我不想离开这里。 就我所知,我们的用户将使用Office 2003。 我可以用下面的代码得到我需要的范围: MyDataRange = (Microsoft.Office.Interop.Excel.Range) MyWorkSheet.get_Range("MyExcelRange", Type.Missing); OLE的方式很好,因为它会把我的第一行,把它们变成列。 我的范围(总共12个)在大多数情况下在列数上彼此不同。 不知道这个信息是否会影响任何build议。 有什么办法可以使用Interop并将返回的范围返回到数据集?

重塑面板数据

我需要重新devise面板数据分析的数据。 我search了互联网,只发现如何通过使用Stata获得所需的结果; 但是我应该使用R和Excel。 我的初始和最终数据(所需的结果)看起来非常类似于Stata重塑数据的例子的第一页。 http://spot.colorado.edu/~moonhawk/technical/C1912567120/E220703361/Media/reshape.pdf 用R还是Excel可以实现吗? 我尝试从reshape2库使用熔化函数,但我得到 CountryName ProductName Unit Years value 1 Belarus databaseHouseholds '000 Y1977 2942.702 2 Belarus databasePopulation '000 Y1977 9434.200 3 Belarus databaseUrbanPopulation '000 Y1977 4946.882 4 Belarus databaseRuralPopulation '000 Y1977 4487.318 5 Belarus originalHouseholds '000 Y1977 NA 6 Belarus originalUrban households '000 Y1977 NA 7 Poland ………………………………………. ………………………………………………….. 当我想得到像这样的东西: CountryName […]