Tag: bash

如果文件（a）和（b）中的字段1匹配，则将文件（a）的字段2打印到文件（b）的字段9: 在post中删除基于第2列AWK / BASH中的最小值的两个列文件我已经要求帮助生成一个文件（一）这样的： denovo0 90.2 denovo1 97.7 denovo10 93.8 denovo100 95.3 第二个文件（b）具有这样的结构（8列，制表符分隔）： denovo1446 1.0 0.0 0.0 0.0 0.0 0.0 Eukaryota; __Opisthokonta; __Metazoa; __Rotifera; __Philodinidae; __uncultured_bdelloid_rotifer denovo3423 0.0 1.0 0.0 0.0 0.0 0.0 Eukaryota; __Opisthokonta; __Metazoa; __Nematoda; __Enoplea denovo13975 0.0 1.0 0.0 0.0 0.0 0.0 Eukaryota; __Opisthokonta; __Metazoa; __Rotifera; __Philodinidae; __uncultured_bdelloid_rotifer denovo14362 0.0 1.0 0.0 0.0 […]

脚本将输出转换为Excel表格: 我有包含以下数据的文件： ——————-[ server10 ]——————- user1 user2 user99 user100 ——————-[ server20 ]——————- user1 user2 user10 user4 ——————-[ server30 ]——————- user10 user30 user40 我想把这个输出转换成Excel表格，这样我就可以向我的pipe理人员呈现。任何想法怎么能做到这一点？我想在Excel工作表中输出到以下格式： Hostname users server10 user1 user2 user99 user100 server20 user2 user10 user4 … … 直到这里，“大卫”用Python帮助我（openpyxl）。但在这里我有新的专栏（最后login时间），我想在Excel中添加，所以这里是例子。 ——————-[ server10 ]——————- user1 never user2 Oct 17, 2011 user99 Jan 01, 2007 user100 Feb 02, […]

如何使用sed命令删除几行: 我有这个excel表格是通过附加多个（这里是三个）其他Excel表格生成的。 column1,column2,column3 3,4,78 23,56,78 column1,column2,column3 45,23,67 23,98,23 12,34,5 column1,column2,column3 23,67, 23,111,45 你可以看到这些是3种类似的文件的组合。现在我想保留第一个标题，并且想要删除其余的来自其他i / p文件的标题的其余部分。我怎样才能使用sed命令？谢谢。

Bash将柱状文件合并到一个带有行的文件中: 我有这种格式的许多数据文件： -1597.5421 -1909.6982 -1991.8743 -2033.5744 但我想将它们合并成一个数据文件，每个原始数据文件占用一行空格，所以我可以在Excel中导入它。 -1597.5421 -1909.6982 -1991.8743 -2033.5744 -1789.3324 -1234.5678 -9876.5433 -9999.4321 等等。每个文件都命名为ALL.ene ，我的工作目录中的每个目录都包含它。有人可以给我一个快速解决？谢谢！：编辑。每个文件有11个条目。那些只是例子。

使用SQL * Plus假脱机为CSV，然后将CSV转换为PDF: 我有一个SQL将一些结果后台打印到一个CSV文件，然后通过电子邮件发送给客户。 Microsoft Excel（通常是最终用户打开CSV文件的默认应用程序）的方式对于某些最终用户而言稍微有点混乱，因为在打印之前，通常需要使列变大（否则显示＃等）。在发送电子邮件之前，是否可以直接将文件转换为PDF文件，或将CSV转换为更易于阅读的PDF？我在网上search了一个命令行工具，将CSV转换为PDF，但空白。这是在没有RHN订阅的红帽企业Linux服务器上生成的，因此具有大量依赖关系的东西将是安装的噩梦。

如何根据多个条件将大型“.csv”文件分解成小文件？: 我有大的.csv文件（大约40MB），我想在几个条件下将它们分成较小的文件，并相应地将它们命名为数据：按第3栏的内容分开文件，内容第四列从第一点单独输出，这是棘手的部分：以前2次操作创build的输出检查第11列是否有数据，如果是，则将该数据分离为内容，之后再按第17列的内容分隔 – 然后保存输出/ OR / AND / 如果第11栏中没有数据，请检查第15栏并相应分开。接下来检查17列，并通过第17列分隔这个数据 – >保存输出。在VBA中我有这样的东西，但是对于大文件和excel来说太慢了，有时会崩溃。有了这样的多个文件，需要很长时间才能手动切换，然后将vba放入工作。这有可能通过这么多的条件来剪切文件吗？在此先感谢您的帮助。例如:(头是列的＃） 1 2 3 4 11 15 17 Date Time COUNTRY CITY CHECK TEST TEST2 2015-08-20 11:54 ENGLAND ABINGDON 1 1 2015-08-21 12:54 ENGLAND BATLEY 2 5 2015-08-22 13:54 ENGLAND FROME 2 6 2015-08-23 14:54 ENGLAND […]

.csv在terminal中显示不正确: 当我进入 more trap10c_7C000000395C1641_160823.csv 我得到以下输出： 3/14/16 22:00,23.5ature ( C)0.024 3/15/16 16:00,29.5 3/16/16 11:00,39.5 3/17/16 5:00,21.55 3/17/16 23:00,24.5 3/18/16 17:00,28.5 3/19/16 11:00,2855 3/20/16 5:00,23.55 3/20/16 23:00,25.5 3/21/16 17:00,29.5 3/22/16 10:00,26.5 3/23/16 5:00,22.55 3/23/16 23:00,24.5 …等等当我在libreoffice或textedit打开文件时，我得到这个： ,8/23/16 Timezone,-6 Serial No.,3300000039575B41 Location:,LS_trap_6u High temperature limit (°C),20.1 Low temperature limit (°C),0.03 Date – Time,Temperature (°C) 3/13/16 9:59,26.6 3/13/16 10:59,28.6 […]

报告所有可能的列组合: 我一般都有关于组合的问题，但在一个相当复杂的情况下，我还没有find任何帮助。我正在试图find一种方式来报告数据集中列的所有可能的组合。数据报告了关于土地变化的文献调查，并指出每篇文章中报告了哪些近似和潜在的驱动因素。因此，这些行表示单独的文章，而列则表示所有邻近和下面的驱动程序。有六种types的接近驱动程序和五种types的基础驱动程序。对于每篇文章，将1放置在该文章中标识的驱动程序的列中，而在驱动程序的列中则为0。表格看起来大致如下： key | d1 | d2 |…| d6 | i1 |…| i5 | ————————————– A1 | 1 | 0 |…| 1 | 1 |…| 0 | A2 | 0 | 1 |…| 0 | 0 |…| 1 | A1条款将d1和d6标识为直接驱动程序，i1标识为间接驱动程序等。我想要做的是找出报道直接驱动因素，间接驱动因素，直接驱动因素和间接驱动因素的所有可能组合的文章数量。例如，有多less篇文章标识d1，d2和i1; 多less个确定d1，d2和i2; 等等？我的学生在Excel文件中有表格，我想可能是Calc或Base可能有一个自动执行这个过程的function。有没有人有一个想法，我怎么能做到这一点？谢谢！

根据两列将这个csv / xls拆分成单独的文件？: 我有一个35 MB的Excel文件，这些列： Index, Name, Year, AgeGroup1, AgeGroup2, AgeGroup3 […] 1, Sweden, 1950, 20, 25, 27 2, Norway, 1950, 22, 27, 28 2, Sweden, 1951, 24, 24, 22 我想根据“名称”列将文件拆分成多个csv文件（最好也根据此列中的值命名文件）。我也想按“年份”对文件进行sorting（但这当然可以事先在Excel中完成）。一个bash脚本或水壶/ Pentaho解决scheme将不胜感激。（替代品也是受欢迎的。）

Excel公式/ AWK等效: 我试图从几个文件自动化许多计算。我已经用Excel做了，并且需要公式。我的inputInput.txt是 Start End 0 0 1793 3233 3147 4045 4085 6751 28077 29336 29258 31431 29304 30010 31528 42846 我想要得到的是从Start到End的Size ，并减去可能的重叠：例如，在第4行中， Start （3147）与第3行End （3233）重叠，所以有效Size仅为813，到期到那个重叠。这个例子中的第8行（29304-30010）不仅被重叠，而且被第7行（29258-31431）所包含，所以它不会添加任何有效的大小。我想要的输出Out.txt是： Start End Size No-Negatives Overlap No-Negatives 0 0 0 0 0 0 1793 3233 1442 1442 -1792 0 3147 4045 813 813 87 87 4085 6751 2668 […]