Tag: bash

如果文件(a)和(b)中的字段1匹配,则将文件(a)的字段2打印到文件(b)的字段9

在post中删除基于第2列AWK / BASH中的最小值的两个列文件我已经要求帮助生成一个文件(一)这样的: denovo0 90.2 denovo1 97.7 denovo10 93.8 denovo100 95.3 第二个文件(b)具有这样的结构(8列,制表符分隔): denovo1446 1.0 0.0 0.0 0.0 0.0 0.0 Eukaryota; __Opisthokonta; __Metazoa; __Rotifera; __Philodinidae; __uncultured_bdelloid_rotifer denovo3423 0.0 1.0 0.0 0.0 0.0 0.0 Eukaryota; __Opisthokonta; __Metazoa; __Nematoda; __Enoplea denovo13975 0.0 1.0 0.0 0.0 0.0 0.0 Eukaryota; __Opisthokonta; __Metazoa; __Rotifera; __Philodinidae; __uncultured_bdelloid_rotifer denovo14362 0.0 1.0 0.0 0.0 […]

脚本将输出转换为Excel表格

我有包含以下数据的文件: ——————-[ server10 ]——————- user1 user2 user99 user100 ——————-[ server20 ]——————- user1 user2 user10 user4 ——————-[ server30 ]——————- user10 user30 user40 我想把这个输出转换成Excel表格,这样我就可以向我的pipe理人员呈现。 任何想法怎么能做到这一点? 我想在Excel工作表中输出到以下格式: Hostname users server10 user1 user2 user99 user100 server20 user2 user10 user4 … … 直到这里,“大卫”用Python帮助我(openpyxl)。 但在这里我有新的专栏(最后login时间),我想在Excel中添加,所以这里是例子。 ——————-[ server10 ]——————- user1 never user2 Oct 17, 2011 user99 Jan 01, 2007 user100 Feb 02, […]

如何使用sed命令删除几行

我有这个excel表格是通过附加多个(这里是三个)其他Excel表格生成的。 column1,column2,column3 3,4,78 23,56,78 column1,column2,column3 45,23,67 23,98,23 12,34,5 column1,column2,column3 23,67, 23,111,45 你可以看到这些是3种类似的文件的组合。 现在我想保留第一个标题,并且想要删除其余的来自其他i / p文件的标题的其余部分。 我怎样才能使用sed命令? 谢谢。

Bash将柱状文件合并到一个带有行的文件中

我有这种格式的许多数据文件: -1597.5421 -1909.6982 -1991.8743 -2033.5744 但我想将它们合并成一个数据文件,每个原始数据文件占用一行空格,所以我可以在Excel中导入它。 -1597.5421 -1909.6982 -1991.8743 -2033.5744 -1789.3324 -1234.5678 -9876.5433 -9999.4321 等等。 每个文件都命名为ALL.ene ,我的工作目录中的每个目录都包含它。 有人可以给我一个快速解决? 谢谢! :编辑。 每个文件有11个条目。 那些只是例子。

使用SQL * Plus假脱机为CSV,然后将CSV转换为PDF

我有一个SQL将一些结果后台打印到一个CSV文件,然后通过电子邮件发送给客户。 Microsoft Excel(通常是最终用户打开CSV文件的默认应用程序)的方式对于某些最终用户而言稍微有点混乱,因为在打印之前,通常需要使列变大(否则显示#等)。 在发送电子邮件之前,是否可以直接将文件转换为PDF文件,或将CSV转换为更易于阅读的PDF? 我在网上search了一个命令行工具,将CSV转换为PDF,但空白。 这是在没有RHN订阅的红帽企业Linux服务器上生成的,因此具有大量依赖关系的东西将是安装的噩梦。

如何根据多个条件将大型“.csv”文件分解成小文件?

我有大的.csv文件(大约40MB),我想在几个条件下将它们分成较小的文件,并相应地将它们命名为数据: 按第3栏的内容分开文件, 内容第四列从第一点单独输出, 这是棘手的部分: 以前2次操作创build的输出检查第11列是否有数据,如果是,则将该数据分离为内容,之后再按第17列的内容分隔 – 然后保存输出/ OR / AND / 如果第11栏中没有数据,请检查第15栏并相应分开。 接下来检查17列,并通过第17列分隔这个数据 – >保存输出。 在VBA中我有这样的东西,但是对于大文件和excel来说太慢了,有时会崩溃。 有了这样的多个文件,需要很长时间才能手动切换,然后将vba放入工作。 这有可能通过这么多的条件来剪切文件吗? 在此先感谢您的帮助。 例如:(头是列的#) 1 2 3 4 11 15 17 Date Time COUNTRY CITY CHECK TEST TEST2 2015-08-20 11:54 ENGLAND ABINGDON 1 1 2015-08-21 12:54 ENGLAND BATLEY 2 5 2015-08-22 13:54 ENGLAND FROME 2 6 2015-08-23 14:54 ENGLAND […]

.csv在terminal中显示不正确

当我进入 more trap10c_7C000000395C1641_160823.csv 我得到以下输出: 3/14/16 22:00,23.5ature ( C)0.024 3/15/16 16:00,29.5 3/16/16 11:00,39.5 3/17/16 5:00,21.55 3/17/16 23:00,24.5 3/18/16 17:00,28.5 3/19/16 11:00,2855 3/20/16 5:00,23.55 3/20/16 23:00,25.5 3/21/16 17:00,29.5 3/22/16 10:00,26.5 3/23/16 5:00,22.55 3/23/16 23:00,24.5 …等等 当我在libreoffice或textedit打开文件时,我得到这个: ,8/23/16 Timezone,-6 Serial No.,3300000039575B41 Location:,LS_trap_6u High temperature limit (°C),20.1 Low temperature limit (°C),0.03 Date – Time,Temperature (°C) 3/13/16 9:59,26.6 3/13/16 10:59,28.6 […]

报告所有可能的列组合

我一般都有关于组合的问题,但在一个相当复杂的情况下,我还没有find任何帮助。 我正在试图find一种方式来报告数据集中列的所有可能的组合。 数据报告了关于土地变化的文献调查,并指出每篇文章中报告了哪些近似和潜在的驱动因素。 因此,这些行表示单独的文章,而列则表示所有邻近和下面的驱动程序。 有六种types的接近驱动程序和五种types的基础驱动程序。 对于每篇文章,将1放置在该文章中标识的驱动程序的列中,而在驱动程序的列中则为0。 表格看起来大致如下: key | d1 | d2 |…| d6 | i1 |…| i5 | ————————————– A1 | 1 | 0 |…| 1 | 1 |…| 0 | A2 | 0 | 1 |…| 0 | 0 |…| 1 | A1条款将d1和d6标识为直接驱动程序,i1标识为间接驱动程序等。 我想要做的是找出报道直接驱动因素,间接驱动因素,直接驱动因素和间接驱动因素的所有可能组合的文章数量。 例如,有多less篇文章标识d1,d2和i1; 多less个确定d1,d2和i2; 等等? 我的学生在Excel文件中有表格,我想可能是Calc或Base可能有一个自动执行这个过程的function。 有没有人有一个想法,我怎么能做到这一点? 谢谢!

根据两列将这个csv / xls拆分成单独的文件?

我有一个35 MB的Excel文件,这些列: Index, Name, Year, AgeGroup1, AgeGroup2, AgeGroup3 […] 1, Sweden, 1950, 20, 25, 27 2, Norway, 1950, 22, 27, 28 2, Sweden, 1951, 24, 24, 22 我想根据“名称”列将文件拆分成多个csv文件(最好也根据此列中的值命名文件)。 我也想按“年份”对文件进行sorting(但这当然可以事先在Excel中完成)。 一个bash脚本或水壶/ Pentaho解决scheme将不胜感激。 (替代品也是受欢迎的。)

Excel公式/ AWK等效

我试图从几个文件自动化许多计算。 我已经用Excel做了,并且需要公式。 我的inputInput.txt是 Start End 0 0 1793 3233 3147 4045 4085 6751 28077 29336 29258 31431 29304 30010 31528 42846 我想要得到的是从Start到End的Size ,并减去可能的重叠:例如,在第4行中, Start (3147)与第3行End (3233)重叠,所以有效Size仅为813,到期到那个重叠。 这个例子中的第8行(29304-30010)不仅被重叠,而且被第7行(29258-31431)所包含,所以它不会添加任何有效的大小。 我想要的输出Out.txt是: Start End Size No-Negatives Overlap No-Negatives 0 0 0 0 0 0 1793 3233 1442 1442 -1792 0 3147 4045 813 813 87 87 4085 6751 2668 […]