如何处理每行可能包含多于一个条目的原始数据?
我想要导出一些数据(恰好来自Ruby,但不重要),以便进一步分析。 不幸的是,某些logging/行/数据条目可能包含给定列的大于1的值(或0,就此而言)。
例如,一个人可能戴着太阳镜和一顶帽子。 有这样的多个列。
我不知道如何处理理想情况下可能属于通用格式的同一列的数据集合(我需要将这些数据导入其他软件,理想情况下包括Excel)。
我能想到的唯一简单,通用的方法是为每个潜在的数据块添加一列,并将其视为布尔值。 但是我宁愿不要,从那以后我会有300多个专栏。 然后,我还必须包含一个辅助CSV文件,指定哪些列属于哪个类别。
如果要将该数据输出到csv文件,则可以使用不同的分隔符将数据分组到一个字段中:
John,sunglasses|hat,other,fields
或者使用相同的分隔符,但是需要引用该字段(并且已经在该字段中的引号需要用另一个引号进行转义):
John,"sunglasses,hat",other,fields
或者,如果其他字段的数量不大,则可以为每个值使用一行:
John,sunglasses John,hat
或者你可以使用xml:
<record> <name>John</name> <options> <option>sunglasses</option> <option>hat</option> </options> </record>
这一切都取决于你想如何处理导出的数据。