Tag: 分类数据

分类数据中的多个标准查找

我有一些如下所示的原始数据,我想searchB 类子类别 3下的值。 这就像一个小型显示forms的数据透视表。 我不能简单地使用MATCHfunction,因为类别的名称不显示在每一行上。 我认为我可以使用额外的查找列,并添加一些映射,但似乎相当费力。 Category Sub-Category Value A 1 431 2 543 3 13421 4 754 5 43 B 1 456 2 35 3 906 C 1 562 2 13 3 1243 4 765 5 35 6 12

使用分类数据计数创buildpandas数据框

我有一堆调查数据按照每个问题的答案数量(多选题)分解。 我有几个不同的课程,学期,部分等的每一个摘要之一。不幸的是,我所有的数据是在PDF打印输出给我,我不能得到数字数据。 在光明的一面,这意味着我有自由统治格式化我的数据文件,但我需要,以便我可以导入到pandas。 如何将数据导入到pandas中,最好不需要逐行复制(每个条目由我的摘要表示)。 数据 我的调查包括几个select题。 对于每个问题,我有多less个答复者select了每个选项。 就像是: Course Number: 100 Semester: Spring Section: 01 Question 1 ———- Option A: 27 Option B: 30 Option C: 0 Option D: 2 Question 2 ———- Option X: 20 Option Y: 10 所以基本上我有.value_counts()结果,如果我的数据已经在pandas。 请注意,问题并不总是具有相同数量的选项(类别),并不总是具有相同数量的答复者。 我将有多个课程编号,学期和部分类似的结果。 在我的实际数据中,类别A , B , C等仅仅是占位符,用于表示每个响应类别的标签。 另外,我不得不手动input所有的东西,所以我不担心读取上面的具体文件格式,它只是代表我在我面前的实际打印输出。 目标 我想通过告诉Pandas每个问题的每个回答类别有多less来重新创buildPandas中的回答数据。 基本上我想要一个Excel文件或CSV,看起来像上面的响应数据,和一个pandasDataFrame,看起来像: Course Number Semester Section […]