多个对象一起出现 – 最高次数

我基本上查询join条件在一个正常的oracle数据库日志种类的表。

query_id, join_condition 1 schema1.table1.col1=schema2.table2.col1 1 schema1.table1.col2=schema2.table2.col2 1 schema1.table1.col1=schema2.table3.col1 2 schema1.table1.col1=schema2.table2.col1 2 schema1.table1.col1=schema2.table3.col1 2 schema1.table1.col1=schema3.table3.col1 ........... ......... ....... 

我已经把它吹到这样的excel表中

 query_id, left_schema, left_table, left_column, right_schema, right_table, right_schema 1 schema1 table1 col1 schema2 table2 col1 1 schema1 table1 col2 schema2 table2 col2 ................ .............. ......... 

我想从这些回答下面的问题。

在同一个查询中使用的所有表组合 – 按照它们一起出现的次数sorting。

我已经通过将左表和右表的联合以sorting的顺序格式放入表中并将其分组来解决这个问题。 因此,根据每个查询ID表的数量,可以随机组合2或3或4或5个表名。

现在我的下一个问题是,我如何以sorting顺序查找这些表的所有可能的排列组合。 例如,在查询ID 1中,我们将table1连接到table2,table3。 所以这个查询ID落在3表组合桶中。 而且(table1,table2)和(table1,table3)落在2表组合桶中。 同样可能有4张桌子在一起,5个桌子在一起桶。 我无法在SQL或Excel中解决这个问题。 你有什么解决这个问题的build议吗? graphics数据库/ R统计方法可以与可视化一起使用。 对于很长的问题抱歉。

期望的输出应该是4组报告。 1)按发生次数sorting的两个表格一起

 two_tables_combination, number_of_queryids schema1.table1-schema2.table2 2 schema1.table1-schema2.table3 2 schema1.table1-schema3.table3 1 

2)三个表格按发生次数排列在一起

 three_tables_combination, number_of_occurances schema1.table1-schema2.table2-schema2.table3 2 schema1.table1-schema2.table3-schema3.table3 1 

3)按照发生次数sorting的四个表格一起
4)任何高度使用的表格组合。

谢谢。