Tag: spark dataframe

如何在apache spark java中使用hadoop office库将数据集写入excel文件

目前我正在使用com.crealytics.spark.excel来读取excel文件,但是使用这个库我不能将数据集写入excel文件。 这个链接说使用hadoop办公库( org.zuinnote.spark.office.excel )我们可以读取和写入excel文件 请帮助我将数据集对象写入spark java中的excel文件。

如何从Scala Spark中的Excel(xls,xlsx)文件构造Dataframe?

我有一个大的Excel(xlsx and xls)文件与多个工作表,我需要将其转换为RDD或Dataframe以便它可以连接到其他dataframe Dataframe稍后。 我正在考虑使用Apache POI并将其保存为CSV ,然后在dataframe读取csv 。 但是,如果有任何图书馆或API可以帮助在这个过程中很容易。 任何帮助,高度赞赏。