Tag: scala

如何使用Apache POIparsing保存在Excel文件中的树结构

所有, 早上好! 我有一个Excel文件,列出如下的数据,我试图parsing使用兴趣点 ABC D1 D2 F G1 G2 G3 M S1 RTULXYZ 是否有可能产生如下的输出 A A–>B A–>B–>C A–>B–>C–>D1 A–>B–>C–>D2 A–>B–>F A–>B–>F–>G1 A–>B–>F–>G2 A–>B–>F–>G3 A–>B–>M A–>B–>M–>S1 A–>R A–>R–>T A–>U L L–>X L–>X–>Y L–>X–>Y–>Z 我一直在努力,但还没有想出逻辑 谢谢

HTTP GET用空体来响应,在IE下载excel文件

我试图找出当我下载一个Excel报告时,在这个页面上发生了什么。 它只适用于Internet Explorer,当我尝试使用ScalaJ在Scala中下载报告时,响应正文的inputstream为空。 有人能帮我理解这里发生了什么吗? 明文请求: GET /oca_ReportViewer.aspx?ReportName=District_and_Statutory_County_Court/DSC_Civil_Family_Activity_Detail_N.rpt&ddlFromMonth=9&ddlFromYear=2010&txtFromMonthField=@FromMonth&txtFromYearField=@FromYear&ddlToMonth=10&ddlToYear=2010&txtToMonthField=@ToMonth&txtToYearField=@ToYear&ddlCountyPostBack=0&txtCountyPostBackField=@CountyID&chkAggregateMonthlyReport=0&export=1625 HTTP/1.1 Accept: text/html, application/xhtml+xml, image/jxr, */* Referer: http://card.txcourts.gov/ReportSelection.aspx Accept-Language: en-US User-Agent: Mozilla/5.0 (Windows NT 10.0; WOW64; Trident/7.0; rv:11.0) like Gecko Accept-Encoding: gzip, deflate Host: card.txcourts.gov Connection: Keep-Alive Cache-Control: no-cache Cookie: ASP.NET_SessionId=j0tgci45qj3t1uqygrvkqz55 到目前为止的代码: import java.io.{BufferedOutputStream, FileOutputStream, FileWriter, InputStream} import scalaj.http._ object Downloader extends App { val url = "http://card.txcourts.gov/oca_ReportViewer.aspx" […]

什么是加载Excel文件的强制选项?

我使用下面的语法从S3加载了一个excel文件,但我想知道需要在这里设置的选项。 为什么必须设置下面所有的加载excel文件的选项? 这些选项都不是强制加载其他文件types,如csv,del,json,avro等 val data = sqlContext.read. format("com.crealytics.spark.excel"). option("location", s3path). option("useHeader", "true"). option("treatEmptyValuesAsNulls", "true"). option("inferSchema","true"). option("addColorColumns", "true"). load(path) 如果上面的任何选项(除了位置)都没有设置,我会得到下面的错误: sqlContext.read.format("com.crealytics.spark.excel").option("location", s3path).load(s3path) 错误信息 : Name: java.lang.IllegalArgumentException Message: Parameter "useHeader" is missing in options. StackTrace: at com.crealytics.spark.excel.DefaultSource.checkParameter(DefaultSource.scala:37) at com.crealytics.spark.excel.DefaultSource.createRelation(DefaultSource.scala:19) at com.crealytics.spark.excel.DefaultSource.createRelation(DefaultSource.scala:7) at org.apache.spark.sql.execution.datasources.DataSource.resolveRelation(DataSource.scala:345) at org.apache.spark.sql.DataFrameReader.load(DataFrameReader.scala:149) at org.apache.spark.sql.DataFrameReader.load(DataFrameReader.scala:132) at $anonfun$1.apply(<console>:47) at $anonfun$1.apply(<console>:47) at time(<console>:36)

如何从Scala Spark中的Excel(xls,xlsx)文件构造Dataframe?

我有一个大的Excel(xlsx and xls)文件与多个工作表,我需要将其转换为RDD或Dataframe以便它可以连接到其他dataframe Dataframe稍后。 我正在考虑使用Apache POI并将其保存为CSV ,然后在dataframe读取csv 。 但是,如果有任何图书馆或API可以帮助在这个过程中很容易。 任何帮助,高度赞赏。

从Excel / VBA调用Scala函数

我知道使用C ++可以创build包含某些函数的DLL文件,然后将其导入到Excel中(例如,通过VBA)。 让我们来看看下面的C ++函数 double __stdcall square_it(double &x) { return x*x; } 我们假设它被合并在square.dll中,以便我们可以使用下面的VBA导入 Declare PtrSafe Function square_it Lib "square.dll" (ByRef x As Double) As Double Private Sub TestSub() MsgBox square_it(4.5) End Sub 所以我的问题是:是否有可能在Scala中编写一个函数,然后以类似的方式从VBA调用它?

如何解压zip文件使用scala?

基本上我需要解压缩一个.zip文件,其中包含一个名为modeled的文件夹,该文件夹又包含一些excel文件。 我find了一些已经写好的代码(zipArchive),这个代码是为了解压缩zip文件,但是我不知道为什么当我使用它的时候会抛出一个错误信息。 下面列出了ZipArchive的代码和错误消息: import java.io.{OutputStream, InputStream, File, FileOutputStream} import java.util.zip.{ZipEntry, ZipFile} import scala.collection.JavaConversions._ object ZipArchive { val BUFSIZE = 4096 val buffer = new Array[Byte](BUFSIZE) def unZip(source: String, targetFolder: String) = { val zipFile = new ZipFile(source) unzipAllFile(zipFile.entries.toList, getZipEntryInputStream(zipFile)_, new File(targetFolder)) } def getZipEntryInputStream(zipFile: ZipFile)(entry: ZipEntry) = zipFile.getInputStream(entry) def unzipAllFile(entryList: List[ZipEntry], inputGetter: (ZipEntry) => InputStream, […]

如何在Scala中读取Excel文件

有没有办法读Scala中的Excel文件(xls不是csv)? 我的意思是有没有Scala图书馆这样做?

有没有Apache POI的Scala包装?

我想使用Apache POI在Scala应用程序中读取/创buildExcel文件。 当然,我可以直接使用POI库,毕竟它是Java,但我希望有Scala的感觉。 那么是否有一个Scala包装带来了斯卡拉的感觉(使用隐式转换),也就是某种“Scala-POI-DSL”可以免费获得?