在Unicode CSV文件中不显示孟加拉语文本

我有一个孟加拉语言的Excel文件。 要正确显示孟加拉语文本,我需要在PC上安装孟加拉语字体。

我使用Office 2010将Excel文件转换为CSV文件,但只显示'?' 标记而不是孟加拉语字符。 然后,我使用Google文档进行转换,但是出现了相同的问题,但使用了无法读取的字符,而不是“?”。 我把这个文件中的摘录粘贴到一个HTML文件中,并试图在我的浏览器中不成功地查看它。

我该如何从孟加拉语的.xlsx文件中获取CSV文件,以便将其导入到MySQL数据库中?

编辑 :在这个SO问题接受的答案让我去Google文档。

根据对使用UTF8编码的Excel到CSV的问题的答案,Google文档应该正确保存CSV,与Excel相反,这会破坏所有在“ANSI”编码中不可表示的字符。 但也许他们改变了这个,或者是错误的,或者是对情况的分析是不正确的。

对于在MS Office程序中正确编码的Bangla(孟加拉语),应该不需要任何“Bangla字体”,因为Arial Unicode MS字体(随Office附带)包含Bangla字符。 那么数据实际上是在一些依赖于特殊编码字体的非标准编码中呢? 在这种情况下,应该首先将其转换为Unicode,尽pipe可能以某种方式使用持续使用该特定字体的程序进行pipe理。

在Excel中,使用另存为时,可以select“Unicode文本(* .txt)”。 它将数据以UTF-16编码方式保存为TSV(制表符分隔值)。 然后,您可能需要将其转换为使用逗号作为分隔符而不是制表符,和/或从UTF-16到UTF-8。 但是这只有在原始数据被正确编码的情况下才有效。