Tag: 编码

什么是正确的CSV编码的C#打开Excel?

我使用基于StreamWriter的C#CSVWriter编写了一个CSV文件。 在我的资料中,我有很多像“Bávaro”这样的特殊字符。 所以,当我使用UTF-8或ASCII来编码我的CSV时,我无法得到“á”,但是我可以在Excel中完美地打开它。 当我使用Unicode我的CSV有正确的字符,但事实上,当我在Excel中打开此CSV它不会自动sorting像我的其他CSV,所有的值都在第一列作为string…. 什么是正确的编码在这里?

需要的方法来将Excel编码转换为制表符分隔的txt文件

我有一些Excel文件中包含一些法文字符,例如,“让 – 莱昂Gérôme”,当我将Excel文件转换为制表符分隔txt文件,默认编码是ANSI和法文字符变成了胡言乱语,所以我需要一种方法,可以转换Excel文件以制表符分隔的文件,同时用Unicode编码。 (我知道excel可以直接导出到Unicode文本,但这不是我所需要的,我需要在制表符分隔txt文件和Unicode编码) 请帮忙。 非常感谢!

在MS Office中作为符号来的阿拉伯文字

在从我的项目中导出文件时,Windows 7阿拉伯语文本以符号forms出现。 我正在使用MS Office 2007,我的项目是在轨道上。 是编码问题还是别的什么? 我在这里附上屏幕截图 filename = "Print Batch CSV- #{Time.now.to_date.to_s}.csv" send_data(csv_string, :type => 'text/csv; charset=utf-8; header=present', :filename => filename) 这是编写csv的代码。 问题是与MIMEtypes或编码?

我怎样才能得到在C#中的Excel文件的编码? 它总是返回“Windows 1252”

if (bom[0] == 0xef && bom[1] == 0xbb && bom[2] == 0xbf) // BOM Check { encodingType = Encoding.UTF8;// UTF8 Returns } 我保存文件为UTF8编码,但这部分总是被跳过

汉字编码与不同的操作系统/语言

我无法读取包含简体中文字符的csv文件到我的r。 我试过了encoding = utf-8,gb18130,gb2130等等。中文字符不能显示。 我也尝试通过excel改变编码为utf8 csv,没有运气。 我也尝试使用中文窗口,并将语言环境设置到中国。 没有运气。 当我换成中文窗口后 excel可以打开我的csv(英文窗口无法正确打开)。 r工作室可以在View()中打开它,但是即使我重新安装r作为中文版本,R控制台控制台也不能读取我的csv文件。 我试过Ubuntu,Ubuntu甚至根本读不了我的csv。 至less在Windows中,R工作室可以很好地读取我的数据。 我试过谷歌表。 但是我的文件太大,Google表格甚至不能打开它 我厌倦了Ubuntu中的Cals并将其转换为GB *,因为GB在Windows R工作室中工作正常。 没有运气。 而我的200Mb-750Mb数据转换成gb18013需要10多分钟的时间

Javascript导出CSV编码UTF-8的问题

我需要将JavaScript数组导出到CSV文件并下载。 我这样做了,但是'ı,ü,ö,»,这个字符看起来像CSV文件中的'ıÃÃÃÄÄŸÅŸ' 。 我已经尝试了很多在这个网站推荐的解决scheme,但没有为我工作。 我添加了我的代码片段,任何人都可以解决这个问题? var csvString = 'ı,ü,ö,ğ,ş'; var a = window.document.createElement('a'); a.setAttribute('href', 'data:text/csv; charset=utf-8,' + encodeURIComponent(csvString)); a.setAttribute('download', 'example.csv'); a.click();

iOS导出的CSV中的货币符号在Excel中无法正确显示

我正在使用NSUTF8StringEncoding导出在CHCSVParser的帮助下生成的CSV文件。 由于现在一切都很完美,字段只有文本或数字,但今天我试图添加一个货币字段,它显示了写在UITextfield中的货币符号。 如果将.csvfile upload到Google文档,则符号可以正确显示,但是如果使用文本向导将其导出到Excel,则会显示符号 (这是欧元符号)。 有谁知道如何使excel正确显示符号?

Pythonpandas不能读取一些奇怪的编码和拆分窗格旧的Excel文件

我正在尝试将一个旧的Excel文件导入pandas。 该文件是由cropSyst软件使用旧格式(我不知道)生成的,它默认情况下有分割窗格。 这是一个快照 一个解决scheme可以是用excel打开文件并将其保存在xlsx中:这样pandas可以毫无问题地读取它,但是我必须处理大量的文件(> 40000),所以这是不可行的。 当试图用pandasimport它 pd.read_excel(filename) 我得到这个错误 error: unpack requires a string argument of length 3 *** No CODEPAGE record, no encoding_override: will use 'ascii' 我也试着把它导入为csv pd.read_csv(filename) 但它只读取一些数据,我尝试使用行分隔符和单元格分隔符的不同组合,没有运气。 你有什么build议吗? 编辑 正如@jmcnamara在评论中所build议的,我尝试用Python中所有可用的编码来覆盖文件的编码,但仍然没有运气:它不能正确parsing文件。 这里可以下载一个xls文件 https://drive.google.com/file/d/0B5smcFuBd6EtdFE5eEktZXZVTkU/view?usp=sharing

用Python中的csv模块读入.xlsx

我正在尝试使用.xlsx格式的csv模块来读取excel文件,但是即使使用我指定的方言和编码来使用excel文件,我也没有任何运气。 下面,我展示了我尝试过的不同编码的不同尝试和错误结果。 如果任何人都可以将我指向正确的编码,语法或模块,我可以用Python读取.xlsx文件,我会很感激。 用下面的代码,我得到以下错误: _csv.Error: line contains NULL byte #!/usr/bin/python import sys, csv with open('filelocation.xlsx', "r+", encoding="Latin1") as inputFile: csvReader = csv.reader(inputFile, dialect='excel') for row in csvReader: print(row) 使用下面的代码,我得到以下错误: UnicodeDecodeError: 'utf-8' codec can't decode byte 0xcc in position 16: invalid continuation byte #!/usr/bin/python import sys, csv with open('filelocation.xlsx', "r+", encoding="Latin1") as inputFile: csvReader = csv.reader(inputFile, […]

保存文件时采用Interop.Excel UTF-8编码

我遇到问题,将Excel文件保存为UTF-8编码的CSV文件。 因为我的Excel文档中有非标准字符(不同的语言),所以在保存为CSV时会引发问题。 这是通过将Web选项编码设置为UTF-8来解决的。 我正在创build一个基本的C#程序,用于parsingExcel文件中的数据并将其保存为CSV格式,但无法使用UTF-8编码进行保存。 我正在使用Microsoft.Office.Interop.Excel来处理Excel文件。 这是我的代码: private Excel.Application application = new Excel.Application { Visible = false }; private Excel.Workbook Workbook = application.Workbooks.Open(OrigionalFileUrl); Workbook.SaveAs(NewFileUrl); 我试过设置 application.DefaultWebOptions.Encoding = MsoEncoding.msoEncodingUTF8; 但它不起作用,并且我得到的CSV文件在涉及到具有特殊字符的部分时总是一团糟。 谢谢!