Tag: unicode

Python CSV写入文件在Excel中无法读取(中文字符)

我正在尝试对中文文本进行文本分析。 该程序在下面提供。 我得到了浜烘皯鏃ユ姤绀捐辨认的人物的结果。 如果将输出文件result.csv更改为result.txt ,则这些字符与人民日报社论 。 那么这有什么问题? 我无法弄清楚。 我尝试了几种方法,包括加decoder和encoder 。 # -*- coding: utf-8 -*- import os import glob import jieba import jieba.analyse import csv import codecs segList = [] raw_data_path = 'monthly_raw_data/' file_name = ["201010", "201011", "201012", "201101", "201103", "201105", "201107", "201109", "201110", "201111", "201112", "201201", "201202", "201203", "201205", "201206", "201208", "201210", "201211"] jieba.load_userdict("customized_dict.txt") […]

在Unicode CSV文件中不显示孟加拉语文本

我有一个孟加拉语言的Excel文件。 要正确显示孟加拉语文本,我需要在PC上安装孟加拉语字体。 我使用Office 2010将Excel文件转换为CSV文件,但只显示'?' 标记而不是孟加拉语字符。 然后,我使用Google文档进行转换,但是出现了相同的问题,但使用了无法读取的字符,而不是“?”。 我把这个文件中的摘录粘贴到一个HTML文件中,并试图在我的浏览器中不成功地查看它。 我该如何从孟加拉语的.xlsx文件中获取CSV文件,以便将其导入到MySQL数据库中? 编辑 :在这个SO问题接受的答案让我去Google文档。

将Unicodestring写入Excel 2007

我正在使用pyodbc连接到MS SQL服务器。 此外,我正在尝试使用openpyxl写入Excel 2007/10 .xlsx文件。 这是我的代码(Python 2.7): import pyodbc from openpyxl import Workbook cnxn = pyodbc.connect(host = 'xxx',database='yyy',user='zzz',password='ppp') cursor = cnxn.cursor() sql = "SELECT TOP 10 [customer clientcode] AS Customer, \ [customer dchl] AS DChl, \ [customer name] AS Name, \ … [name3] AS [name 3] \ FROM mydb \ WHERE [customer dchl] = '03' […]

php-excel-reader – UTF-8的问题

我使用php-excel-reader 2.21将XLS文件转换为CSV。 我写了一个简单的脚本来做到这一点,但我有一些Unicode字符的问题。 它不返回某些单元格的值。 例如,它没有单元格内容的问题,但是与nákup , VÝROBCE , PÁS , HRUBÝ , NÁKLADNÍ和其他一些问题有关。 在这些单元格中,它返回空值( "" )。 以下是我用于转换的代码段: <?php set_time_limit(120); require_once 'excel_reader2.php'; $data = new Spreadsheet_Excel_Reader("cenik.xls", false, 'UTF-8'); $f = fopen('file.csv', 'w'); for($row = 1; $row <= $data->rowcount(); $row++) { $out = ''; for($col = 1; $col <= $data->colcount(); $col++) { $val = $data->val($row,$col); // escape […]

通过Unicode字符的JavaScript生成Excel的CSV

我正在尝试使用JavaScript在客户端生成一个CSV文件。 我已经按照这个stackoverflow问题的答案 。 我的内容中有unicode字符(在我的情况下是希伯来字符)。 文件生成成功,但是当我在Excel中打开文件 – 所有的Unicode字符显示为有趣的字符。 ASCII字符(英文和数字)很好地呈现。 奇怪的是,如果我在记事本中打开文件,unicode字符显示良好。 所以我想这与Excel和我保存文件的方式有关。 有任何想法吗?