Tag: unicode

Python 2.7 – xlrd – 将string匹配到单元格值

在Mac OSX Lion上使用Python 2.7和xlrd 我的问题相对简单直接。 我试图将一个string匹配到一个excel单元格值,以确保在该值将匹配的行内的其他数据是正确的值。 所以,比如说那个player = 'Andrea Bargnani' ,我想匹配一个看起来像这样的行: Draft Player Team 1 Andrea Bargnani – Toronto Raptors 我做: num_rows = draftSheet.nrows – 1 cur_row = -1 while cur_row < num_rows: cur_row += 1 row = draftSheet.row(cur_row) if row[1] == player: ranking == row[0] 问题是, row[1]的价值是text:u'Andrea Bargnani ,而不仅仅是Andrea Bargnani 。 我知道,在Excel 97之后的Excel,全是unicode。 但是,即使我做了player […]

Python Pandas将string转换为NaN

所以我用大pandas来阅读excel文件和csv文件。 这些文件包含string和数字不只是数字。 问题是我所有的string都被转换成了我不想要的NaN。 我不知道列的types是什么时候会提前(实际上我的工作是处理这个系统),所以我不能告诉大pandas他们将会是什么样的(后来肯定会来的)。 我只想在每个单元格中读取一个string。 这是我的代码 if csv: #check weather to read in excell file or csv frame = pandas.read_csv(io.StringIO(data)) else: frame = pandas.read_excel(io.StringIO(data)) tbl = [] print frame.dtypes for (i, col) in enumerate(frame): tmp = [col] for (j, value) in enumerate(frame[col]): tmp.append(unicode(value)) tbl.append(tmp) 我只需要能够生成列明智的二维列表,我可以做任何事情从那里。 我也需要能够处理Unicode(数据已经在Unicode)。 我如何构build'tbl',使得应该是string的单元格不会以“NaN”出现?

Excel不显示Unicode字符

我试着用下面的代码打印Unicode字符(UTF-16): Sub PrintUnicode() For Each Cell In Range("A1:J6553") '2^16/10: displays 10 chars in each line Cell.Value = ChrW(i) i = i + 1 Next End Sub 示例输出: 所以实际的字符编号如果你愿意的话: 10*(RowNumber-1) + ColumnNumber 在向下浏览电子表格之后,我开始注意到空行。 玩这些行,我注意到一些单元格看起来是空的,其他单元格有不可见的值,只有当你双击单元格才可见。 我把它们过滤掉了 有人可以向我解释这个意外的行为吗?

需要的方法来将Excel编码转换为制表符分隔的txt文件

我有一些Excel文件中包含一些法文字符,例如,“让 – 莱昂Gérôme”,当我将Excel文件转换为制表符分隔txt文件,默认编码是ANSI和法文字符变成了胡言乱语,所以我需要一种方法,可以转换Excel文件以制表符分隔的文件,同时用Unicode编码。 (我知道excel可以直接导出到Unicode文本,但这不是我所需要的,我需要在制表符分隔txt文件和Unicode编码) 请帮忙。 非常感谢!

在VBA StrConv中使用Unicode

我有一个Excel文件和一个用户表单,用户可以input学生的详细信息,表单将检查重复,然后将信息添加到表的最后一行。 我想通过使用这个代码使表单大写每个名字的第一个字母来进一步改进: Me.Surname.Value = StrConv(Me.Surname.Value, vbProperCase) Me.Surname.Value是表单的input,主要是Trần,Nguyễn,Thảo等越南语。但是,在经过StrConv之后,它们变成了类似Tr?n,Nguy?n,Th?o的东西。 我读了一些build议,并将我的语言环境更改为越南语,但问题仍然存在。 你有什么build议来解决这个问题吗? 我正在考虑将input转换为hex值,然后使用ChrW()写下来,但我找不到一种方法来做到这一点。

如何在Excel 2016 VBA编辑器中启用Unicode

我在单元格A1中有一个工作表希伯来语单词“שלום”。 我正在尝试运行这个VBA代码: Sub test() Dim str As String str = Range("A1") MsgBox str End Sub 消息框显示: ???? 另外,当我尝试用VBA代码写希伯来语字母: if range("A1") = "שלום" then 'do something…' 而不是希伯来字母,我看到的是胡言乱语。 我在Windows 10上使用Excel 2016。安装了希伯来语语言包。 我在Windows 7上的Excel 2010中没有遇到这个问题。 任何人在Vba代码中启用希伯来语(或一般Unicode)的想法?

Excelmacros源代码字符编码问题

我的日本同事创build了Excel 2010macros。 当我尝试在Excel中编辑macros时,注释有怪异的字符。 似乎有一个字符编码问题。 这是一些示例代码: Option Explicit 'ƒtƒ@ƒCƒ‹Ši”[ƒpƒXŽw'è iRow,Col j 'DefineXMLƒtƒ@ƒCƒ‹ Public Const P_stTempRow = 5 Public Const P_stTempCol = 3 我检查了是否有方法来改变用于解释源代码的编码,但看不到任何设置。

如何检查一个string(或单元格)中是否有kajji字符?

我为一家日本公司工作。 因为发给我的excel表格大部分都是日文。 所以我创build了一个Excelmacros,提示用户select他们想要翻译的单元格范围。 macros循环通过单元格值范围,将其复制到Google翻译文本框中,等待翻译,复制翻译并将单元格值设置为翻译。 现在所有这些都在工作,我可以翻译任何我投掷的范围。 我遇到的问题是翻译文档所花费的时间。 我尽我所能,加快了与谷歌的连接。 接下来我看到放慢macros观的一个事实是,我无法find一个简单的方法来确定一个单元格是否包含任何日语(平假名,片假名,汉字)。 所以我正在寻找一个基本上这样的function: Function isJapanese(cell as Range) If cell.Value is Japanese Then isJapanese = True Else isJapanese = False End If End Function 我已经在检查string是否包含拉丁字母(这使得它跳过一些单元格),某些符号,以及任何其他字符或string,我认为这是唯一的英文单元格。 下面是我到目前为止的代码(我正在使用用户表单来获取翻译function的variables) Function Translate_Range(rng As String, in_exp As String, out_exp As String) As Boolean Dim japCheck As Boolean, japCount As Integer, cellAddress As String, transText As […]

使用pyodbc将数据从excel导入python中的postgres

我使用pyodbc将数据从MS-Excel导入到python(2.6) PostgreSQL 。 面临的问题是: 在excel源文件中有left single quotation mark(ANSI hex code : 0x91)等字符。 现在,当它使用pyodbc导入到PostgreSQL中时,它会终止并给出错误DatabaseError: invalid byte sequence for encoding "UTF8": 0x91 。 我试过的:我decode('unicode_escape')使用了decode('unicode_escape') 。 但是,这不能完成,因为这只是删除/逃避有关人物。 备用试用:最初解码,到处都是Unicode,然后在数据库需要时进行编码。 由于手头项目的扩张,这也无法完成。 请给我build议一些方法/程序/内置函数来完成任务。

如何将Unicode输出写入.csv以在Excel中使用?

我有一个包含中文字符的数据集,我使用UTF-8进行处理。 部分数据如下所示: encod cKeyword UTF-8 <U+5169><U+7528> <U+5305> 27 bloide herme UTF-8 <U+593E> <U+62C9><U+934A> <U+9577> loewe UTF-8 <U+5169><U+7528> <U+5305> <U+8FF7><U+4F60> 31 lim pashli phillip UTF-8 <U+5305> <U+624B><U+62FF> givenchy pandora 当我使用write.csv(data, "file.csv", fileEncoding = "UTF-8") ,我得到一个.csv文件,当打开时,在Excel中显示完全一样的东西。 但是我需要将Unicode显示为中文字符。 我怎样才能把它写成汉字呢?