测试unicode字符串

你好,
我在脚本中有正则表达测试.当Unicode字符
在正则评估中测试了一个错误:
UnicodeError:ASCII解码错误:不在范围内的序数(128)
问题:是否有一种方法可以测试Unicode Chars的字符串(即测试
如果字符串会抛出上面引用的错误).
喜欢:
如果Unicode字符串:
打印"字符串线#"
别的:
处理字符串
如何在上面的伪代码中引用的"如果Unicode字符串"?
谢谢,仍然使用Python 2.1

# 回答1


2007/10/24,GoldTech ::
是的,:)
真的
真的
错误的
真的
错误的
-http://noneisyours.marcher.name http://feeds.feedburner.com/noneisyours(_@@_)
GoldTech写道:
怎么样:
如果ORD(max(thestring))> = 128:
打印"任何你想要的"
-Scott David Daniels schedebydeydeythythy@acm.org
# 回答2


我在脚本中有正则表达测试.当Unicode字符
当然:
尝试:
s.decode(" ASCII")
除了UnicodeError:
打印"字符串线#"
别的:
处理字符串
请注意,您会收到 *解码 *错误,因此您没有测试
Unicode字符,但字节字符串.
hth,
马丁
# 回答3


* GoldTech(2007年10月24日,星期三12:09:24 -0700)
正如马丁指出的那样:您 *不 *使用Unicode ...
有,但这不是您的问题,如果不是
正确的解决方案.
阅读http://www.amk.ca/python/howto/unicode.你至少应该有
在尝试使用Unicode之前,对Unicode的了解最少.
陷入麻烦的最佳方法.
Thorsten
# 回答4


狙击...
如果我使用" re.unicode"喜欢:m = re.match(r" \ w+",s,re.unicode)
然后似乎解决了我的问题.试图尽可能多地阅读
Unicode ....

标签: python

添加新评论