UDN-企业互联网技术人气社区

板块导航

浏览  : 2074
回复  : 9

[讨论交流] Python3与JavaScript escape 传输确保数据正确方法和中文乱码...

[复制链接]
htmlman的头像 楼主
发表于 2017-2-10 11:03:04 | 显示全部楼层 |阅读模式
  前几天用Python的Bottle框架写个小web程序,在进行Ajax交互之时,前端则先用 JSON.stringify 来将类序列化,然后用escape() 函数将其编码,确保传输正确。

  再基本上配合上Jquery的$.ajax应该就可以了,可能是经验不足,即使编码之后的数据依然在 Python 中难以处理。

  后来慢慢思考出一种方式,在网上也发现了类似的方式,于是将其实现。

  基本思路如下:
  1. escape('你好世界ABC');
  2. //返回 "%u4F60%u597D%u4E16%u754CABC"
复制代码

  这串字符串提交到Bottle后,我利用Python 的 urllib 进行解码,结果发现一个问题。。
  1. >>> urllib.parse.unquote('%u4F60%u597D%u4E16%u754CABC')
  2. '%u4F60%u597D%u4E16%u754CABC'
  3. >>>
复制代码

  这个字符串该是什么样子还是什么样子,于是研究了片刻,然后傻逼的发现,这个压根就已经不是URL编码的字符了,不能用 unquote解了。。

  我们应该用 decode('UTF-8')!

  %uXXXX 是JavaScript转成 Unicode 的样子。所以我们必须要使它变成 \uXXXX 的Unicode的标准形式

  而且Python中 unquote 只能对str进行URL解码,所以这个是对Unicode编码的中文字符是无法解开的,那么我就必须使用 decode('UTF-8');

  但是收到的字符又是str,不存在什么decode,只有encode。后来查了下手册找到了个  urllib.parse.unquote_to_bytes 函数,可对Str进行URL解码,并且返回 byte。

  对的,要的就是这个,然后依据返回的byte,就可以对其使用 decode 。

  于是我就写了一个:
  1. def load_json(value):
  2.     value = value.replace('%u','\\u') #将%uxxxx 替换换 \uxxxx 这才可以进行utf-8解码
  3.         byts = urllib.parse.unquote_to_bytes(value) #返回的 byte
  4.     byts = byts.decode('UTF-8') # decode UTF-8 解码只能解开 \uXXXX 的Unicode 标准形式
  5.     return json.loads(byts)
复制代码

  并且做以下测试:
  1. escape('{"value":[123,"你好世界ABC"]}')
  2. //"%7B%22value%22%3A%5B123%2C%22%u4F60%u597D%u4E16%u754CABC%22%5D%7D"
复制代码

  Python Shell:
  1. >>> load_json('%7B%22value%22%3A%5B123%2C%22%u4F60%u597D%u4E16%u754CABC%22%5D%7D')
  2. {'value': [123, '你好世界ABC']}
复制代码

  恭喜测试成功,看起来已经成功了。

  总结:

  这样的话,纵使再如何的字符,都会被Unicode编码。JavaScript采用 escape(其他也行)来对字符进行UTF-8编码,虽然得到的是%uXXXX,但是你可以传化为 \uXXXX 的标准形式。

  而且就算某些特别任性浏览器不会变成 %uXXXX,我们也只是 替换的%u,并不会影响实际的字符。

  过程:
  1. JavaScript Object -> JSON.stringify(obj) -> escape(json_str) -> 浏览器的自动URL编码(任性除外) -> Python urllib URL decode -> %uXXXX 替换 \uXXXX -> decode('UTF-8') -> json.load();
复制代码

相关帖子

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关于我们
联系我们
  • 电话:010-86393388
  • 邮件:udn@yonyou.com
  • 地址:北京市海淀区北清路68号
移动客户端下载
关注我们
  • 微信公众号:yonyouudn
  • 扫描右侧二维码关注我们
  • 专注企业互联网的技术社区
版权所有:用友网络科技股份有限公司82041 京ICP备05007539号-11 京公网网备安1101080209224 Powered by Discuz!
快速回复 返回列表 返回顶部