赞
踩
中文乱码解析:
乱码的本质是用来解码的方式不对,而且乱码一般只会出现在中文等语言中。我们常见的就是gb2312、gbk、iso8859-1、utf8四种编码。在实际使用的时候,gbk可以兼容gb2312和iso8859-1,因此如果你html页面上用的是gb2312或者iso8859-1,那么后台就可以直接用gbk去解码。
中文参数编码、解码的流程如下:
中文参数---->以A方式编码---->浏览器以B方式编码将信息发送到后台---->后台以C方式解码,在这个过程中,A、B、C编码方式有任何一个不统一的就会产生乱码。一般我们解码都是在后台解码,也就是将C编码方式和A、B统一起来。
解码:
1.Post方式浏览器会以页面编码的方式将信息传递出去,那么A和B方式一定相同,那么在post方式中我们在后台用
request.setCharacterEncoding("编码方式")
方法将参数进行统一的解码就可以了。
2.Get方式和post不同的地方在于不论网页使用什么编码的,浏览器都会使用默认的iso8850-1编码方式将信息发送到后台,因此流程中A和B是不一定统一的。不过这其中的B编码方式已经确定了是iso8859-1,所以我们可以先取得传递过来的参数,然后用iso8859-1解码,然后再使用网页编码方式A进行解码。(网页编码使用的肯定不会是iso8859-1,因为iso8859-1是无法解析中文的)。你必须先用iso8859-1解码,否则不能解码成功,使用get方式提交的中文相当于加密了两次。
str = new String(str.getBytes(“iso8859-1”),”utf-8”)
3.response响应内容包含中文乱码问题解决方案
3.1设置HttpServletResponse使用utf-8编码
Response.setCharacterEncoding(“utf-8”);
通知浏览器使用utf-8进行解码
Response.setHeader (“content-Type” , “text/html;charset=utf-8”);
3.2 替换3.1方案
Response.setcontentType(“text/html;charset=utf-8”);
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。