jsp中文乱码现象解决办法

Java Web后端知识 专栏收录该内容
30 篇文章 3 订阅

之前总是碰到JSP页面乱码的问题,每次都是现在网上搜,然后胡乱改,改完也不明白原因。

这次正好作下总结,中文乱码就是因为编码不符,可能出现乱码有5个地方:

1 JSP编码乱码

2 HTML编码乱码

3 request获取数据乱码

4 response输出信息乱码

5 Cookie导致的编码问题

下面将会对上面几种情况进行介绍:

1. JSP乱码

    这种是最常见的,设置编码的位置位于JSP的第一行,如果在Eclipse中新建一个JSP默认是下面这种:

<%@ page language="java" contentType="text/html; charset=ISO-8859-1" pageEncoding="ISO-8859-1"%>

    可以看到它默认的页面编码和传输编码都是ISO-8859-1,这是用于欧洲国家的编码。

     可以通过设置Eclipse中JSP的编码格式,来修改默认生成的编码格式。

 

如果想要支持中文,可以使用UTF-8、GB2312、GBK等,其中UTF-8是国际化的,哪个国家的都支持,所以推荐使用这个。

  再来说说上面涉及到编码的两个地方:charset 和 pageEncoding

  charset是指服务器发往客户端展现时的编码;

  pageEncoding用于设置JSP页面本身的编码。

JSP在部署后提供给用户使用,会经过三个阶段:

  1 JSP生成java文件:这个阶段会使用pageEncoding所定义的编码格式进行转换

  2 java文件生成class文件:这个阶段由服务器tomcat自动使用utf-8编码把java文件转换成字节码class文件  

  3 通过读取class文件展现给用户:这个阶段由tomcat服务器获取字节码内容,通过使用contentType所定义的编码格式展现给用户。

  大致过程如下图:

 

这样设置好JSP中的第一行代码,就可以保证基本的JSP展现没有乱码了!

<%@ page language="java" contentType="text/html; charset=UTF-8" pageEncoding="UTF-8"%>

2. HTML乱码

因为JSP中也包含HTML的内容,HTML本身也是有编码格式的。

<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
<title>Insert title here</title>
</head>
<body>

</body>
</html>

如果这部分编码出现问题,那么HTML中标签的中文命名就会出现乱码。

HTML中因为只涉及到表现层,所以只有一个属性content中charset,这个编码格式设置对了,就没问题了。
 

3. request中文乱码

有时候在做jsp逻辑处理时,比如提交表单,从前台注册的页面提交了一部分的数据,但是后面处理的JSP页面,通过 request.getParameter 调用时,获取到的是一堆乱码。

这是因为虽然前面JSP设置了编码格式,却没有在当前的JSP中设置读取数据的编码格式。

使用下面的代码,就可以是设置request获取请求内容的数据编码:

request.setCharacterEncoding("UTF-8");

需要注意的是,这种方式对 URL传参这种JSP请求 是没有作用的。比如:

<a href="jspRequest.jsp?username=lisi">url test request(en)</a>
<a href="jspRequest.jsp?username=李四">url test request(zh)</a>

这种情况仍然会出现乱码,这种URL传参的方式,只能修改服务器tomcat的传输编码格式。

修改tomcat安装文件 apache-tomcat-6.0.43\conf 目录下的server.xml

添加 URIEncoding="UTF-8" ,就可以处理URL传递参数造成的中文乱码问题了。

4. response输出中文乱码

可能现在已经没有多少使用这种方式输出页面的了,但是还是有必要说一下,response输出页面元素内容时,也会出现乱码。

使用下面代码就可以设置response输出的编码格式:

response.setContentType("text/html;charset=UTF-8");

5. cookie造成的中文乱码

Cookie由于需要保存在客户端中,因此使用过程中都需要编码以及转码:

在保存Cookie数据前

  首先引入java.net.*,该包中包含URLEncoder类;

  保证response与request的编码正确;

  使用URLEncoder进行转码,并保存。

<%@ page language="java" contentType="text/html; charset=UTF-8"
    import="java.net.*"
    pageEncoding="UTF-8"%>
<%
//保证request以及response的编码 
request.setCharacterEncoding("UTF-8");
response.setContentType("text/html;charset=UTF-8");

//使用URLEncoder解决cookie中中文问题
String username = URLEncoder.encode(request.getParameter("username"),"UTF-8");
String password = URLEncoder.encode(request.getParameter("password"),"UTF-8");
            
Cookie usernameCookie = new Cookie("username",username);
Cookie passwordCookie = new Cookie("password",password);
usernameCookie.setMaxAge(864000);
passwordCookie.setMaxAge(864000);
            
response.addCookie(usernameCookie);
response.addCookie(passwordCookie);
%>

 在使用Cookie数据前

  依然要注意导入必备的包:java.net.*

  注意request的编码;

  使用URLDecoder进行解码

 
<%@ page language="java" import="java.util.*,java.io.*,java.net.*" contentType="text/html; charset=UTF-8" pageEncoding="UTF-8"
%>
<%
        request.setCharacterEncoding("UTF-8");
    
        String username = "";
        String password = "";

        Cookie[] cookies = request.getCookies();
        if(cookies!=null && cookies.length>0){
            for(Cookie c:cookies){
                if(c.getName().equals("username")){
                    username = URLDecoder.decode(c.getValue(),"UTF-8");
                    System.out.println(username);
                }
                if(c.getName().equals("password")){
                    password = URLDecoder.decode(c.getValue(),"UTF-8");
                }
            }
        }
%>

有时候还可能出现以下乱码现象:

1. URL传递参数中文乱码

<%@ page language="java" import="java.util.*" pageEncoding="gb2312"%>  
    
<html>  
<head>  
  
<title>URL传递参数中英文处理示例</title>  
</head>  
    <%  
        String param = request.getParameter("param");  
     %>  
<body>  
    <a href="URLCharset.jsp?param='中文'">请单击这个链接</a>  
    您提交的这个参数为:<%=param %>  
</body>  
</html>  

启动tomcat运行结果出现url传递的中文乱码:

这里我们需要配置tomcat服务器文件,才能解决这个问题。具体方法是,在tomcat的conf目录下找到server.xml配置文件,找到如下代码

<span style="font-size:18px">  <Connector port="8080" protocol="HTTP/1.1"  
               connectionTimeout="20000"  
               redirectPort="8443"  /></span>  

在后面添加上编码方式,URIEncoding="gb2312" 重新启动tomcat问题就解决了。

2, 表单提交中问乱码

对于表单中提交的数据,可以用request.getPraramter("");方法来获取,但是当表单中出现中文数据的时候就会出现乱码。

我们的提交表单的页面,FormCharset.jsp页面如下:

<%@ page language="java" contentType="text/html; charset=GB18030"  
    pageEncoding="GB18030"%>  
<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd">  
<html>  
<head>  
<meta http-equiv="Content-Type" content="text/html; charset=GB18030">  
<title>Form中文处理示例</title>  
</head>  
<body>  
    下面是表单内容:  
    <form action="AcceptFormCharset.jsp" method="post">  
        用户名:<input type="text" name="userName" size="10" />  
        密    码:<input type="password" name="password" size="10"/>  
        <input type="submit" value="提交"/>  
    </form>  
</body>  
</html>  

 我们的AcceptFormCharset.jsp页面:

<%@ page language="java" contentType="text/html; charset=GB18030"  
    pageEncoding="GB18030"%>  
<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd">  
<html>  
<head>  
<meta http-equiv="Content-Type" content="text/html; charset=GB18030">  
<title>Form中文处理示例</title>  
</head>  
<body>  
    下面是表单提交以后request取到的表单的数据:<br>  
    <%  
        out.println("表单输入的userName值为:" + request.getParameter("userName") +"<br>");  
        out.println("表单输入的pasword值为:" +request.getParameter("password") + "<br>");  
     %>  
</body>  
</html>  

提交表单:

结果如下:

在表单中的中文数据出现了乱码,为什么楚翔这种情况呢?是因为我们的tomcat中,对于以post方式提交的表单编码格式默认为ISO-8859-1的编码格式,而这种编码格式是不能编码中文的,所以就会出现乱码的现象了。对于这种情况,我们可以对表单中的数据进行处理,在取得表单参数的时候设置编码方式,我们更改了我们的接受表单数据的页面如下所示:

<%  
    String userName = request.getParameter("userName");  
    String passWord = request.getParameter("password");  
    out.println("表单输入的userName值为:" +  new String(userName.getBytes("ISO-8859-1"),"gb2312")+"<br>");  
    out.println("表单输入的pasword值为:" + new String(passWord.getBytes("ISO-8859-1"),"gb2312")+"<br>");  
 %>  

这样就得到我们想要的效果啦:

3. 数据库操作中文乱码

我们在建立数据库的时候,最好是能选择支持中文编码格式,最好是能和jsp页面编码格式保持一致,这样就尽可能的减少数据库操作中文乱码的问题,最开始的连接数据库的时候,编写好数据库的编码策略,也就是使用这种形式的URL:jdbc:Oracle:thin:@localhost:1521:TEST;userEnicode=true;characterEncoding=gb2312; 这样我们选择的数据库的编码和我们的jsp编码就一致了。

写入到数据库的时候,数据库中中文乱码:

但是如果我们在最开始的时候没有对数据库的编码进行设置,并且我们的数据库中已经有大量的数据的话,我们再向数据库中写入中文数据,数据库中的中文显示为乱码。在写入数据的时候出现乱码,是因为我们在处理表单的时候没有对字符的编码设置,对于这种情况,我们在jsp中或servlet中加入:

rquest.setCharacterEncoding("gb2312");//处理表单请求的时候设置编码。

 这样再看我们的数据库,插入的中文字段就不会乱码了。

从数据库中读出中文乱码:

数据库中的中文出现乱码,就是在读取数据库的时候进行转码,这样显示就不会乱码了。我们整理这样的一个转码函数:

public String encoder(String str) throws UnsupportedEncodingException

{

           String result = new String(str.getBytes("ISO-ISO-8859-1)"),"gb2312");

}

4. Filter批量设置编码格式

对于每一个jsp或servlet我们都要设置编码格式,效率有些低,我们的servlet的Filter解决了我们的问题。

需要强调的一点,开始使用java model1模型的时候,我们在web.xml中配置只需要配置好jsp页面就可以了,在model2模型中我们使用servlet作为控制器,我们就需要在Filter的配置文件web.xml中配置好servlet的设置,对所有的servlet处理的表单编码进行设置。

<filter>  
        <filter-name>CharsetEncodingFilter</filter-name>  
        <filter-class>com.bjpowernode.drp.util.filter.CharsetEncodingFilter</filter-class>  
        <init-param>  
            <param-name>encoding</param-name>  
            <param-value>GBK</param-value>  
        </init-param>  
    </filter>  
    <filter-mapping>  
        <filter-name>CharsetEncodingFilter</filter-name>  
        <url-pattern>*.jsp</url-pattern>  
    </filter-mapping>  
  
    <filter-mapping>  
        <filter-name>CharsetEncodingFilter</filter-name>  
        <url-pattern>/servlet/*</url-pattern>  
    </filter-mapping>

面试相关:

2021年JAVA 精心整理的常见面试题-附详细答案【持续更新~~】

https://mikejun.blog.csdn.net/article/details/114488339

精心整理的计算机各类别的电子书籍【超全】

https://mikejun.blog.csdn.net/article/details/115442555

2021年- 精心整理的 SpringMVC 常见面试题-【附详细答案】

https://mikejun.blog.csdn.net/article/details/114992529

2021年- 精心整理的 SpringBoot 常见面试题-【附详细答案】

https://mikejun.blog.csdn.net/article/details/115682106

2021年SpringCloud 精选大厂面试题-【附详细答案】

https://mikejun.blog.csdn.net/article/details/116103358

2021年JAVA 面试题之--数据结构篇【附详细答案】

https://mikejun.blog.csdn.net/article/details/114647742

Java 多线程、多进程、并发编程面试总结 (2021年)

https://mikejun.blog.csdn.net/article/details/115830507
  

三天刷完《剑指OFFER编程题》--Java版本实现(第一天)

https://mikejun.blog.csdn.net/article/details/106996017

三天刷完《剑指OFFER编程题》--Java版本实现(第二天)

https://mikejun.blog.csdn.net/article/details/108098502

三天刷完《剑指OFFER编程题》--Java版本实现(第三天)

https://mikejun.blog.csdn.net/article/details/108253489

项目推荐:

2000多G的计算机各行业电子资源分享(持续更新)

2020年微信小程序全栈项目之喵喵交友【附课件和源码】

Spring Boot开发小而美的个人博客【附课件和源码】

Java微服务实战296集大型视频-谷粒商城【附代码和课件】

Java开发微服务畅购商城实战【全357集大项目】-附代码和课件

最全最详细数据结构与算法视频-【附课件和源码】

在这里插入图片描述


 

  • 20
    点赞
  • 4
    评论
  • 74
    收藏
  • 一键三连
    一键三连
  • 扫一扫,分享海报

相关推荐
©️2020 CSDN 皮肤主题: 书香水墨 设计师:CSDN官方博客 返回首页
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、C币套餐、付费专栏及课程。

余额充值