2023年11月28日发(作者:)

JAVA中⽂字符编码问题详解控制台输出

许多⽂件的默认编码是ISO-8859-1,⽽中⽂操作系统的缺省编码是GB18030,在此⼯作空间中建⽴的⼯程编码是GB18030.我们常⽤的编

码是UTF-8,能够使得插件有更好的国际⽀持。在编写JSP⽂件时如果没有更改默认编码,则中⽂⽆法正常输出,出现乱码。Eclipse⼯作

这样,JAVA就会⽤utf-8的⽅式来从⽂件中读取字符数据。

3. TOMCAT的URIEncoding如果不加以设置,则默认使⽤ISO-8859-1来解码URL,设置后便⽤设置了的编码⽅式来解码。这个解码

同时包 括PATH部分和查询字符串部分。可见,这个参数是对⽤GET⽅式传递的中⽂参数最关键的设置。不过,这个参数只对GET⽅式传递

的参数有效,对POST 的⽆效。分析TOMCAT的源代码我们可以看到,在请求⼀个页⾯时,TOMCAT会尝试构造⼀个Request对象,在这

个对象⾥,会从 ⾥读取URIEncoding的值,并赋值给Parameters类的queryStringEncoding变量,⽽这个变量将在解析

ameter中的GET参数时⽤来指导字符解码。

字符集字符编码对应语⾔

ASCIIASCII(7位)英语