怎么 知道 java字符串 编码格式
这样的测试方法是不正确的。getBytes(charset)是解码,new String(byte[], charset)是编码。new String(str.getBytes(charset),charset)是解码再编码,无论charset是什么编码格式,返回的字符串内容原始str是一致,因此equals方法都是返回true,达不到测试字符串编码格式的目的。个人观点:正确的测试姿势应该是这样的:
String charset =”xxx”; //假定编码格式
String str = “中文”;
boolean flag = str.equals(new String(str.getBytes(),charset));
flag为true则表明str的编码格式是假定的编码格式。其中说明str.getBytes()该方法就是按其自身编码格式去解码。其自身编码格式跟你的操作系统编码格式或你使用的IDE设置的文件的Text file encoding有关。
技术问题:java中如何判断字符串内容是否是编码
如果是Java的String对象的话,则一定是Unicode的,这个没有为什么,Java就是这么定的。
我猜你的问题应该是如何判断一段字节流是什么编码类型,对吗?比如一个文件,或是网络上面取下来的一段Byte数组,你需要用一个合适的编码来解析成字符串。
这个让你失望了,没有一个文档化的,确定的方法来判断,只能用测试的方法,这个方法也只是猜测,不能百分百的确定,方法如下:
用常见的编码方式对字节流进行解码,比如Unicode,UTF8,
UTF8
without
BOM, UTF16,
ANSI等等。
对解析的结果进行判断,是不是一个合理的可打印字符,可打印字符最多的解码方式就是最可能的编码了。
如何判断可打印字符?流程如下:把解析好的字符串按照字符进行遍历,把每一个字符转化成Unicode编码,看看这些编码是不是Unicode的支持范围极客。
如果发现有种编码方式都是可打印字符,那么再使用本步骤:对字符串进行分词,分词这个在此不作赘述,你自己再研究一下。分词效果好的就是最可能的编码了。(不过通常到第三步就能搞定了,第四部绝大部分用不着)
java判断字符串是否超出utf8编码
php判断是不是字符串的方法:可以利用php内置函数is_string()来判断。is_string()函数用于检测某个变量是否是字符串,如果指定变量为字符串则返回true,否则返回false。php为我们
告诉你java如何判断编码是否是utf8编码
String的getBytes()方法是得到一个系统默认的编码格式的字节数组。 getBytes(“utf-8”) 得到一个UTF-8格式的字节数组。 把String转换成bytes,各种编码
java 判断字符串什么编码类型
如果是Java的String对象的话,则一定是Unicode的,这个没有为什么,Java就是这么定的。
我猜你的问题应该是如何判断一段字节流是什么编码类型,对吗?比如一个文件,或是网络上面取下来的一段Byte数组,你需要用一个合适的编码来解析成字符串。
这个让你失望了,没有一个文档化的,确定的方法来判断,只能用测试的方法,这个方法也只是猜测,不能百分百的确定,方法如下:
用常见的编码方式对字节流进行解码,比如Unicode,UTF8,
UTF8
without
BOM,
UTF16,
ANSI等等。
对解析的结果进行判断,是不是一个合理的可打印字符,可打印字符最多的解码方式就是最可能的编码了。
如何判断可打印字符?流程如下:把解析好的字符串按照字符进行遍历,把每一个字符转化成Unicode编码,看看这些编码是不是Unicode的支持范围极客。
如果发现有种编码方式都是可打印字符,那么再使用本步骤:对字符串进行分词,分词这个在此不作赘述,你自己再研究一下。分词效果好的就是最可能的编码了。(不过通常到第三步就能搞定了,第四部绝大部分用不着)
java 中如何查看字符串的编码类型
可以通过以下方法来进行编码格式判断,输入一个字符串,之后返回字符串编码类型。
public static String getEncoding(String str) {
String encode = “GB2312”;
try {
if (str.equals(new String(str.getBytes(encode), encode))) { //判断是不是GB2312
String s = encode;
return s; //是的话,返回“GB2312“,以下代码同理
}
} catch (Exception exception) {
}
encode = “ISO-8859-1”;
try {
if (str.equals(new String(str.getBytes(encode), encode))) { //判断是不是ISO-8859-1
String s1 = encode;
return s1;
}
} catch (Exception exception1) {
}
encode = “UTF-8”;
try {
if (str.equals(new String(str.getBytes(encode), encode))) { //判断是不是UTF-8
String s2 = encode;
return s2;
}
} catch (Exception exception2) {
}
encode = “GBK”;
try {
if (str.equals(new String(str.getBytes(encode), encode))) { //判断是不是GBK
String s3 = encode;
return s3;
}
} catch (Exception exception3) {
}
return “”; //如果都不是,说明输入的内容不属于常见的编码格式。
}
java 如何判断字符串编码格式
java可供判断某字符串是什么编码的一行代码
System.out.println(“中文”);
System.out.println(“中文”.getBytes());
System.out.println(“中文”.getBytes(“GB2312”));
System.out.println(“中文”.getBytes(“ISO8859_1”));
System.out.println(new String(“中文”.getBytes()));
System.out.println(new String(“中文”.getBytes(), “GB2312”));
System.out.println(new String(“中文”.getBytes(), “ISO8859_1”));
System.out.println(new String(“中文”.getBytes(“GB2312”)));
System.out.println(new String(“中文”.getBytes(“GB2312”), “GB2312”));
System.out.println(new String(“中文”.getBytes(“GB2312”), “ISO8859_1”));
System.out.println(new String(“中文”.getBytes(“ISO8859_1”)));
System.out.println(new String(“中文”.getBytes(“ISO8859_1”), “GB2312”));
System.out.println(new String(“中文”.getBytes(“ISO8859_1”), “ISO8859_1”));
eg:判断当前字符串的编码格式。
//判断当前字符串的编码格式
if(destination.equals(new String(destination.getBytes(“iso8859-1”), “iso8859-1”)))
{
destination=new String(destination.getBytes(“iso8859-1″),”utf-8”);
}