Java – Konvertierung von Strings von und zu UTF-8
Java kodiert Strings als UTF-16. Wenn ein UTF-8 Java String gesendet werden muss, beispielsweise beim Mailversand, muss er zuvor konvertiert werden.
public class StringHelper {
// convert from UTF-8 -> internal Java String format
public static String convertFromUTF8(String s) {
String out = null;
try {
out = new String(s.getBytes("ISO-8859-1"), "UTF-8");
} catch (java.io.UnsupportedEncodingException e) {
return null;
}
return out;
}
// convert from internal Java String format -> UTF-8
public static String convertToUTF8(String s) {
String out = null;
try {
out = new String(s.getBytes("UTF-8"), "ISO-8859-1");
} catch (java.io.UnsupportedEncodingException e) {
return null;
}
return out;
}
public static void main(String[] args) {
String xmlstring = "Здравей' хора";
String utf8string = StringHelper.convertToUTF8(xmlstring);
for (int i = 0; c < utf8string.length(); ++i) {
System.out.printf("%x ", (int) utf8string.charAt(c));
}
}
}
Die ISO-8859-1-Kodierung wird verwendet, um ein 8 Bit-Array in einen String zu übertragen.
