java轉碼utf8_java如何把string轉為utf-8

Ⅰ java編碼問題，GBK轉化為UTF-8

首先理解java的字元概念
java中字元串是字元的序列，虛擬機內部的字元都是16位的unicode字元，等價於C++中的WCHAR，也是為了實現虛擬機方便

WCHAR叫做寬字元，對應的MuitiChar叫做多字元，這種多字元中字元的位數不唯一

GBK 和 UTF8 是多字元的不同編碼形式

s=new String(s.getBytes("gbk"),"utf-8");
的意思是：
byte[] bytes=s.getBytes("gbk");
s=new String(bytes,"utf-8");

第一句是將s對應的gbk編碼轉出來，形成一個位元組流
第二句是將這個位元組流按照utf-8編碼轉為java字元串，因此相當於將gbk編碼的位元組流當做utf-8來使用，這樣在中文中會出現亂碼

你的問題是，介面返回的已經是utf-8 所以它必須是byte[] 流，如果是字元串的話就不好辦了

Ⅱ java 怎麼gbk轉碼utf-8

方法一：

思路：先轉為Unicode，然後轉為GBK
Stringutf8=newString(t.getBytes("UTF-8"));
System.out.println(utf8);
Stringunicode=newString(utf8.getBytes(),"UTF-8");
System.out.println(unicode);
Stringgbk=newString(unicode.getBytes("GBK"));

System.out.println(gbk);

方法二：

publicstaticvoidmain(String[]args){
Stringstr="字元串編碼轉換";
try{
byte[]temp=str.getBytes("utf-8");//這里寫原編碼方式
byte[]newtemp=newString(temp,"utf-8").getBytes("gbk");//這里寫轉換後的編碼方式
StringnewStr=newString(newtemp,"gbk");//這里寫轉換後的編碼方式
System.out.println(newStr);
}catch(UnsupportedEncodingExceptione){
//TODOAuto-generatedcatchblock
e.printStackTrace();
}
}

Ⅲ java怎麼把把字元轉成utf-8

java不同編碼之間進行轉換，都需要使用unicode作為中轉。
以utf-8轉gbk為例，示例代碼如下：
String t = "這是一個字元串aaa111";
String utf8 = new String(t.getBytes( "UTF-8"));
System.out.println(utf8);
String unicode = new String(utf8.getBytes(),"UTF-8");
System.out.println(unicode);
String gbk = new String(unicode.getBytes("GBK"));
System.out.println(gbk);

Ⅳ java 怎麼把漢字轉換成utf-8編碼

漢字都需要用三位元組UTF-8解碼格式，也就是1110XXXX10XXXXXX10XXXXXX其中x為漢字Unicode二進制碼的前四位，中六位和後六位，分別提取出來，再組進格式里就完成了轉碼

Ⅳ java實現將文件格式轉換為UTF-8

問題描述不知道是不是需要改這個：
文件編碼轉換方法:ant

build.xml

代碼

<project name="encoding" default="build">

<target name="build">

< todir="e:/output" outputencoding="GBK">

<fileset dir=".">

<include name="**/*.html"/>

</fileset>

</>

</target>

</project>

先把源代碼全部用GBK格式拷貝到e:/output,然後再把output中的所有文件拷貝到原先的地方就可以。

html內容顯示編碼：
<meta http-equiv="content-type" content="text/html; charset=「utf-8" />

Ⅵ java如何把string轉為utf-8

java不同編碼之間進行轉換，都需要使用unicode作為中轉。

String str = "任意字元串";

str = new String(str.getBytes("gbk"),"utf-8");

備注說明：

str.getBytes("UTF-8"); 意思是以UTF-8的編碼取得位元組

new String(XXX,"UTF-8"); 意思是以UTF-8的編碼生成字元串

舉例：

public static String getUTF8XMLString(String xml) {

// A StringBuffer Object

StringBuffer sb = new StringBuffer();

sb.append(xml);

String xmString = "";

String xmlUTF8="";

try {

xmString = new String(sb.toString().getBytes("UTF-8"));

xmlUTF8 = URLEncoder.encode(xmString, "UTF-8");

System.out.println("utf-8 編碼：" + xmlUTF8) ;

} catch (UnsupportedEncodingException e) {

// TODO Auto-generated catch block

e.printStackTrace();

}

// return to String Formed

return xmlUTF8;

(6)java轉碼utf8擴展閱讀:

UTF-8編碼規則：

如果只有一個位元組則其最高二進制位為0；如果是多位元組，其第一個位元組從最高位開始，連續的二進制位值為1的個數決定了其編碼的位元組數，其餘各位元組均以10開頭。

實際表示ASCII字元的UNICODE字元，將會編碼成1個位元組，並且UTF-8表示與ASCII字元表示是一樣的。所有其他的UNICODE字元轉化成UTF-8將需要至少2個位元組。每個位元組由一個換碼序列開始。第一個位元組由唯一的換碼序列，由n位連續的1加一位0組成，首位元組連續的1的個數表示字元編碼所需的位元組數。

Unicode轉換為UTF-8時，可以將Unicode二進制從低位往高位取出二進制數字，每次取6位，如上述的二進制就可以分別取出為如下示例所示的格式，前面按格式填補，不足8位用0填補。

Ⅶ 怎麼把java代碼轉換成utf-8

右擊
文件，菜單中選properties，第一個Resource選項中，找到Others
單選鈕，下拉列表裡選utf-8。整個項目修改，就右擊項目名

Ⅷ java中GBK編碼格式轉成UTF8，用一段方法實現怎麼做

首先明確幾點：
unicode是一種「編碼」，所謂編碼就是一個編號(數字)到字元的一種映射關系，就僅僅是一種一對一的映射而已，可以理解成一個很大的對應表格
GBK、UTF-8是一種「編碼格式」，是用來序列化或存儲1中提到的那個「編號(數字)」的一種「格式」；GBK和UTF-8都是用來序列化或存儲unicode編碼的數據的，但是分別是2種不同的格式；他們倆除了格式不一樣之外，他們所關心的unicode編碼范圍也不一樣，utf-8考慮了很多種不同國家的字元，涵蓋整個unicode碼表，所以其存儲一個字元的編碼的時候，使用的位元組長度也從1位元組到4位元組不等；而GBK只考慮中文——在unicode中的一小部分——的字元，的編碼，所以它算好了只要2個位元組就能涵蓋到絕大多數常用中文(2個位元組能表示6w多種字元),所以它存儲一個字元的時候，所用的位元組長度是固定的；
上述2個概念不懂的請馬上google，下面不再贅述；我下面說說這個問題本身...的問題在哪裡
首先java的string使用的編碼是unicode，但是，當string存在於內存中時(也就是當程序運行時、你在代碼中用string類型的引用對它進行操作時、也就是string沒有被存在文件中且也沒有在網路中傳輸(序列化)時)，是「只有編碼而沒有編碼格式的」，所以java程序中的任何String對象，說它是gbk還是utf-8都是錯的，gbk和utf-8是編碼格式而不是編碼，String在內存中不需要「編碼格式」(記住編碼格式是在存文件或序列化的時候使用的), 它只是一個unicode的字元串而已
所以java裡面String是不帶編碼格式的，而String.toByteArray(charsetName)得到的byteArray是帶編碼格式的，格式就是你傳入的'charsetName',我們不妨把toByteArray的這個過程叫做「編碼」;另外，new String(byte[], charsetName)是把一個byte數組(帶編碼格式)以charsetName指定的編碼格式翻譯為一個不帶編碼格式的String對象，我們不妨把這個過程叫「解碼」
那麼根據我揣測提問者的意圖，可能有2種問法是他真正想問的：
第一，如何把一個被錯誤地當作是gbk格式存儲的utf-8格式的文件裡面讀出來的一段亂碼字元串還原回去(也就是說本來二進制數據是utf-8的，你用gbk來解碼它，得到的字元串是亂碼，現在想要還原回去)
第二種，如何把一個gbk文件轉化為utf-8文件
如果是第一種意圖那就：
public static void main(String... args) throws Throwable {
String errStr = "errStr";
System.out.println(recover(errStr));
}

public static String recover(String str) throws Throwable {
return new String(str.getBytes("GBK"), "UTF-8");
}
其中errStr就是亂碼字元串，按照相反的順序在編碼(用gbk)、解碼(用utf-8)回去，就能得到正確的字元串(其實不保證所有情況均能正確還原，只能說大部分都能，要看你在亂碼過程中是否有數據被丟失)

如果是第二種意圖，那就用InputStream以gbk格式將文件讀到內存里(表示為String)，再將這個String以UTF-8編碼寫入目標文件里，具體請參考InputStream/OutputStream的api

Ⅸ Java中如何把GBK編碼的字元串轉成utf-8編碼

我先解釋一下我對你的問題的理解：
你的問題有點籠統可以這么理解兩個意思：一，你是想吧一個gbk編碼的字元串用utf-8格式來編碼
String s = new String ("全國".getBytes("GBK"),"GBK");
雖然這個時候的s是GBK編碼的但是s還是中文字元的所以上面這位同胞用 new(s.getBytes("GBK"),"UTF-8")的方式肯定是錯的應該用 String s1 = new String (s.getBytes("UTF-8"),"UTF-8") 這樣s1就是UTF-8編碼的字元串了
二，如果是遇見亂碼問題比如 String s = new String ("全國".getBytes("GBK"),"GBK");
這樣的s就是gbk編碼的現在你要把GBK格式的編碼用UTF-8去編碼肯定就會出現亂碼
String s2 = new String(s.getBytes("GBK"),"UTF-8"); 這個s2肯定是亂碼的而且這樣就根本解不出來了系統出現的亂碼顯示的時候才會出現編碼錯誤所以一般出現亂碼只要把輸入流換個編碼解析一下就ok了還有什麼不明白可以問我

Ⅹ java中怎麼把utf-8編碼的字元串轉成漢字

java中utf-8就是支持中文的漢字的，如果已經亂碼了，是不可以逆轉的。

導航:首頁 > 編程語言 > java轉碼utf8

java轉碼utf8

與java轉碼utf8相關的資料