對于get方法來說,都是把數(shù)據(jù)串聯(lián)在請求的url后面作為參數(shù),如:http://localhost:8080/servlet?msg=abc (很常見的一個亂碼問題就要出現(xiàn)了,如果url中出現(xiàn)中文或其它特殊字符的話,如:http://localhost:8080 /servlet?msg=杭州,服務器端容易得到亂碼),url拼接完成后,瀏覽器會對url進行URL encode,然后發(fā)送給服務器,URL encode的過程就是把部分url做為字符,按照某種編碼方式(如:utf-8,gbk等)編碼成二進制的字節(jié)碼,然后每個字節(jié)用一個包含3個字符的字符串 "%xy" 表示,其中xy為該字節(jié)的兩位十六進制表示形式。我這里說的可能不清楚,具體介紹可以看下java.net.URLEncoder類的介紹在這里。了解了 URL encode的過程,我們能看到2個很重要的問題,第一:需要URL encode的字符一般都是非ASCII的字符(籠統(tǒng)的講),再通俗的講就是除了英文字母以外的文字(如:中文,日文等)都要進行URL encode,所以對于我們來說,都是英文字母的url不會出現(xiàn)服務器得到亂碼問題,出現(xiàn)亂碼都是url里面帶了中文或特殊字符造成的;第二:URL encode到底按照那種編碼方式對字符編碼?這里就是瀏覽器的事情了,而且不同的瀏覽器有不同的做法,中文版的瀏覽器一般會默認的使用GBK,通過設(shè)置瀏覽器也可以使用UTF-8,可能不同的用戶就有不同的瀏覽器設(shè)置,也就造成不同的編碼方式,所以很多網(wǎng)站的做法都是先把url里面的中文或特殊字符用 javascript做URL encode,然后再拼接url提交數(shù)據(jù),也就是替瀏覽器做了URL encode,好處就是網(wǎng)站可以統(tǒng)一get方法提交數(shù)據(jù)的編碼方式。 完成了URL encode,那么現(xiàn)在的url就成了ASCII范圍內(nèi)的字符了,然后以iso-8859-1的編碼方式轉(zhuǎn)換成二進制隨著請求頭一起發(fā)送出去。這里想多說幾句的是,對于get方法來說,沒有請求實體,含有數(shù)據(jù)的url都在請求頭里面,之所以用URL encode,我個人覺的原因是:對于請求頭來說最終都是要用iso-8859-1編碼方式編碼成二進制的101010.....的純數(shù)據(jù)在互聯(lián)網(wǎng)上傳送,如果直接將含有中文等特殊字符做iso-8859-1編碼會丟失信息,所以先做URL encode是有必要的。 2。服務器端(tomcat)是如何將數(shù)據(jù)獲取到進行解碼的。 第一步是先把數(shù)據(jù)用iso-8859-1進行解碼,對于get方法來說,tomcat獲取數(shù)據(jù)的是ASCII范圍內(nèi)的請求頭字符,其中的請求url里面帶有參數(shù)數(shù)據(jù),如果參數(shù)中有中文等特殊字符,那么目前還是URL encode后的%XY狀態(tài),先停下,我們先說下開發(fā)人員一般獲取數(shù)據(jù)的過程。通常大家都是request.getParameter("name")獲取參數(shù)數(shù)據(jù),我們在request對象或得的數(shù)據(jù)都是經(jīng)過解碼過的,而解碼過程中程序里是無法指定,這里要說下,有很多新手說用 request.setCharacterEncoding("字符集")可以指定解碼方式,其實是不可以的,看servlet的官方API說明有對此方法的解釋:Overrides the name of the character encoding used in the body of this request. This method must be called prior to reading request parameters or reading input using getReader().可以看出對于get方法他是無能為力的。那么到底用什么編碼方式解碼數(shù)據(jù)的呢,這是tomcat的事情了,默認缺省用的是 iso-8859-1,這樣我們就能找到為什么get請求帶中文參數(shù)為什么在服務器端得到亂碼了,原因是在客戶端一般都是用UTF-8或GBK對數(shù)據(jù) URL encode,這里用iso-8859-1方式URL decoder顯然不行,在程序里我們可以直接 Java代碼 1. new String(request.getParameter("name").getBytes("iso-8859-1"),"客戶端指定的URL encode編碼方式") 還原回字節(jié)碼,然后用正確的方式解碼數(shù)據(jù),網(wǎng)上的文章通常是在tomcat里面做個配置 Xml代碼 1. <Connector port="8080" protocol="HTTP/1.1" maxThreads="150" connectionTimeout="20000" redirectPort="8443" URIEncoding="GBK"/> 這樣是讓tomcat在獲取數(shù)據(jù)后用指定的方式URL decoder,URL decoder的介紹在這里 (一)post提交 1.客戶端(瀏覽器)的form表單用post方法是如何將數(shù)據(jù)編碼后提交給服務器端的。 在post方法里所要傳送的數(shù)據(jù)也要URL encode,那么他是用什么編碼方式的呢? 在form所在的html文件里如果有段<meta http-equiv="Content-Type" content="text/html; charset=字符集(GBK,utf-8等)"/>,那么post就會用此處指定的編碼方式編碼。一般大家都認為這段代碼是為了讓瀏覽器知道用什么字符集來對網(wǎng)頁解釋,所以網(wǎng)站都會把它放在html代碼的最前端,盡量不出現(xiàn)亂碼,其實它還有個作用就是指定form表單的post方法提交數(shù)據(jù)的 URL encode編碼方式。從這里可以看出對于get方法來數(shù),瀏覽器對數(shù)據(jù)的URL encode的編碼方式是有瀏覽器設(shè)置來決定,(可以用js做統(tǒng)一指定),而post方法,開發(fā)人員可以指定。 2。服務器端(tomcat)是如何將數(shù)據(jù)獲取到進行解碼的。 如果用tomcat默認缺省設(shè)置,也沒做過濾器等編碼設(shè)置,那么他也是用iso-8859-1解碼的,但是request.setCharacterEncoding("字符集")可以派上用場。
巨人網(wǎng)絡(luò)通訊聲明:本文標題《GET POST 區(qū)別詳解》,本文關(guān)鍵詞 GET,POST,區(qū)別,詳解,GET,POST,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。