獲取字符串長(zhǎng)度,是字符串操作的重要方法。理論來(lái)說(shuō),獲取字符串長(zhǎng)度,只要從頭到尾查找一遍就可以了。但遺憾的是,不同字符具有不同的編碼格式。拉丁字母一個(gè)字符只要一個(gè)字節(jié)就行,而中文則可能需要兩道三個(gè)字節(jié);UNICODE把所有字符設(shè)置為2個(gè)字節(jié),UTF-8格式則把所有字符設(shè)置為1--3個(gè)字節(jié)。
因此,字符串長(zhǎng)度的獲得,不等于按字節(jié)數(shù)查找,而要根據(jù)不同字符編碼查找。
對(duì)于中文開(kāi)發(fā)者來(lái)說(shuō),經(jīng)常需要對(duì)字符串進(jìn)行長(zhǎng)度判斷。golang有自己的默認(rèn)判斷長(zhǎng)度函數(shù)len();但遺憾的是,len()函數(shù)判斷字符串長(zhǎng)度的時(shí)候,是判斷字符的字節(jié)數(shù)而不是字符長(zhǎng)度。因此,在中文字符下,應(yīng)該采用如下方法:
1)使用 bytes.Count() 統(tǒng)計(jì)
2)使用 strings.Count() 統(tǒng)計(jì)
3)將字符串轉(zhuǎn)換為 []rune 后調(diào)用 len 函數(shù)進(jìn)行統(tǒng)計(jì)
4)使用 utf8.RuneCountInString() 統(tǒng)計(jì)
s := "歡迎學(xué)習(xí)Go的len()函數(shù)" r := []rune(strTest) fmt.Println(len(r)) fmt.Println(len(s)) fmt.Println(bytes.Count([]byte(s), nil) - 1) fmt.Println(strings.Count(s, "") - 1) fmt.Println(utf8.RuneCountInString(s))
補(bǔ)充:Go語(yǔ)言獲取中英文混和字符串的長(zhǎng)度以及子字符串的方法
使用len()函數(shù)。
testString1 := "China!" length1 := len(testString1) fmt.Printf("testString1 字符串的長(zhǎng)度是:%d", length1)
長(zhǎng)度是6。
2.1 先使用len()函數(shù)。
testString2 := "我愛(ài)你中國(guó),我愛(ài)你China!" length2 := len(testString2) fmt.Printf("字符串的長(zhǎng)度是:%d", length2) fmt.Printf("testString2字符串的長(zhǎng)度是:%d\n", length2) fmt.Printf("testString2中的最后一個(gè)字符是:%s\n", testString2[length2-1]) fmt.Printf("testString2中的最后一個(gè)字符是:%c\n", testString2[length2-1]) fmt.Printf("testString2中的下標(biāo)6-末尾的子字符串是:%s\n",testString2[:15]) fmt.Printf("testString2中的下標(biāo)6-末尾的子字符串是:%s\n",testString2[:16])
這種方法的到的是字節(jié)數(shù)。Go語(yǔ)言中,中文字符按utf-8編碼,占3字節(jié),故長(zhǎng)度是31。故此方法不適用統(tǒng)計(jì)中英文混合或者中文字符串長(zhǎng)度。
2.2 使用utf8.RuneCountInString()方法。
testString2 := "我愛(ài)你中國(guó),我愛(ài)你China!" length3 := utf8.RuneCountInString(testString2) fmt.Printf("使用utf8中的方法統(tǒng)計(jì)的字符串長(zhǎng)度是:%d\n", length3)
此方法可統(tǒng)計(jì)字符數(shù),輸出結(jié)果是15。
2.3 轉(zhuǎn)成[]rune類(lèi)型,再對(duì)此類(lèi)型進(jìn)行操作
testString2 := "我愛(ài)你中國(guó),我愛(ài)你China!" temp := []rune(testString2) length4 := len(temp) fmt.Printf("使用rune統(tǒng)計(jì)的字符串的長(zhǎng)度是:%d\n", length4) //獲取字符串中最后一個(gè)字符 lastChar := string(temp[length4-1]) //獲取下標(biāo)從0到3(不包括3)的子串 subString1 := temp[0:3] subString2 := temp[6:9] fmt.Printf("testString2中的最后一個(gè)字符是:%s\n", lastChar) fmt.Printf("testString2中的下標(biāo)0-2的子字符串是:%s\n",string(subString1)) fmt.Printf("testString2中的下標(biāo)6-8的子字符串是:%s\n",string(subString2))
此方法也可輸出字符個(gè)數(shù)15。但是此方法能獲取指定下標(biāo)范圍的子字符串,也能獲取指定下標(biāo)位置的字符。比第二種方法方便。
package main import ( "fmt" "unicode/utf8" ) func main() { //純英文 testString1 := "China!" length1 := len(testString1) fmt.Printf("testString1字符串的長(zhǎng)度是:%d\n", length1) lastCharA := testString1[length1-1] //此處用%s格式輸出最后一個(gè)字符會(huì)出錯(cuò),只能用%c fmt.Printf("testString1字符串中最后一個(gè)字符是:%s\n", lastCharA) fmt.Printf("testString1字符串中最后一個(gè)字符是:%c\n", lastCharA) fmt.Printf("testString1中的下標(biāo)0-2的子字符串是:%s\n",testString1[0:3]) fmt.Printf("testString1中的下標(biāo)3-末尾的子字符串是:%s\n",testString1[3:]) fmt.Println() //中英文加一起15個(gè)字符 testString2 := "我愛(ài)你中國(guó),我愛(ài)你China!" //此處長(zhǎng)度是輸出字節(jié)數(shù),Go語(yǔ)言中文字符是UTF-8編碼,長(zhǎng)度3字節(jié),故此處應(yīng)該是15+1+9+6=31 length2 := len(testString2) fmt.Printf("testString2字符串的長(zhǎng)度是:%d\n", length2) fmt.Printf("testString2中的最后一個(gè)字符是:%s\n", testString2[length2-1]) fmt.Printf("testString2中的最后一個(gè)字符是:%c\n", testString2[length2-1]) fmt.Printf("testString2中的下標(biāo)6-末尾的子字符串是:%s\n",testString2[:15]) fmt.Printf("testString2中的下標(biāo)6-末尾的子字符串是:%s\n",testString2[:16]) fmt.Println() //此處就是統(tǒng)計(jì)字符數(shù) length3 := utf8.RuneCountInString(testString2) fmt.Printf("使用utf8中的方法統(tǒng)計(jì)的字符串長(zhǎng)度是:%d\n", length3) fmt.Println() //轉(zhuǎn)成rune類(lèi)型,再統(tǒng)計(jì)字符數(shù) temp := []rune(testString2) //獲取中英文混合字符串長(zhǎng)度 length4 := len(temp) fmt.Printf("使用rune統(tǒng)計(jì)的字符串的長(zhǎng)度是:%d\n", length4) //獲取字符串中最后一個(gè)字符 lastCharB := string(temp[length4-1]) //獲取下標(biāo)從0到3(不包括3)的子串 subString1 := temp[0:3] subString2 := temp[6:] fmt.Printf("testString2中的最后一個(gè)字符是:%s\n", lastCharB) fmt.Printf("testString2中的下標(biāo)0-2的子字符串是:%s\n",string(subString1)) fmt.Printf("testString2中的下標(biāo)6-末尾的子字符串是:%s\n",string(subString2)) }
如果是對(duì)中英文進(jìn)行操作,建議用第三種方式。先轉(zhuǎn)成rune[]型,再進(jìn)行操作。
以上為個(gè)人經(jīng)驗(yàn),希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教。
標(biāo)簽:遼寧 海南 電子產(chǎn)品 安康 儋州 西雙版納 物業(yè)服務(wù) 青海
巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《golang 獲取字符串長(zhǎng)度的案例》,本文關(guān)鍵詞 golang,獲取,字符串,長(zhǎng)度,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問(wèn)題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無(wú)關(guān)。