默認(rèn)情況下,Python 源碼文件以 UTF-8 編碼方式處理。在這種編碼方式中,世界上大多數(shù)語言的字符都可以同時用于字符串字面值、變量或函數(shù)名稱以及注釋中——盡管標(biāo)準(zhǔn)庫中只用常規(guī)的 ASCII 字符作為變量或函數(shù)名,而且任何可移植的代碼都應(yīng)該遵守此約定。要正確顯示這些字符,你的編輯器必須能識別 UTF-8 編碼,而且必須使用能支持打開的文件中所有字符的字體。
1、如果不使用默認(rèn)編碼,要聲明文件所使用的編碼,文件的第一行要寫成特殊的注釋。
語法如下所示:
# -*- coding: encoding -*-
其中 encoding 可以是 Python 支持的任意一種 codecs。
比如,要聲明使用 utf-8 編碼,你的源碼文件要寫成:
2、關(guān)于第一行規(guī)則的一種例外情況是,源碼以 UNIX "shebang" 行開頭。這種情況下,編碼聲明就要寫在文件的第二行。
例如:
#!/usr/bin/env python3
# -*- coding: utf-8 -*-
知識點擴展:
編碼的定義
我們從“SOS“(國際通用求助信號)開始,它的摩斯密碼的編碼是:
“…---…”,想一下為什么選用S、O、S來作為求救信號?因為它簡單,容易辨別且不容易發(fā)錯呀!
那么,字符編碼就是:
´給定一系列字符,對每個字符賦予一個數(shù)值,用數(shù)值來代表對應(yīng)的字符,這一數(shù)值就是字符的編碼。例如,我們給字符'A'賦予數(shù)值0x41,則0x41就是字符'A'的編碼。字符編碼是字符的表現(xiàn)、儲存方式。
字符編碼需要處理兩件事
(1)規(guī)定一個字符集中的字符由多少個字節(jié)表示;
(2)制定該字符集的字符編碼表,即該字符集中每個字符對應(yīng)的(二進制)值。
到此這篇關(guān)于python源文件的字符編碼知識點詳解的文章就介紹到這了,更多相關(guān)python源文件的字符編碼內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
您可能感興趣的文章:- 詳解python中文編碼問題
- python基礎(chǔ)之編碼規(guī)范總結(jié)
- Python3 json模塊之編碼解碼方法講解
- 解決python3 中的np.load編碼問題
- python 編碼中為什么要寫類型注解?
- Python新建項目自動添加介紹和utf-8編碼的方法
- python中字符串的編碼與解碼詳析
- Python之進行URL編碼案例講解