python源文件的字符編碼知識(shí)點(diǎn)詳解
默認(rèn)情況下,Python 源碼文件以 UTF-8 編碼方式處理。在這種編碼方式中,世界上大多數(shù)語(yǔ)言的字符都可以同時(shí)用于字符串字面值、變量或函數(shù)名稱(chēng)以及注釋中——盡管標(biāo)準(zhǔn)庫(kù)中只用常規(guī)的 ASCII 字符作為變量或函數(shù)名,而且任何可移植的代碼都應(yīng)該遵守此約定。要正確顯示這些字符,你的編輯器必須能識(shí)別 UTF-8 編碼,而且必須使用能支持打開(kāi)的文件中所有字符的字體。
1、如果不使用默認(rèn)編碼,要聲明文件所使用的編碼,文件的第一行要寫(xiě)成特殊的注釋。
語(yǔ)法如下所示:
# -*- coding: encoding -*-
其中 encoding 可以是 Python 支持的任意一種 codecs。
比如,要聲明使用 utf-8 編碼,你的源碼文件要寫(xiě)成:
# -*- coding: utf-8 -*-
2、關(guān)于第一行規(guī)則的一種例外情況是,源碼以 UNIX 'shebang' 行開(kāi)頭。這種情況下,編碼聲明就要寫(xiě)在文件的第二行。
例如:
#!/usr/bin/env python3# -*- coding: utf-8 -*-
知識(shí)點(diǎn)擴(kuò)展:
編碼的定義
我們從“SOS“(國(guó)際通用求助信號(hào))開(kāi)始,它的摩斯密碼的編碼是:
“…---…”,想一下為什么選用S、O、S來(lái)作為求救信號(hào)?因?yàn)樗?jiǎn)單,容易辨別且不容易發(fā)錯(cuò)呀!那么,字符編碼就是:
´給定一系列字符,對(duì)每個(gè)字符賦予一個(gè)數(shù)值,用數(shù)值來(lái)代表對(duì)應(yīng)的字符,這一數(shù)值就是字符的編碼。例如,我們給字符’A’賦予數(shù)值0x41,則0x41就是字符’A’的編碼。字符編碼是字符的表現(xiàn)、儲(chǔ)存方式。
字符編碼需要處理兩件事
(1)規(guī)定一個(gè)字符集中的字符由多少個(gè)字節(jié)表示;
(2)制定該字符集的字符編碼表,即該字符集中每個(gè)字符對(duì)應(yīng)的(二進(jìn)制)值。
到此這篇關(guān)于python源文件的字符編碼知識(shí)點(diǎn)詳解的文章就介紹到這了,更多相關(guān)python源文件的字符編碼內(nèi)容請(qǐng)搜索好吧啦網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持好吧啦網(wǎng)!
相關(guān)文章:
1. msxml3.dll 錯(cuò)誤 800c0019 系統(tǒng)錯(cuò)誤:-2146697191解決方法2. ASP常用日期格式化函數(shù) FormatDate()3. 解析原生JS getComputedStyle4. 輕松學(xué)習(xí)XML教程5. jsp實(shí)現(xiàn)登錄驗(yàn)證的過(guò)濾器6. 阿里前端開(kāi)發(fā)中的規(guī)范要求7. xpath簡(jiǎn)介_(kāi)動(dòng)力節(jié)點(diǎn)Java學(xué)院整理8. css代碼優(yōu)化的12個(gè)技巧9. jsp EL表達(dá)式詳解10. jsp+servlet簡(jiǎn)單實(shí)現(xiàn)上傳文件功能(保存目錄改進(jìn))
