麻豆黑色丝袜jk制服福利网站-麻豆精品传媒视频观看-麻豆精品传媒一二三区在线视频-麻豆精选传媒4区2021-在线视频99-在线视频a

千鋒教育-做有情懷、有良心、有品質的職業教育機構

手機站
千鋒教育

千鋒學習站 | 隨時隨地免費學

千鋒教育

掃一掃進入千鋒手機站

領取全套視頻
千鋒教育

關注千鋒學習站小程序
隨時隨地免費學習課程

當前位置:首頁  >  技術干貨  > python文件讀寫與字符編碼

python文件讀寫與字符編碼

來源:千鋒教育
發布人:xqq
時間: 2023-11-07 11:56:45 1699329405

PyCharm等IDE開發工具指定的項目工程和文件的字符編碼:它的主要作用是告訴Pycharm等IDE開發工具保存文件時應該將字符轉換為怎樣的字節表示形式,以及打開并展示文件內容時應該以什么字符編碼將字節碼轉換為人類可識別的字符。

Python源代碼文件頭部指定的字符編碼,如*-*coding:utf-8-*-:它的主要作用是告訴Python解釋器當前python代碼文件保存時所使用的字符編碼,Python解釋器在執行代碼之前,需要先從磁盤讀取該代碼文件中的字節然后通過這里指定的字符編碼將其解碼為unicode字符。Python解釋器執行Python代碼的過程與IDE開發工具是沒有什么關聯性的。

那么這里為什么又要談起字符編碼的問題呢?

或者換個問法,既然從上面已經指定了字符編碼,為什么對文件進行讀寫時還要指定字符編碼呢?從前面的描述可以看出:上面兩個地方指定的是Python代碼文件的字符編碼,是給Python解釋器和Pycharm等程序軟件用的;而被讀寫文件的字符編碼與Python代碼文件的字符編碼沒有必然聯系,讀寫文件時指定的字符編碼是給我們寫的程序軟件用的。這是不同的主體和過程,希望我說明白了。

讀寫文件時怎樣指定字符編碼呢?

上面解釋了讀寫文件為什么要指定字符編碼,這里要說下怎樣指定字符編碼(其實這里主要討論是讀取外部數據時的情形)。這個問題其實在上面的文件讀取示例中已經使用過了,這里我們再詳細的說一下。

首先,再次看一下Python2和Python3中open函數的定義:

#Python2

open(name[,mode[,buffering]])

#Python3

open(file,mode='r',buffering=-1,encoding=None,errors=None,newline=None,closefd=True,opener=None)

可以看到,Python3的open函數中多了幾個參數,其中包括一個encoding參數。是的,這個encoding就是用來指定被操作文件的字符編碼的。

#讀操作

withopen('song.txt','r',encoding='utf-8')asf:

print(f.read())

#寫操作

withopen('song.txt','w',encoding='utf-8')asf:

print(f.write('你好'))

那么Python2中怎樣指定呢?Python2中的對文件的read和write操作都是字節,也就說Python2中文件的read相關方法讀取的是字節串(如果包含中文字符,會發現len()方法的結果不等于讀取到的字符個數,而是字節數)。如果我們要得到正確的字符串,需要手動將讀取到的結果decode(解碼)為字符串;相反,要以特定的字符編碼保存要寫入的數據時,需要手動encode(編碼)為字節串。這個encode()和decode()函數可以接收一個字符編碼參數。Python3中read和write操作的都是字符串,實際上是Python解釋器幫我們自動完成了寫入時的encode(編碼)和讀取時的decode(解碼)操作,因此我們只需要在打開文件(open函數)時指定字符編碼就可以了。

#讀操作

withopen('song.txt','r')asf:

print(f.read().decode('utf-8'))

#寫操作

withopen('song2.txt','w')asf:

#f.write(u'你好'.encode('utf-8'))

#f.write('你好'.decode('utf-8').encode('utf-8'))

f.write('你好')

文件讀寫時有沒有默認編碼呢?

Python3中open函數的encoding參數顯然是可以不指定的,這時候就會用一個“默認字符編碼”。

看下Python3中open函數文檔對encoding參數的說明:

encodingisthenameoftheencodingusedtodecodeorencodethe

file.Thisshouldonlybeusedintextmode.Thedefaultencodingis

platformdependent,butanyencodingsupportedbyPythoncanbe

passed.Seethecodecsmoduleforthelistofsupportedencodings.

也就是說,encoding參數的默認值是與平臺有關的,比如Window上默認字符編碼為GBK,Linux上默認字符編碼為UTF-8。

而對于Python2來說,在進行文件寫操作時,字節會被直接保存;在進行文件讀操作時,如果不手動進行來decode操作自然也就用不著默認字符編碼了。但是這時候在不同的字符終端打印的時候,會用當前平臺的字符編碼自動將字節解碼為字符,此時可能會出現亂碼。如song.txt文件時UTF-8編碼的,在windows(字符編碼為GBK)的命令行終端進行如下操作就會出現亂碼:

>>>withopen('song.txt','r')asf:

...print(f.read())

...

我們應該盡可能的獲取被操作文件的字符編碼,并明確指定encoding參數的值。

以上內容為大家介紹了python文件讀寫與字符編碼,希望對大家有所幫助,如果想要了解更多Python相關知識,請關注IT培訓機構:千鋒教育。

tags: python培訓
聲明:本站稿件版權均屬千鋒教育所有,未經許可不得擅自轉載。
10年以上業內強師集結,手把手帶你蛻變精英
請您保持通訊暢通,專屬學習老師24小時內將與您1V1溝通
免費領取
今日已有369人領取成功
劉同學 138****2860 剛剛成功領取
王同學 131****2015 剛剛成功領取
張同學 133****4652 剛剛成功領取
李同學 135****8607 剛剛成功領取
楊同學 132****5667 剛剛成功領取
岳同學 134****6652 剛剛成功領取
梁同學 157****2950 剛剛成功領取
劉同學 189****1015 剛剛成功領取
張同學 155****4678 剛剛成功領取
鄒同學 139****2907 剛剛成功領取
董同學 138****2867 剛剛成功領取
周同學 136****3602 剛剛成功領取
相關推薦HOT
主站蜘蛛池模板: 最近免费最新高清中文字幕韩国| 欧美精品xxxxbbbb| 日本口工里番| 日本一道高清一区二区三区| 五十路亲子中出中文字幕 | 国产a级特黄的片子视频| 国产高h| h在线观看网站| 花传媒季app| 最近免费最新高清中文字幕韩国 | 日本污全彩肉肉无遮挡彩色| a级毛片视频| 亚洲同性男gay网站在线观看| 大胸年轻的搜子4理论| 色诱久久av| 国产大片黄在线观看| 萌白酱福利| www.米奇777.com| 波多野结衣中文字幕一区| 痴汉电车中文字幕| 美女裸体a级毛片| 欧美理伦| 欧美高清不卡| 日韩精品一区二区三区在线观看l 日韩精品无码一区二区三区 | 亚洲国产电影在线观看| 美女奶口隐私免费视频网站| 奶水哺乳理论电影| 猛男强攻变骚受| 老司机福利在线观看| 大胸年轻的搜子4理论| 美女主播免费观看| 噜噜噜在线视频| 8av国产精品爽爽ⅴa在线观看| aⅴ一区二区三区无卡无码| 成人性生活免费视频| 亚洲高清视频免费| jealousvue成熟50maoff老狼| 机机对在一起30分钟软件下载| 波多野结衣教师中文字幕| 天天天天做夜夜夜做| 久草网在线|