python3-ascii與Unicod - ⎝⎛CodingNote.cc ⎞⎠

python3-ascii與Unicod

2020 年 1 月 3 日
筆記

# Auther: Aaron Fan  '''  ASCII:不支援中文，1個英文佔1個位元組  Unicode(萬國碼，支援所有國家的文字顯示)：支援中文，但是每個英文和中文都佔2個位元組  UTF-8（是一種針對Unicode的可變長度字元編碼，又稱萬國碼。）：      英文依然按照ASCII的方式佔1個位元組，所有的中文字元統一是3個位元組      Unicode裡面支援各個國家的編碼轉換，比如當中國的gbk格式的軟體在日本打開出現亂碼的時候，      必須把gbk轉成Unicode編碼後才可以正常顯示。  GBK：全稱《漢字內碼擴展規範》（GBK即「國標」、「擴展」漢語拼音的第一個字母，      英文名稱：Chinese Internal Code Specification）  '''  '''  1、先轉成Unicode  2、再轉換成gbk  概括就是：先編碼，後解碼  '''    #示例：  '''  gbk_file是一個gbk編碼的文件    需求：  把gbk_file轉換成一個utf8編碼的新文件，新文件名為：gbk_to_utf8_file  '''    #python3一行命令搞定的方法  #把gbk文件轉換成utf8文件，源文件gbk_file，目標文件utf8file：  open('utf8file','w+',encoding='utf-8').write(open('gbk_file','r',encoding='gbk').read())  #把utf8文件轉換成gbk文件，源文件utf8file，目標文件gbk_file：  open('gbk_file','w+',encoding='gbk').write(open('utf8file','r',encoding='utf-8').read())    #python2上的實現方式：  #gbk文件轉換成utf8文件，源文件newfile，目標文件utf8file：  pen('utf8file','w+').write(open('newfile','r').read().decode('gbk').encode('utf-8'))

Previous post

Python | 發包 2018 入坑

Next post

離職員工犯事被抓支付寶：創業不是開一家公司而是心裡想著客戶