Linux 文件操作接口

Linux 文件操作接口

在使用語言編寫服務的時候不乏會遇到需要對文件進行操作的場景,Linux內核是用C語言寫的,了解Linux之前先熟悉一下C語言文件操作接口,方便對比。

C語言文件操作接口

C語言文件描述

#ifndef _FILE_DEFINED
struct _iobuf {
    char *_ptr; //文件輸入的下一個位置
    int _cnt; //當前緩衝區的相對位置
    char *_base; //指基礎位置(即是文件的起始位置) 
    int _flag; //文件標誌
    int _file; //文件描述符id
    int _charbuf; //檢查緩衝區狀況,如果無緩衝區則不讀取
    int _bufsiz; //文件緩衝區大小
    char *_tmpfname; //臨時文件名
       };
typedef struct _iobuf FILE;
#define _FILE_DEFINED
#endif

C語言對文件操作需要的數據都存在這樣的數據結構里,C語言對文件操作時,用一個數據結構唯一標識一個文件流

fopen()

FILE* fopen(const char *path, const char *mode);

返回值為文件流結構體指針,當打開失敗時返回NULL指針。
對文件操作前需先打開文件,打開文件使用接口fopen()。

參數:
path: 文件路徑,可以是相對路徑也可以是絕對路徑(默認為進程打開時路徑)
mode: 打開方式

模式 含義 文件不存在時
r 只讀 報錯
w 只寫 創建文件
a 追加只寫 創建文件
rb 二進制只讀 報錯
wb 二進制只寫 創建文件
ab 二進制追加只寫 創建文件
r+ 讀寫 報錯
w+ 讀寫 創建文件
a+ 追加讀寫 創建文件
rb+ 二進制讀寫 報錯
wb+ 二進制讀寫 創建文件
ab+ 二進制追加讀寫 創建文件

以上打開模式凡帶‘b’操作的打開文件時都會清空文件。

r模式打開文件

image-20221020211618640)
文件不存在時打開失敗
image-20221020211643933
文件存在時打開成功

w模式打開文件

image-20221020211705345
自動創建需要打開的文件
image-20221020211943645
打開後會清空文件

a模式打開文件

image-20221020212350468

image-20221020212437360

image-20221020212614385

以a模式打開文件不存在時創建文件,存在時在文件末尾寫入內容。

其他模式類似

fclose()

C語言程序員要養成用完即釋放的好習慣盡量避免內存泄漏,fclose() 接口就是用來關閉文件流的。

int fclose(FILE *fp);

關閉接口參數簡單,只需將需要關閉的文件流指針傳入即可。

fwrite()

size_t fwrite(const void *ptr, size_t size, size_t number, FILE *stream);

參數:
ptr: 寫入文件的內容
size: 寫入單位數據大小(byte)
number: 寫入數據總數
stream: 文件流

image-20221020221422346

寫入操作傳參如圖

fread()

size_t fread(void *ptr, size_t size, size_t number, FILE *stream);

參數類似fwrite()
ptr 為要讀入文件內容的容器,必須提前開好空間,number 不得大於實際開好的空間

image-20221020223117974

image-20221020223223523

讀文件操作如圖

系統文件操作接口

文件描述符fd

文件描述符可以唯一標識該進程打開的流。

open()

int open(const char *pathname, int flags);
int open(const char *pathname, int flags, mode_t mode);

參數:
pathname: 文件路徑,默認為進程創建時的路徑
flags: 決定文件打開模式
mode: 創建文件時文件權限

理解標記位原理

計算機中所有數據都由比特位組成,一個整形有32個比特位,用一位作為標記,一個int類型可以攜帶32個標識,並且可以隨意組合。
如下操作,想完成什麼操作傳入對應的標記即可。

image-20221020225608466

image-20221020230120754

open()的常用標記

標記 含義
O_RDONLY 只讀
O_WRONLY 只寫
O_RDWR 讀寫
O_APPEND 追加
O_CREAT 創建文件
O_TRUNC 清空文件

image-20221020232112966

image-20221020232216981

將只讀標記和創建文件標記傳入open()接口,創建文件如圖。文件創建出來了,但可以看出它的權限是亂的,可見這個接口不足以像fopen() 一樣打開文件。

image-20221020232755988

image-20221020232840531

使用另一個接口創建出來權限正常的文件,但權限還不是如我們所設想的設置什麼權限碼就創建什麼權限文件。此問題與權限掩碼umask有關

image-20221020233338235

權限碼與umask取反再按位與最後得到的權限碼才是最終權限碼,若需只在該程序重設umask 只需使用接口umask:

mode_t umask(mode_t mask);

參數mask為想要重設的權限掩碼

image-20221020234520813

image-20221020234411827

現在所創建的文件權限就全如程序員所願了。

write()

系統寫文件操作接口

ssize_t write(int fd, const void *buf, size_t count);

操作與fwrite() 基本一致,參數buf 類型為void* ,count 為要寫入內容大小(byte)。
image-20221020235753477

image-20221020235905836

寫入成功,但如上打開方式還有一個隱患:

image-20221021000417536

image-20221021000342764

後寫入的內容並不會在空文件寫入,而是會在已有內容上進行覆蓋,這樣的操作可不像C語言的w操作,針對此問題可以再加一個標誌O_TRUNC

image-20221021000756908

image-20221021000851606

如此才可和C語言的fopen() 的 w 操作一致

read()

ssize_t read(int fd, void *buf, size_t count);

read()參數與write() 基本一致,與fread() 操作相差不多,需要buf 提前開好空間
image-20221021102426397

image-20221021102507530

當文件不存在時:

image-20221021102719368

如此,效果與fread() 一致

close()

使用完文件後需得關閉文件,盡量防止內存泄漏,使用close()接口

int close(int fd);

兩種操作接口聯繫

操作系統設計時為了安全任何高級語言操作文件都不能繞過操作系統,用戶對文件操作只能通過操作系統提供的接口,而Linux操作系統內核主要用C語言編寫,提供的接口也是用C語言編寫的,C語言用戶可以直接使用。C語言操作文件也需通過操作系統提供的接口,因此C語言的文件操作接口是對系統文件接口進行封裝後暴露出來的。
但既然已經有系統接口了為什麼還要C語言文件操作接口,此問題原因有幾個:

  1. 使用不方便(對比之前的fopen()open())
  2. C語言是跨平台語言,若使用系統文件操作接口,同一份代碼移植到其他平台將會編譯不通過,使用封裝後的接口,可以完美解決這個問題

高級語言都是用自己的語言特性封裝系統接口來操作文件

系統接口 語言接口
open(const char* path, O_WRONLY | O_CREAT | O_TRUNC) fopen(const char* path, “w”)
open(const char* path, O_RDONLY) fopen(const char* path, “r”)
open(const char* path, W_WRONLY | O_CREAT |O_APPEND) fopen(const char* path, “a”)
close(int fd) fclose(FILE* fStream)
write(fd, const void* buf, size_t count) fwrite(const void* ptr, size_t size, size_t number, FILE* fStream)
read(fd, void* buf, size_t count) fread(void* ptr, size_t size, size_t number, FILE* fStream)

C語言對封裝的接口跨平台解決辦法
條件編譯 + 窮舉